Metacar

Metacar

ブラウザで自律走行車のための強化学習環境です。

  const env = new metacar.env("canvas", metacar.level.fullCity);
  env.load();

文書を読んで、メタカーを始める方法をご覧ください。

metacarで生成されたアルゴリズムの例をご覧ください。

不連続アクション

アルゴリズム: テーブルを使ったQ-Learning

この例では、メタカー環境を使用して、強化学習アルゴリズムの簡単な動作例を示すことを目的としています。デモをご覧ください。

交通状況における不連続アクション

アルゴリズム: モンテカルロ探索に基づく政策グラデーションアルゴリズム(強化)

ニューラルネットワークはtensorflow.jsを使用して構築されています。デモをご覧ください。

連続アクション

深層決定論的政策グラディエント(DDPG): 論文
探索のためのパラメータ空間ノイズ: 論文

制御は、車のスロットルとステアリング角度の2つの連続値に基づいています。モデルはtensorflow.jsを使用して作成されました。

交通状況における連続アクション

深層決定論的政策グラディエント(DDPG): 論文
探索のためのパラメータ空間ノイズ: 論文

制御は、車のスロットルとステアリング角度の2つの連続値に基づいています。モデルはtensorflow.jsを使用して作成されました。

自分だけのレベルを作ろう

メタカーではエディタを使用して独自のレベルを編集することができます。また、プロジェクトへの貢献も歓迎します。