Metacar
ブラウザで自律走行車のための強化学習環境です。
const env = new metacar.env("canvas", metacar.level.fullCity);
env.load();
文書を読んで、メタカーを始める方法をご覧ください。
metacarで生成されたアルゴリズムの例をご覧ください。
アルゴリズム: テーブルを使ったQ-Learning
この例では、メタカー環境を使用して、強化学習アルゴリズムの簡単な動作例を示すことを目的としています。デモをご覧ください。
アルゴリズム: モンテカルロ探索に基づく政策グラデーションアルゴリズム(強化)
ニューラルネットワークはtensorflow.jsを使用して構築されています。デモをご覧ください。
- 深層決定論的政策グラディエント(DDPG): 論文
- 探索のためのパラメータ空間ノイズ: 論文
制御は、車のスロットルとステアリング角度の2つの連続値に基づいています。モデルはtensorflow.jsを使用して作成されました。
- 深層決定論的政策グラディエント(DDPG): 論文
- 探索のためのパラメータ空間ノイズ: 論文
制御は、車のスロットルとステアリング角度の2つの連続値に基づいています。モデルはtensorflow.jsを使用して作成されました。
メタカーではエディタを使用して独自のレベルを編集することができます。 また、プロジェクトへの貢献も歓迎します。