モンテカルロ探索に基づく政策グラデーション アルゴリズム。 矢印キーを使用して車を直接制御することができます。 "Load trained agent"をクリックしてモデルを読み込みます。 その後、"Play"をクリックして結果を確認します。 左側のウィンドウでは、自動運転車(赤色)が何を見ているか簡単に確認することができます。 メタカー環境で使用したアルゴリズムはここで実装されます。