몬테카를로 탐색을 기반으로 한 정책 그라데이션 알고리즘. 화살표 키를 사용하여 직접 자동차를 제어할 수 있습니다. "Load trained agent" 를 클릭하여 모델을 로드합니다. 그런 다음 "Play"를 클릭하여 결과를 확인합니다. 왼쪽 창에서 자율 주행 차량(빨간색)이 무엇을 보고 있는지 간략하게 확인할 수 있습니다. 메타카 환경에서 사용한 알고리즘은 여기에서 구현됩니다.