Metacar
브라우저에서 자율주행 자동차를 위한 강화학습 환경입니다.
const env = new metacar.env("canvas", metacar.level.fullCity);
env.load();
문서를 읽고 메타카를 시작하는 방법을 알아보세요.
metacar로 생성된 알고리즘의 예시를 확인하세요.
알고리즘: 테이블을 이용한 Q-러닝
이 예제에서는 메타카 환경을 사용하여 강화 학습 알고리즘의 간단한 작동 예시를 보여드리는 것이 목표입니다. 데모를 확인하세요.
알고리즘: 몬테카를로 탐색을 기반으로 하는 정책 그라데이션 알고리즘(강화)
신경망은 tensorflow.js를 사용하여 구축됩니다. 데모를 확인하세요.
- 심층 결정론적 정책 그라디언트(DDPG): 논문
- 탐색을 위한 파라미터 공간 노이즈: 논문
제어는 자동차의 스로틀과 스티어링 각도에 대한 두 가지 연속 값을 기반으로 합니다. 모델은 tensorflow.js를 사용하여 만들어졌습니다.
- 심층 결정론적 정책 그라디언트(DDPG): 논문
- 탐색을 위한 파라미터 공간 노이즈: 논문
제어는 자동차의 스로틀과 스티어링 각도에 대한 두 가지 연속 값을 기반으로 합니다. 모델은 tensorflow.js를 사용하여 만들어졌습니다.
메타카에서는 에디터를 사용하여 자신만의 레벨을 편집할 수 있습니다. 또한 프로젝트에 기여하는 것도 환영합니다.