Metacar

Metacar

브라우저에서 자율주행 자동차를 위한 강화학습 환경입니다.

  const env = new metacar.env("canvas", metacar.level.fullCity);
  env.load();

문서를 읽고 메타카를 시작하는 방법을 알아보세요.

metacar로 생성된 알고리즘의 예시를 확인하세요.

불연속 액션

알고리즘: 테이블을 이용한 Q-러닝

이 예제에서는 메타카 환경을 사용하여 강화 학습 알고리즘의 간단한 작동 예시를 보여드리는 것이 목표입니다. 데모를 확인하세요.

교통 상황에서의 불연속 액션

알고리즘: 몬테카를로 탐색을 기반으로 하는 정책 그라데이션 알고리즘(강화)

신경망은 tensorflow.js를 사용하여 구축됩니다. 데모를 확인하세요.

연속 액션

심층 결정론적 정책 그라디언트(DDPG): 논문
탐색을 위한 파라미터 공간 노이즈: 논문

제어는 자동차의 스로틀과 스티어링 각도에 대한 두 가지 연속 값을 기반으로 합니다. 모델은 tensorflow.js를 사용하여 만들어졌습니다.

교통 상황에서의 연속 액션

심층 결정론적 정책 그라디언트(DDPG): 논문
탐색을 위한 파라미터 공간 노이즈: 논문

제어는 자동차의 스로틀과 스티어링 각도에 대한 두 가지 연속 값을 기반으로 합니다. 모델은 tensorflow.js를 사용하여 만들어졌습니다.

나만의 레벨을 만드세요!

메타카에서는 에디터를 사용하여 자신만의 레벨을 편집할 수 있습니다. 또한 프로젝트에 기여하는 것도 환영합니다.