스네이크 게임을 위한 Deep Q-Network
설명
이 페이지는 훈련된 DQN(Deep Q-Network)을 로드하고 이를 사용하여 스네이크 게임을 합니다. 훈련은 tfjs-node를 이용하여 Node.js로 진행되었습니다. train.js를 확인해주세요.
알고리즘
DQN은 현재 게임 상황에서 행동의 가치를 추정하도록 훈련됩니다. DQN은 2D convolutional network입니다. dqn.js를 확인해주세요. epsilon-greedy algorithm은 학습 중에 탐색과 착취의 균형을 맞추는 데 사용됩니다.