スネークゲームのためのDeep Q-Network
説明
このページでは、訓練されたDQN(Deep Q-Network)を読み込み、それを使ってスネークゲームをします。 トレーニングはtfjs-nodeを使ってNode.jsで行いました。 train.jsを確認してください。
アルゴリズム
DQNは、現在のゲーム状況における行動の価値を推定するように訓練されます。 DQNは2次元畳み込みネットワークです。dqn.jsを確認ください。 epsilon-greedy algorithmは、学習中に探索と搾取のバランスをとるために使用されます。