TensorFlow.js強化学習: Snake DQN

スネークゲームのためのDeep Q-Network

説明

このページでは、訓練されたDQN(Deep Q-Network)を読み込み、それを使ってスネークゲームをします。 トレーニングはtfjs-nodeを使ってNode.jsで行いました。 train.jsを確認してください。

アルゴリズム

DQNは、現在のゲーム状況における行動の価値を推定するように訓練されます。 DQNは2次元畳み込みネットワークです。dqn.jsを確認ください。 epsilon-greedy algorithmは、学習中に探索と搾取のバランスをとるために使用されます。

Q値の表示
ゲームが開始されました。