読者です 読者をやめる 読者になる 読者になる

Deep Reinforcement Learning with Double Q-learning (Double DQN)

Deep Reinforcement Learning with Double Q-learning [1509.06461] Deep Reinforcement Learning with Double Q-learning 論文まとめ Q-learningは、maxを取っている関係上、action-valueを過大評価(overestimate)する傾向があることが知られている.これま…

Deep Q Network (DQN)

http://www.nature.com/nature/journal/v518/n7540/full/nature14236.html [1312.5602] Playing Atari with Deep Reinforcement LearningQ-Learningにおいて、action-value functionをDNNで関数近似したもので、Deep RLの皮切りとなった. Q-Learningとはなん…

強化学習基礎(メモ書き)

強化学習基礎 MDP→TD→Q-Learning→DQN手前まで、強化学習の基本的なことをかいつまんだまとめ (自分用の自己満メモ)素晴らしい講義 David Silver氏による強化学習講義 これにほぼ対応した素晴らしい演習問題+α GitHub - dennybritz/reinforcement-learning:…