DeepLearning/FPGAなどを勉強する人

興味のあることを書く

2017-03-13から1日間の記事一覧

Deep Reinforcement Learning with Double Q-learning (Double DQN)

Deep Reinforcement Learning with Double Q-learning [1509.06461] Deep Reinforcement Learning with Double Q-learning 論文まとめ Q-learningは、maxを取っている関係上、action-valueを過大評価(overestimate)する傾向があることが知られている.これま…