DeepLearning/FPGAなどを勉強する人

興味のあることを書く

2017-03-31から1日間の記事一覧

Prioritized Experience Replay

[1511.05952] Prioritized Experience Replay 論文まとめ Online RLの問題点 遷移(transition)間の依存関係の影響が大きい レアな遷移をすぐに捨ててしまう そこで、 Experience Replay(ER) DQNでは、replay mem.からランダムサンプリングしたミニバッチを使…