読者です 読者をやめる 読者になる 読者になる

自分用

Top

このブログはなんですか Talk of tech innovation is bullsh*t. Shut up and get the work done – says Linus Torvalds Deep Leaning 勉強用ブログ - DeepLearning勉強マン 何を実装しましたか Generative DCGAN WGAN Reinforcement Learning DQN Double DQN…

Prioritized Experience Replay

[1511.05952] Prioritized Experience Replay 論文まとめ Online RLの問題点 遷移(transition)間の依存関係の影響が大きい レアな遷移をすぐに捨ててしまう そこで、 Experience Replay(ER) DQNでは、replay mem.からランダムサンプリングしたミニバッチを使…

Deep Reinforcement Learning with Double Q-learning (Double DQN)

Deep Reinforcement Learning with Double Q-learning [1509.06461] Deep Reinforcement Learning with Double Q-learning 論文まとめ Q-learningは、maxを取っている関係上、action-valueを過大評価(overestimate)する傾向があることが知られている.これま…

強化学習基礎(メモ書き)

強化学習基礎 MDP→TD→Q-Learning→DQN手前まで、強化学習の基本的なことをかいつまんだまとめ (自分用の自己満メモ)素晴らしい講義 David Silver氏による強化学習講義 これにほぼ対応した素晴らしい演習問題+α GitHub - dennybritz/reinforcement-learning:…

Wasserstein GAN (WGAN)

Wasserstein GAN (WGAN) [1701.07875] Wasserstein GAN ([1701.04862] Towards Principled Methods for Training Generative Adversarial Networks WGANの話の前にこの話がある) Martin Arjovsky氏の実装(Torch) GitHub - martinarjovsky/WassersteinGANWGAN…

Deep Convolutional Generative Adversarial Networks (DCGAN)

Deep Convolutional Generative Adversarial Networks [1511.06434] Unsupervised Representation Learning with Deep Convolutional Generative Adversarial NetworksDCGANをTensorflowで実装 データはMNIST ちなみにTensorflowの経験はそんなにない(ので…

Deep Leaning 勉強用ブログ

このブログについて ザコい学生のブログ これから自分の勉強としてDeep Leaning関連の論文等を実装していき、その過程をブログとして残しておきたい. (モチベーションのためにも) Linuxカーネルの開発者であるLinux Benedict Torvalds氏も以下のように述べて…