chainerrlのサンプルを使って、Double-DQNでOpenAI Gym - CartPole-v0を学習させた。

まだできていないところ * OpenAIへのuploadが何故かできない（requestsのバージョンが低いと言われるが、それを上げてもダメだった） * そもそもソース理解していない

つまった所 * ChainerRLのdocumentが古かった（chainerのコードを読みに行ったら、target_update_intervalがtarget_update_frequencyにひっそりと変わっていた。公式docが未更新でgitへのリンクが切れてる…）

何のためにPRMLやってるのかわからなくなったので原因解析

PRMLの実装 Google 検索

読む場所を限定すべき、グラフィカルモデル大事（確率変数の依存関係の可視化） http://d.hatena.ne.jp/n_shuyo/20121004/prml

実装できるモデルの全列挙 PRMLの実装のすすめ

よく使うやつ、使わないやつの整理 http://ibisforest.org/index.php?PRML%2Fcourse

後半実装

勉強会まとめ(京都大学のやつが良さそう)

スライドと演習解答まとめ

はむこの勉強記録