OpenAI Gym - CartPole-v0
chainerrlのサンプルを使って、Double-DQNでOpenAI Gym - CartPole-v0を学習させた。
まだできていないところ * OpenAIへのuploadが何故かできない(requestsのバージョンが低いと言われるが、それを上げてもダメだった) * そもそもソース理解していない
つまった所 * ChainerRLのdocumentが古かった(chainerのコードを読みに行ったら、target_update_intervalがtarget_update_frequencyにひっそりと変わっていた。公式docが未更新でgitへのリンクが切れてる…)
動画 https://github.com/hamko/sample/blob/master/chainerrl/cartpole-v0/openaigym.video.0.32518.video000001.mp4?raw=true ソース github.com