はむこの勉強記録

http://bit.ly/2ktf20t の写し

OpenAI Gym - CartPole-v0

chainerrlのサンプルを使って、Double-DQNでOpenAI Gym - CartPole-v0を学習させた。

まだできていないところ * OpenAIへのuploadが何故かできない(requestsのバージョンが低いと言われるが、それを上げてもダメだった) * そもそもソース理解していない

つまった所 * ChainerRLのdocumentが古かった(chainerのコードを読みに行ったら、target_update_intervalがtarget_update_frequencyにひっそりと変わっていた。公式docが未更新でgitへのリンクが切れてる…)

動画 https://github.com/hamko/sample/blob/master/chainerrl/cartpole-v0/openaigym.video.0.32518.video000001.mp4?raw=true ソース github.com