2020-01-01から1年間の記事一覧

Deep RL Bootcampで強化学習の勉強 Vol. 1

2017年に UC Berkeleyで開催されたDeep RL Bootcampの動画を見たのでそれをまとめていこうと思う． sites.google.com 強化学習とは MDPと呼ばれる問題設定において，方策と呼ばれる行動指針を学習するアルゴリズム．ある環境内におけるエージェントが、現在…