逆強化学習がMRFと同じという理解の誤りに気付く

ランニングできず 英語できず

 逆強化学習とGANが同じという論文を5月13日の論文読み会に発表するため資料をLatexで作成し始める。

https://arxiv.org/abs/1611.03852

しかし、非常に長い時間でもLatexの記述が進まないので、この資料で解説したかったエネルギーベースの逆強化学習の理論がMRFと同じという理解が殆ど間違いであったことに気付き、作成した資料が無駄になった。

https://arxiv.org/abs/1507.04888

貴重な1日と無駄にしたが、しっかりこの資料を作成していればと反省する。

横道にそれず該当の論文の解説のみの資料作成にかかる。

 夕方、強化学習の勉強会で関数ベースの簡単な方法について述べる。bellman方程式を動的計画やモンテカルロ法で地道に解く方法は大事なので、これらを疎かにする原因にならないかと心配になる。

 1日が終わって何の進展もない事にガッカリする。