DeepLearingの写真キャプション生成の精度に驚く

ランニング30分 英語15分

 写真からその内容を表示するDeepLearningのCapiton生成モデルをまる1日実行する。

github.com

得られた結果は、実に精度よく写真を読み解き言葉で表している。

f:id:mabonki0725:20170419171933j:plain

但し、2番目の写真ではハードルをベンチに、4番目の海岸で寝そべる人はサーフィンと勘違いしているが、この誤りがリアリティを与えている。DeepLearginの画像認識性能は実に凄いものと認識する。

 画像認識で残る課題は強化学習のみになった。イーロンマスクのOpenAIのツールの内容が聞けたので、近日中に可能になると思う。DeepLearning系でキャッチアップが遅れていたが、序々に取り戻せそうである。