mabonki0725の日記

DeepLearingの写真キャプション生成の精度に驚く

AI論文自然言語解析

ランニング30分　英語15分

　写真からその内容を表示するDeepLearningのCapiton生成モデルをまる１日実行する。

得られた結果は、実に精度よく写真を読み解き言葉で表している。

f:id:mabonki0725:20170419171933j:plain

但し、２番目の写真ではハードルをベンチに、４番目の海岸で寝そべる人はサーフィンと勘違いしているが、この誤りがリアリティを与えている。DeepLearginの画像認識性能は実に凄いものと認識する。

　画像認識で残る課題は強化学習のみになった。イーロンマスクのOpenAIのツールの内容が聞けたので、近日中に可能になると思う。DeepLearning系でキャッチアップが遅れていたが、序々に取り戻せそうである。