DeepLearingの写真キャプション生成の精度に驚く
ランニング30分 英語15分
写真からその内容を表示するDeepLearningのCapiton生成モデルをまる1日実行する。
得られた結果は、実に精度よく写真を読み解き言葉で表している。
但し、2番目の写真ではハードルをベンチに、4番目の海岸で寝そべる人はサーフィンと勘違いしているが、この誤りがリアリティを与えている。DeepLearginの画像認識性能は実に凄いものと認識する。
画像認識で残る課題は強化学習のみになった。イーロンマスクのOpenAIのツールの内容が聞けたので、近日中に可能になると思う。DeepLearning系でキャッチアップが遅れていたが、序々に取り戻せそうである。