日 時: 平成26年11月6日(木) 17時〜19時 場 所: 情報科学研究科棟2階 大講義室 話 題: 画像認識の過去と未来:ディープラーニングがきっかけとなる人工知能への再挑戦 話題提供者: 岡谷 貴之 教授 (システム情報科学専攻 知能ロボティクス学講座 イメージ解析学分野) 概 要: 岡谷先生のお話は、画像認識の研究が第3の高揚期に入っているという紹介から始まりました。ディープラーニングとは人工のニューラルネットワークをコンピュータ上で行うもので、すでに音声認識では実用化が進み、画像認識では2012年に一般物体の認識に成功したことで大きな流れがつくられました。わずか2年間で誤答率が15%から7%弱までに進化するという驚くべき成果が出ています。この誤答率はもはや人間の脳に近くなったとさえいえるものだそうです。 岡谷先生は、第3期にある現在の到達点とそこで未解決となっている問題点を示されました。学習最適化の問題では、過学習や勾配消失問題と言われる現象を事前学習と呼ばれる方法によって克服しました。画像認識は、画像から特徴を抽出し、その特徴量を分類するという2つの処理に分解できます。研究開発は例えば、バーコード→手書き文字→顔→一般物体のように、簡単な認識からより難しいものの認識へと進化してきたのですが、一般物体の認識は難しい問題として残っていました。例えばさまざまな飛 行機の画像を、飛行機であると認識することが難しかったのです。これに対し最近、「たたみこみ」と「プーリング」という計算を繰り返すたたみこみニューラルネットワークが有効であることが分かりました。たたみこみで特徴抽出そのものを学習しプーリングで解像度を落とします。これを何度も繰り返す計算を行うのがディープたたみこみニューラルネットワークですが、これによってテレビはどの画像でもテレビと認識でき、テレビとラジオはすぐに区別できるという人間のレベルに近づいてきたというわ けです。 質疑応答では、現時点での到達点と課題についての議論が活発になされました。終了後も、人間の脳が反応速度はコンピュータよりもはるかに遅いにもかかわらず学習できているという原理が解明されると、今後の飛躍的な発展が期待できるということや、まだ質感の認識や動画認識など、コンピュータにできない問題がいくつも残されていることや、人間の脳とコンピュータとの違いやコンピュータがもつ可能性などに話が弾みました。