東北大学
GSIS

Q&A

講演のテーマ・内容に関するQ&A

各講演に関してお寄せいただいた質問に講演者が回答しております。
上の顔写真をクリックして切り替えてください。

伊藤 彰則 教授
Q.人との対話は「表情」が重要で、理解度の約7~8割を占めていると言われています。コミュニケーションする時、人間は相手のことを考えます。その時重要になるのが「間」です。この2つの相関度を高めてほしいと希望していますが、いかがでしょうか?

「表情」や「間」はコミュニケーションに重要で、メタコミュニケーションの一種であるとも言えます。これらは意図的に変えることもありますが、答える人間の心理的な状態によって変わることがあり、聞く人間はそこから答える人間の心理状態を推定しています。機械にその真似をさせるのは簡単ではありませんが、対話システムの高度化のためには必要だと考えています。

Q.表情と視線から人が考えているかどうかを推定する論文について詳しく教えてください。

次の論文です。
Y. Chiba, T. Nose and A. Ito, Cluster-based approach to discriminate the user’s state whether a user is embarrassed or thinking to an answer to a prompt, Journal on Multimodal User Interfaces, 11(2): 185-196. 2017.

Q.講演では人間と機械のメタコミュニケーションが多くありましたが、そもそも人間と人間との間のメタコミュニケーションについては何を元にメタ認知しているのか、どのような思考を経て発言しているのかなど、どこまで分かっているのでしょうか?

メタコミュニケーションは新しい概念ではなく、また人間に限定されません(動物も含む)。例えば下記の論文は哺乳類のメタコミュニケーションを扱っています。 Bekoff, M. (1972). The development of social interaction, play, and metacommunication in mammals: an ethological perspective. The Quarterly Review of Biology, 47(4), 412-434.

人間間のメタコミュニケーションは、多くの場合発達心理学的な観点から研究されています。子供が成長するに従って「相手の気持ちを推し量る」「相手の立場で考える」能力がどう発達するかという観点です。

Q.AI(ロボットを含む)はどういう能力を持った時シンギュラリティを超えたという判断になるのでしょうか?

シンギュラリティにはいろいろな考え方があります。一般には「これから起きるであろう歴史的な出来事」についている名前なので、ある特定のロボットが「シンギュラリティを超える」という言い方はしないと思います。ちなみに、シンギュラリティ後の世界では、ロボットは人間を遥かに超える知能を持ち、それ自体が今よりもはるかに早いスピードで新しい技術を開発していくとされるようです。

Q.エージェントを通じた「モノ」との対話についてお聞きします。エージェントの年齢、性別、人型か否かで違いはありますか?

違いはあると思いますが、詳しく調べられていません。その理由は、見た目や年齢などの属性を系統的に変えて比較することが難しいためです。例えば、男性と女性のエージェントを比較しようと思っても、一般的な「男性」「女性」というものがあるわけではないので、性別による効果と「その見た目である効果」をうまく分けることが難しいためです。

Q.今後いつぐらいにロボットは空気を読んでくれるようになると思いますか?

ある特定の「空気の読み方」に焦点を当てれば、技術的にそれほど困難ではないと思います。ですが、「空気を読める」ということに期待される能力が「あらゆる場面で人間の相手をすることができ、その上で状況に応じて対話相手の人間に配慮する」とすると、まずいろいろな環境で人間の相手をするロボットを作る必要があり、それは当分難しいと思われます。

Q.メタコミュニケーションとの関連で思ったことがあります。例えば、われわれ人間は普段の会話で直接的(明示的)に伝えなくても聞き手に発話の背後にある「含意」を伝え、聞き手はそれを慣習的に認識して対話することがよくあります。
例)A: この部屋、暑いね!
B: 窓開けようか?(エアコン付けようか?)
Bの回答はAの含意を認知したレスポンスです。直接には、Aに対し、「うん、暑いね!/暑いと思わない」が来てもよいと思います。ロボットに対してもこのような発話を投げかけた際、どのような返答をすべきか、さらにはどのような動作をすべきかを判断することができると、さらに人間らしく、円滑で自然な対話をすることができると思いますが、可能でしょうか?先生がおっしゃる「環境や状況」まで考えてプログラミングしていくべきとのご意見に賛同いたしました。

ご意見ありがとうございます。示していただいた例のように、「暑いね」が「室温を下げて欲しい」ということを意味しているということの理解は「意図理解」と呼ばれます。意図の理解は一般には難しいです(人間でもできない人は少なくありません)。それは、意図が状況に強く依存していることに由来します(逆に言えば、状況を狭く限ると意図の理解は比較的容易です)。