絞り込み検索
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トレンドで探す
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トレンドで探す
2019.6.17技術ブログ

技術トレンド「ナチュラルインタラクション」
NTT DATA Technology Foresight 2019シリーズ~Vol.8

情報社会を取り巻く大きな潮流とITのトレンドを示す「NTT DATA Technology Foresight 2019(※1)」を全12回で紹介。第8回は技術トレンド「ナチュラルインタラクション」

日常に広がる機械との会話

コンピュータと話す、そんな光景が広がりつつあるあります。スマートフォンをはじめ、家電に音声アシスタントが搭載され、スマートスピーカーの販売台数も急速に伸びています。音声アシスタントは様々な機能を提供していますが、スマートスピーカーにおける実際の利用用途は約6割が音楽再生という調査もあり、家電操作や買い物等の他の目的による利用は決して多くありません(※2)
機械との会話が浸透するためには、連続した会話の中で相手の意図を正しく理解し、場合によっては言葉以外で相手の五感に訴えかける。このような人との自然なインタラクションが機械にも求められているのでしょう。

記憶による会話能力の向上

自然な会話の実現に向けて、直前の会話内容を記憶し、省略された主語や目的語を補完して、会話の終わりを認識することで、音声アシスタントに会話の連続性をもたせ、ウェイクアップワード(※3)の省略ができるようになってきています。Googleが公開した、Google Duplexは電話を使ってお店の予約をするという限定的なシーンですが、人と遜色ない連続的な会話を実現し、機械の会話力に大きな期待を集めるきっかけとなっています。
長期的な記憶についても、会話した文章から天気を聞いた場所や購入した商品といった単語を自動で抽出し、長期的に記憶することができるようになっています。このような記憶の活用によって機械が毎回同じことを聞いてくることがなくなり、人と機械の意思疎通はより自然なものになるでしょう。

求められる文脈の理解

質問の内容を正しく理解し、返答を組み立てる会話制御も重要です。AIによる自然言語処理は盛んに研究が行われています。しかし、複数の意味を持つ単語の存在や、学習データの不足等、様々な問題が存在するため、他の分野に比べて遅れをとっています。
これらの問題を解決する新たな技術として、文脈を考慮した上で高精度に単語の意味を判断し、文章を正しく理解することができる技術が開発されているのです。この技術とモデルを活用することで、SQuAD(Stanford Question Answering Dataset)をはじめとした自然言語処理における代表的な11のタスクにおいて、従来の最先端の手法を上回る精度を実現しています。AIの進展は、人の気まぐれな会話にも正確かつ柔軟に機械が対応する糸口として期待されています。

非言語情報の把握と活用

最近の研究では、センシングした人の表情から相手の気分を類推した上で返答するチャットボットの開発が進んでいます。メールやSNSで利用される多様な顔文字や絵文字の存在が会話における感情の重要性を物語っているように、機械が相手の表情を読み取り、機械からも表情を示すことで、人は機械の話す内容をより理解しやすくなるでしょう。
他にも、声色から感情を類推し、画像から「可愛い」といった感情をコメントする等、非言語情報の活用は多方面で進展しています。自然な会話能力を獲得し、相手の状況や感情を把握できるようになった機械は、人々が行う会話の多くの場面に浸透し、会話を用いて人を支援する存在となるでしょう。
古より人類は会話という行為を通じて、文明を築き、社会を発展させてきました。今後も、会話によって人々は分かち合い、協力し、進むべき道を解き明かしていくことは続いてきます。その時、機械は、人が営む会話をより円滑に、そして創造的なものへと変化させていくのではないでしょうか。
※1 「NTT DATA Technology Foresight」特設サイト

http://www.nttdata.com/jp/ja/insights/foresight/sp/index.html

※2 スマートスピーカーにおける実際の利用用途は約6割が音楽再生という調査

The Future of Retail 2018 - Walker Sands Communications

※3 ウェイクアップワード

音声アシスタントと会話を開始する合図となる特定のキーワードのこと

お問い合わせ