ボットの拡大
今、世の中で「ボット」が注目を浴びています。ボットとは「ロボット」を語源としていて、特定の作業を自動的に実行するプログラムのことです。昔からあり、ウェブサイトを収集するクローラーや、パソコンに侵入して遠隔で操作するマルウエア、ゲーム上で自動的にアイテムを収集するプログラムなどもボットです。現在、特に注目されているのは「chatbot(チャットボット)」と呼ばれるもので、Siriや自動的にツイートするTwitterbotが挙げられます。その他にも、天気予報を教えてくれるものや、フライトの予約をしてくれるもの、ユーザーの興味のある記事を要約して提示してくれるものなど、さまざまなサービスが存在します。
なぜ今になってボットが注目されているのでしょうか。一つは、人工知能の進化によって、ボットで実行できることが高度化したという技術的な要因が挙げられます。特に、ボットが自律的に学習できるようになってきたため、利用が増えるにつれ進化を遂げられることが、注目の要因と言えるでしょう。また、スマートフォンやタブレットの普及により、チャットやメッセンジャー、パーソナルアシスタントといった対話を行うツールが日常に当たり前のように浸透してきたため、人間の言語での処理を可能とする「チャットボット」が世の中で受け入れられるようになってきたという環境面の要因も大きいでしょう。Facebook、Microsoft、LINEといった大企業が続々とチャットボットを開発するためのプラットフォームを発表したことも大きなインパクトを与えました。こうしたプラットフォームを利用すれば、開発者はどのようなメッセージのときにどんな反応をするかといったアプリケーションの核部分の開発に注力でき、比較的に容易にボットの開発ができます。下記の画像は、これらのプラットフォームを利用して、当社社員が独自に作成したLINEのボットの返答サンプルです。犬の画像を送ると、犬種を答えてくれたり、テキストメッセージを送ると内容によって天気を答えたり、雑談してくれるものです。サンプルの画像では、筆者の実家の犬を見事に柴犬と答えてくれています。また、プログラミングなしでチャットボットを開発可能なサービス参考1、参考2も出始めており、今後開発者以外にも広がっていく可能性があります。
図:当社社員が独自に作成したLINEのボット
チャットボットがもたらすもの
では、チャットボットによって何が変わるのでしょうか。人々のコンピューターとの関わり方が変わると考えられます。これまでは、実行したい内容ごとに専用のアプリを起動し、そのアプリ毎に決められた操作を行う必要がありました。一方、チャットボットでは、普段利用している言葉で実施したいことを伝えるだけとなり、コンピューターを意識せず自然に利用できるようになります。返答してくれるだけでなく、ユーザーの興味や状況に応じて、チャットボットからメッセージで教えてくれることも可能となります。チャットボットがコンピューターのインターフェースになることで、人とコンピューターは、よりシームレスで自然な関係に変わっていくでしょう。また、単に操作が容易になるだけでなく、会話を通じて、より高度なユーザー体験を提供できる可能性があります。例えば、レストランの予約や、おすすめのレストラン・料理の提示をしてくれるサービス参考3や、ボットと会話をしながらユーザー好みのインテリアデザインを構築していくサービス参考4も登場しており、途中の会話の中で、自分の知らなかった好みに気づくかもしれません。
今後は、対話型のインターフェースを持つ一つのボットを通じて、すべての処理が実行されるようになるかもしれません。つまり、それは現在でいえばOSの役割を果たすようになり、スマートフォン、タブレット、PCにおいて重要なプラットフォームとなり得ます。大手企業がチャットボットのプラットフォームに力を入れている理由もここにあるのかもしれません。覇権を握るのは誰なのか、目が離せません。
ボットの課題
さまざまなタスクを一つのボットが対話的に行うようになると、今度は大量のメッセージが溢れて人間が処理しきれなくなる可能性があります。それに対しては、各ユーザーに業務上関連のあるメッセージだけをフィルタリングしたり、要約したりしてくれるPersonal Workbot参考5も登場してきています。このように、問題を解決するために別のボットを使う方法もありますが、本質的な解決、つまり自然な会話で思い通りの結果をストレスなく得られる状態になるまでには、まだ乗り越えるべき壁がたくさんあります。例えば、メッセージを送るだけでピザが注文できるbotでは、特定のお気に入りのピザを注文する場合は良いですが、ピザをハーフ&ハーフで組み合わせたり、トッピングしたりとカスタマイズ内容をすべてテキストで伝えるには限界があるでしょう。シーンに応じて、対話とGUIの組み合わせが必要になるケースへの対応も必要になると思われます。大量の対話ログデータさえあればディープラーニングで解決できるという単純な話ではなく、文法や意味を扱うための基礎研究の発展も欠かせません。