機械学習は世の中をどのように変えるのか
機械学習が社会に根づくための条件とは?
(右)早稲田大学 理工学術院 松本隆(まつもと・たかし)名誉教授 1966年、早稲田大学理工学部電気工学科を卒業し、ハーバード大学大学院へ進学。1970年に応用数学修士(ハーバード大学)、1973年に工学博士(早稲田大学)。1977~79年にカリフォルニア大学バークレー工学部電気工学・計算機科学研究員。早稲田大学理工学部の助教授・教授を歴任。IEEE Life Fellow、Proceedings of IEEE編集委員、国際署名認証コンテストSVC2004審査委員、各種学会の委員会委員・委員長なども務める。1999年には早稲田大学の研究室で開発した電子サイン照合技術を特許申請するとともに、クールデザイン社を設立。現在は同社副社長として、同社の研究開発を統括している。
(左)NTTデータ数理システム 取締役 中川慶一郎(なかがわ・けいいちろう) 1992年、早稲田大学大学院理工研究科修士課程修了後にNTTデータに入社。2000年、早稲田大学大学院理工研究科機械工学専攻博士課程満期退学(工学博士)。NTTデータではオペレーションズ・リサーチ、応用統計を専門とする研究に従事したのち、ビジネスデータ・アナリティクスのコンサルティングから技術開発まで幅広く担当。ビジネスインテリジェンス推進センタ センタ長などを歴任し、2013年より現職。途中、大阪大学経済学部非常勤講師、早稲田大学大学院創造理工学部非常勤講師、明治大学商学部特別招聘教授を兼職する。また、日本オペレーションズ・リサーチ学会(副会長)や日本経営工学会などの学会でも積極的に活動している。
───いま世の中では「機械学習」が注目されています。すでに画像処理や言語処理などで目覚ましい成果をもたらすようになり、さまざまなビジネス分野への適用も始まりました。そんな機械学習は、私たちの社会をどのように変えつつあるのでしょうか。
松本 人間が機械に何かをやらせようという試みは、はるか昔から行われてきましたが、機械に学習をさせることはまだ始まったばかりでしょう。
いまのところ機械学習に「これだ」という明確な定義はなく、学問領域としての人工知能、統計学、コンピュータサイエンス、画像・音声認識など、いろいろな領域が機械学習は自分たちの領域の一部だと考えているように見受けます。これら複数の領域の共通部分であるがゆえに、大きな流れになっているのではないかと思います。
しかし、それぞれの領域における共通項を括り出していくと、機械学習とは「与えられたデータから未知の構造を学び取る」ということに集約できると思います。そこから「予測」「認識」「検知」「判別」「制御」といった機械学習の適用分野が見えてきます。すでに応用が進んでいる具体例としては、サーチエンジン、スパムメールや不正アクセスなどの検知、画像・音声・文字の認識、機械翻訳、バイオインフォマティクス(生命情報科学)、自動運転や「AlphaGo」(アルファ碁)などの製品としての人工知能が挙げられます。
徐々に適用が広がる機械学習ですが、今後、私たちの社会に根づいていくには3つの条件が必要と考えています。1つ目は、当然ですが新しいアイディア。2つ目はテクノロジーに対する社会からの要請。そして3つ目がテクノロジーの有用性への理解、つまり新しいアイディアに基づくテクノロジーを見たとき、これは使えると気づくことです。
例えば1776年に英国のエンジニア、ジェームス・ワットが改良型蒸気機関を発明しました。ワット以前にも蒸気機関の改良案はヨーロッパ各地で生まれていましたが、ワットのアイディアは画期的効率を備えており、当時の英国が必要としていた高効率動力源になりうるものでした。その頃の主たる動力源は人力、馬力、風力、水力で、既存の蒸気機関の効率はかなり低いものだったからです。
ワットのアイディアの有用性を直ちに理解したのが、英国の実業家、マシュー・ボールトンです。ボールトンの資金協力と経営協力によって、ワットの改良型蒸気機関は、のちに「産業革命」と呼ばれるようになる時代に大きく寄与しました。
これと同じく機械学習も、3つの条件が揃うことで発展していくと考えられます。
ただし、テクノロジーの文化依存性にも注意すべきです。例えばロシアのエンジニアであるプルサーノフは、ワットよりも前に改良型蒸気機関のアイディアを出していましたが、当時のロシアではまだ奴隷に排水作業などをさせており、日の目を見ませんでした。
中川 松本先生が例示した産業革命における蒸気機関は、いわば「要素技術」であり、その研究はいろいろなところで行われました。その後、織機や蒸気船、蒸気機関車などの製品が登場し、ボールトンのような実業家が成功を収めることになりました。
一方、20世紀のIT革命は、通信プロトコルといったネットワークの要素技術の研究によってコンピュータの接続が可能になったところから始まり、その表現形としてインターネットが登場しました。しかし成功を手にしたのは、従来からの通信ネットワーク事業者ではなく、GoogleやAmazon、Facebookのようにその後に出現したコンテンツ事業者でした。
機械学習もそうした要素技術であり、その研究開発は過去から脈々と地道に行われ、最近になって花開いたものです。その表現形として、現在は人工知能を活用した自動運転などが注目され始めていますが、“時代の覇者”はまだ見通しが立ちません。
松本 機械学習が多くの可能性を秘めていることは確かですが、機械学習で社会からの要請に応えようとする際、少なくとも2017年の現在、2つの重要課題があります。1つは、膨大な機械学習アルゴリズム群の中から、どのようなアルゴリズムが相応しいかを見つけることで、これには相当の経験とセンスが必要です。
2つ目は、相応しいアルゴリズムが選べたとして、適切な特徴量をデータから抽出することです。画像認識など特定の問題については特徴量自動抽出も試みられてはいますが、任意の問題の生データに対して可能な方法はまだなく、これもかなりの経験とセンスを備えた人間がやらなければ期待する結果は得られません。
急がば回れなので、このような人財をしっかり育成していくべきでしょう。また異なる仕事歴を持つ人々の出会いの場を作るのがよいと思います。同じような背景を持つ人々で斬新な企画を立ち上げるのはなかなか難しいです。さきほどのワットとボールトンの出会いは分野横断型のユニークな会「Lunar Society of Birmingham(※1)」で起きました。
図1:第四次産業革命はだれが時代の覇者になるのか?
英国バーミンガムで設立された交流団体。マシュー・ボールトンやエラズマス・ダーウィンを代表とする科学者、神学者、発明家、医師、作家、企業家などの知識階級が集まり、新しい科学的知見や認識についてインフォーマルな情報交換を行っていた。1765年に設立され、約50年にわたって活動が続けられた。
電子サイン照合で変わるセキュリティー
機械学習で銀行取引業務の根幹に迫る
───さまざまな領域に適用されつつある機械学習ですが、特に本腰を入れて取り組んでいるのが金融業界におけるFinTech分野です。その応用例として、NTTデータは金融機関が本人照合に利用する電子サイン照合エンジン「SignID」を製品化しました。そのSignIDには、クールデザイン社が開発した「CoolSign(※1)」がベース技術として採用されています。
なぜSignIDのベース技術としてCoolSignを採用するに至ったのでしょうか。また、CoolSignはどのような経緯で生み出されたのでしょうか。
中川 金融業界ではいま、FinTechブームが巻き起こっています。しかし、銀行業務という面で見ると、既存の法や規制の壁もあり、FinTechの活用は周辺サービスに留まっているという指摘があることも事実です。電子サインの照合技術であるSignIDは、“印鑑による本人確認”という、いわば取引業務の根幹をなす領域にFinTechで切り込んだ事例と言えます。
銀行取引では本人確認と同時に取引意思確認が前提となります。ところが指紋や指静脈といったバイオメトリクス技術では、取引意思確認という点での法的な解釈に曖昧なところがあります。そうしたなか、法的にも明確な取引意思となる「サイン」に着目したのが、SignIDの始まりです。問題は他のバイオメトリクス技術と遜色のない精度が得られるかでした。
そこでSignIDの開発にあたり、NTTデータではすでに学術分野で長年の実績がある電子サイン照合技術をベースとすることにしました。その技術が、松本先生が早稲田大学在任中に起業したクールデザイン社のCoolSignです。
松本 私はもともと早稲田大学理工学部で電気工学、特に信号処理や機械学習に関する研究・教育に携わってきました。そうした研究課題として、時系列予測や文字認識、さらにバイオメトリックスなどのアルゴリズムを構築して取り組んできました。
CoolSignの基となる署名照合技術の研究は、1990年代の中盤にタッチパッドとスタイラスペンを採用したデバイスが登場したことをきっかけに開始しました。その研究成果を1999年に学術論文として発表するとともに特許を出願。さらに大学のキャンパスで生まれたアイディアを社会に向けて発信するために、ベンチャー企業としてクールデザイン社を立ち上げました。
CoolSignは主に、電子サインによるビルの入退室管理に広く使われてきた実績があります。今回、NTTデータからの提案を受け、金融機関に適用するSignIDの開発を支援することにしました。
中川 我々はこの技術を金融業界に通用するレベルに高めるため、透明性と客観性を担保する検証計画を立てると同時に、機械学習による照合アルゴリズムの補強を図りました。また延べ1300名から約6万5千のデータを収集し、アルゴリズムのチューニングや精度検証を進めました。
電子サインの精度評価では、登録時の「登録失敗率」、照合時の「本人拒否率」と「他人受入率」の3軸で評価します。SignIDでは登録失敗率、本人拒否率を一定水準に抑えながら、他人受入率をゼロに近づけるためのチューニングを行いました。
同時に「数ヶ月では変わらない隠れた恒常性の抽出」、「数年レベルで起こる経時変化への対応」、「サイン固有のなりすましによる訓練偽筆の排除」という課題もクリアしなければなりません。そのために、我々は機械学習によって真筆・偽筆の峻別性能が高い特徴量(サインの特性を数値化した指標)を見つけ出しました。ここでは筆跡や筆の運びなど300以上の特徴量が対象となります。
これらの検証は、検証計画の立案からチューニングまで約半年間で実施しました。半年という短期間のうちに検証を終えることができたのは、ベースとなるCoolSignが優れていたからだと感じています。
とはいえ、クールデザイン社が単独で金融業界に展開することは容易ではありません。また、アカデミックの世界ではこれまで機械学習に関連する技術の数多く蓄積されています。そうした優れた技術をリアルビジネスに持っていくことも、NTTデータの使命の1つだと思います。
図2:SignIDによる電子サイン照合の流れ
松本 CoolSignを取り入れたSignIDが登場したことにより、大学の研究室から生まれた私たちの技術が何百万人もの金融機関の顧客に適用されて、大きなスケールで役に立つということであれば、望んだ以上に幸せなことと言えるでしょう。
今後はFinTech分野を中心に、さらに活用されていくことを期待しています。
───今回の対談では機械学習が、安全性が求められる金融機関のセキュリティーを強化するだけでなく、社会を変えていく可能性も垣間見えました。第四次産業革命が到来したと言われる現在、機械学習の適用分野はさらに広がっていくことでしょう。
タブレットとペンで入力された電子サインから位置、筆圧、速度などを捉え、照合する電子サイン照合エンジン。独自の学習アルゴリズムでサイン固有の特徴を抽出する。