NTT DATA

DATA INSIGHT

NTTデータの「知見」と「先見」を社会へ届けるメディア

絞り込み検索
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
2023年4月21日技術ブログ

生成系AIの最新動向と法的懸念点

昨年後半からデータを生成するAIが急激に進化しており、特に画像生成AIやチャット生成AIが広く一般でも使われるようになった。これらの生成系AIは、人間が生成するのにも劣らない出力がされることで便利さが強調される一方で、出力の真偽の問題や、容易に悪用できてしまう問題、学習データや生成物に関する著作権などのさまざまな権利の問題についても指摘されている。こうした状況を踏まえ、AIアドバイザリーボード勉強会で生成系AIの最新動向と法的懸念点について講演と意見交換を行ったので、そのエッセンスを踏まえ解説する。
目次

生成系AIに対するAIガバナンスからの懸念

昨年後半からデータを生成するAIが急激に進化しており、特に「Stable Diffusion」や「Midjourney」をはじめとする画像生成AIや、「ChatGPT」をはじめとするチャット生成AIが広く一般でも使われるようになりました。人間が生成するのにも劣らない出力がされることから、その利便性に注目が集まっています。
しかしながら、生成系AIの出力は知識や事実に基づいたものではないため、真偽を確認せずにそのままビジネスに活用すれば、誤った情報発信により企業の信用低下につながります。また、既に権利侵害などで訴訟になっている生成系AIもあり、訴訟の対象になっているAIを活用してビジネスをした場合には「他者の権利を侵害してでももうけようとしている企業」として社会的批判を招くリスクもあります。こうした状況を踏まえ、生成系AIの最新動向と法的懸念点をテーマとして専門家をお招きしたAIアドバイザリーボード勉強会(※)を開催し、講演と意見交換を行いました。本稿ではそのエッセンスを踏まえ解説します。

(※)NTTデータニュースリリース「AIアドバイザリーボードの設置について」

https://www.nttdata.com/jp/ja/news/release/2021/041901/

生成系AIの最新動向

AIアドバイザリーボード外部委員の国立情報学研究所 石川冬樹先生から生成系AIの最新動向として、画像生成AIとチャット生成AIを解説いただきました。
生成系AIとは、非常に単純に言ってしまうと「何が自然にどれだけ頻繁に存在するか」を学習したモデルです。最近の話題の生成系AIはネット上に存在する膨大なテキストや画像からの学習結果を活用したものと言われています。

画像生成AIは、利用者が入力したテキスト文から画像を生成するもので、2022年夏ごろから急激に発展しています。特に「Stable Diffusion」がソースコードを公開したことから利用が急拡大し、追加学習により特定の分野における画像の出力に特化したものも数多く作られています。
ただし、入力単語(通称:呪文)を適切に選ばないと期待した出力は得られないことや、その出力には学習データ内の偏り(例:職業による性別バイアス)が反映されること、規則・知識に従った出力にはならない(例:人の指や歯の数、空間的に異常なつながりなど)ことといった技術的な特性があります。そのため望み通りの画像を得るためには、入力単語を選ぶノウハウに加えて、生成された画像の選定、異常な箇所の修正、加工が必要です。
また、イラストレーターの業界からは学習用データとして自らのイラストが勝手に使われ、作風を学習されてしまうことに批判的な意見も見受けられます。他にも、官房長官が注意喚起したことでニュースでも取り上げられたとおり、2022年8月末の静岡県の洪水画像のように悪用も容易なことから、倫理・社会受容性の問題が指摘されています。

一方、チャット生成AIは、2022年11月に公開された「ChatGPT」が、それまでのチャットボットとは異なるレベルで適切な回答をしてくることから、広く注目されるようになりました。
ただし、2023年2月時点のChatGPT3.5は、一見すると正確そうな出力を返してきますが、知識や事実に基づいたものではなく、学習データから得られたもっともらしい単語のつながりを出力しているため、出力の真偽は利用者が見分ける必要があります。そのため、わからないことを聞く用途よりも、何か事実を与えて、その出力の真偽を確認できる、翻訳や要約といった言い換えをさせる用途での有用性が高いと言えます。
マイクロソフト社は、ChatGPTのBingへの組み入れや将来的なMS-Officeとの連携を発表しており、今後、ホワイトカラーの仕事に大きな影響を与える可能性があります。しかしながら、不正確な情報の乱雑な情報発信がこれまで以上に容易に実現できることから、利用者にはリテラシーとモラルが求められます。

生成系AIの議論と法的懸念点

ゲストとしてお招きしたSTORIA法律事務所の柿沼太一弁護士より、画像生成AIを中心に生成系AIの議論と法的懸念点について解説をいただきました。
柿沼先生はAI法務の第一人者であり、AIの技術面からの理解も深く、生成系AIの法的懸念点についても事務所のWebサイト(https://storialaw.jp/lawyer/3041)から情報発信をされています。
(なお、以下に述べる内容はいずれも2023年3月時点での柿沼先生の見解であり、判例ではありません)

生成系AIをめぐる、法的な論点には、以下の3点が挙げられます。

  • 1.【学習データの権利問題】学習に他人の画像や文章を勝手に収集して利用することができるか
  • 2.【生成物の著作権問題】生成系AIを利用して自動生成した生成物に著作権は発生するか、発生するならば誰の権利になるか
  • 3.【その他権利侵害の懸念】生成系AIを利用して画像や文章を作成・利用することは著作権・肖像権らの観点で懸念はないか

1.「学習データの権利問題」

米国ではフェアユース規定、EUでは非営利での利用に限定など、解釈は各国で異なっていますが、日本国内においては著作権法30条の4にある「情報解析としての利用」に該当し、権利侵害に該当しない可能性が高いと考えられます。

2.「生成物の著作権問題」

AIによる創作物には著作権は発生しないのが基本になります。しかし、生成者の意に沿った画像にするために、「長く複雑な入力文により生成する」「複数回の試行錯誤から生成して選択する」「生成された画像を人間がさらに加工する」といった、人による創作の意図や創作的寄与が入ると著作権が発生すると考えられます。こうした問題で先行している米国著作権局でも、まだその判断が揺れているようです。

3.「その他権利侵害の懸念」

生成系AIを使って既存著作物と同一/類似の著作物が出力された場合の権利侵害は「依拠性=ユーザーが当該既存画像を模倣しようとしたのかどうか」が判断の分かれ目となると考えられます。例えば、著名な画家や作家の名前を入力して既存著作物と同一/類似の画像を生成させるようなことが該当します。また、特定の作者の作品だけで学習させた生成系AIを提供した提供者も責任を問われる可能性が高いと考えられます。

今後に向けて

生成系AIは人間が生成するのにも劣らない出力がされることから、社会に大きな変化をもたらす可能性を秘めています。しかしその反面、出力の真偽の問題や権利侵害の問題など、企業として利用するためにはガバナンスの観点からさまざまな課題があります。利用にあたってのリスクをいかに低減し、そのベネフィットを得ていくのか、NTTデータではAIガバナンス活動の一環として、外部有識者を交えた勉強会を今後も開催し、お客さまへ安全なAIシステムをお届けして参ります。

お問い合わせ