NTT DATA

DATA INSIGHT

NTT DATAの「知見」と「先見」を社会へ届けるメディア

カテゴリで探す
サービスで探す
業種で探す
トピックで探す
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
2026.3.9業界トレンド/展望

生成AI時代におけるデータサイエンティストの進化

未発見の因果関係を紡ぐ力とは

生成AIの急速な進化は、データ分析の前提そのものを塗り替えつつある。コード生成や可視化、モデル選定まで自動化が進むいま、データサイエンティストの価値はどこに宿るのか。本稿では、AIが得意とする「最尤解(さいゆうかい)」(※1)と、人間が生み出すべき「最優解」(※2)を対比しながら、未発見の因果関係を構想し、経営意思決定へ接続する新たな役割を描く。効率化の先にある、思考と洞察の進化を展望する。

  • (※1)既存データと前提条件の範囲内で、統計的に最も確からしい標準解
  • (※2)状況や条件によって変動する、異質な要素を結びつけることで導かれる新しい解
目次

生成AIとデータ分析の接点

近年、生成AIの進化は目覚ましく、データ分析の領域にも急速に浸透しています。数年前まで膨大なコードや専門知識を要した作業が、いまや自然言語で指示するだけで実行できるようになりました。Pythonコードの自動生成、可視化の自動化、アルゴリズム選定の助言、分析結果の解説文書化といった機能は、データサイエンティストにとって強力な補助輪となり、作業効率を飛躍的に高めています。こうした変化は、データ分析がこれまで専門人材の属人的スキルに依存してきた構造を大きく揺さぶっています。

特に、一般的な分析プロセスの各段階で生成AIは異なる形で影響を及ぼしています。課題設定の段階では、過去事例や既存知識を即座に要約し、仮説形成を支援。データ理解や前処理では、欠損値処理や外れ値検出、基本統計量の算出や分布確認といったコードを自動生成し、探索的解析にかかる時間を大幅に短縮できます。モデリングではデータ特性に応じて適切なアルゴリズムを提案し、例えば「カテゴリ変数が多いため決定木系アルゴリズムが有効」といった助言を与えることができます。

生成AIの強み:最尤解を導く力

生成AIがデータ分析において最も得意とするのは、「最尤解(さいゆうかい)」。すなわち与えられた情報の中で、もっともらしい答えを迅速に提示する力です。これは生成AIが膨大なテキストやコード、過去の事例を学習しているため、入力された状況を既知のパターンに照らし合わせ、標準的な解答を再現することに優れているからです。従来であれば分析者が経験や知識を頼りに時間をかけて検討していたタスクが、自然言語での指示だけで短時間で実現できるようになっています。

具体的な強みを見ていくと、まず、探索的データ解析の効率化です。新しいデータセットを扱う際、従来はアナリストが手作業でPandasやMatplotlibを駆使し、欠損値の確認、分布の把握、外れ値検出などを行っていました。生成AIを活用すれば、「このCSVを探索的に解析して」と指示するだけで、基本統計量を算出し、ヒストグラムや箱ひげ図といった可視化コードまで自動生成してくれます。初期分析にかかる工数が大幅に削減されることで、分析者は「どの視点で深掘りすべきか」という本質的な問いに集中することができます。

次に、モデル選定と評価の支援が挙げられます。例えば顧客離脱予測を行う場合、従来は複数のアルゴリズムを比較検討し、評価指標を選ぶ作業に多くの試行錯誤が必要でした。しかし、生成AIは特徴量やデータ構造を簡単に入力するだけで、「カテゴリ変数が多いのでLightGBMやCatBoostが有効」「クラス不均衡があるため、単なる精度ではなくAUCやPR曲線で比較すべきだ」といった助言を即座に返します。これにより、経験の浅い分析者でも初期方針を正しく立てやすくなります。

さらに、可視化の自動化も大きな利点です。例えば経営層に報告する資料を作る際、「四半期ごとの売り上げ推移を棒グラフと折れ線グラフで見せたい」と伝えれば、生成AIはコードだけでなく、タイトルや軸ラベル、凡例の付け方まで提案をしてくれます。これにより、データを「正しく理解する」だけでなく「わかりやすく伝える」プロセスも効率化することができます。

図1:生成AIのデータ分析における強み

未発見の要因や因果関係の発見:直線的思考の限界と人間の価値

生成AIの最大の限界は、その思考が「直線的」である点です。AIは過去の膨大なデータから学習し、与えられた問いに対して、最も道理にかなっている答えを返すことに優れています。しかしその答えは、既知の知識やパターンの延長線上にあるものにとどまりやすい傾向にあります。つまり、既存のフレームワークに沿った標準解は示せても、データの中に潜む未発見の要因や因果関係を自ら掘り起こすことは難しいのです。

例えば小売業の売り上げデータを分析する場合、生成AIは「季節性」や「キャンペーン効果」といった定番の要因をすぐに挙げるでしょう。しかし、人間のアナリストがSNSデータと突き合わせた結果、「人気ドラマで俳優が使用していた商品が話題化し、特定地域で急激に売り上げが伸びた」という文脈を見出せることがあります。これは既存の延長線ではなく、異分野知識(エンタメ×消費行動)の結合によって発見されたものです。

同様に、製造業の不良率解析において、AIは「設備の老朽化」や「温度・湿度」といった一般的な要因を提示します。一方で人間の分析チームでは、工程ログを時系列で可視化した際に「夜勤シフトで不良が増える」という現象を見つけ、現場ヒアリングを通じて「照明不足による検査見落とし」が原因と突き止めることもあります。これは機械的な変数ではなく、労働環境という社会的文脈を重ね合わせることで明らかになった発見だといえます。

金融の世界でも、AIはクレジットカードの解約率について「利用頻度の低下」「支払い遅延」「年齢層」といった典型的要因を挙げるでしょう。しかし、人間が地域別のデータを分析すると、「都市圏で公共交通ICカードの普及が進み、従来のクレジット利用が減少した」という背景を突き止めることができます。この場合でも、都市インフラという異分野の知識が、金融データに新しい解釈を与えています。

医療分野の分析では、生成AIは「BMI」「喫煙」「飲酒」といった標準的リスク要因を示します。一方で、人間の視点を加えると、「夜勤労働者に多い深夜の高糖質摂取が予想以上にリスク因子になっている」という発見に至ります。これは労働環境と生活習慣を組み合わせることで得られる新しい因果関係です。
これらの例に共通しているのは、生成AIが返すのは「尤もらしいが既知の答え」であるのに対し、人間のアナリストは異分野の知識や社会的文脈を結びつけることで「予想外の発見」に到達しているという点です。

図2:AIによる未知の要因発見の限界

データサイエンティスト兼コンサルタントの役割

生成AIの普及によって、データ分析の定型業務は急速に自動化されつつあります。欠損値処理や可視化、モデル選定や評価指標の提示といった作業は、AIに任せることで一定水準のアウトプットが誰でも手に入るようになりました。そうなった今、人間のデータサイエンティストはどのような役割を果たすべきでしょうか。答えは、単なる「分析者」から「コンサルタント型の変革推進者」へと進化することです。

まず、異分野知識を橋渡しする翻訳者としての役割です。経営課題は単一のデータやアルゴリズムだけでは説明できるものではありません。小売業の売り上げ分析にはエンタメやSNSの知識が、製造業の歩留まり改善には労務や現場環境の知識が欠かせません。データサイエンティストは統計的な事実を導き出し、それをコンサルタントとして経営戦略や業務課題の文脈に翻訳します。この「知識の横断」と「経営との接続」こそが、人間にしかできない重要な役割なのです。

次に、正しい問いを設定する設計者であることが求められます。AIは与えられた質問に対して、もっともらしい答えを返しますが、「そもそも何を問うべきか」を定義することはできません。例えば「売り上げを伸ばすには?」という問いをそのままAIに投げても、返ってくるのは既知の施策の羅列にとどまります。

図3:生成AIの時代にデータサイエンティストはどのように進化すべきか?

ROIの再定義:人間の価値をどう説明するか

生成AIの登場によって、経営層が抱く疑問のひとつは「人間のデータサイエンティストに投資する意味はどこにあるのか」という点です。AIが定型的な作業を代替できるのなら、人材投資のROI(投資対効果)は低下するのではないか、という懸念が生まれるでしょう。しかし実際には、ROIの捉え方を「短期的な数値成果」に限定してしまうと、人間の価値は過小評価されてしまいます。むしろ、データサイエンティスト兼コンサルタントの存在意義は、ROIを広義に再定義することで浮かび上がってくるのです。

第一に、リスク回避価値です。生成AIの出力はもっともらしく見えますが、それが常に正しいとは限りません。もし誤った要因解釈に基づいて数十億円規模のマーケティング施策を実行すれば、投資の大半が無駄になるリスクすらあります。人間のデータサイエンティストは、AIの解釈を批判的に検証し、異なる角度から因果関係を読み解くことで誤投資を防ぐことができ、損失を避けることそのものがROIである、と経営層に伝える必要があります。

第二に、戦略的価値です。AIは「最尤解=標準的な答え」を導くため、競合他社もほぼ同じ答えにたどり着く可能性が高いといえます。しかし、人間は異業種や異分野の知識を結びつけることで、競合が見落としがちな未発見の因果関係を発見することができます。例えば「都市インフラの変化が金融サービス利用に影響した」といった発見は、企業にとって戦略的に大きな差別化要因となります。すなわち、人間の洞察は短期的に数値化しにくいものであっても、長期的な競争優位を築くROIとして説明できるのです。

第三に、ストーリーテリング価値があります。経営層は「分析結果の精度」そのものより、「なぜその戦略を選ぶべきか」を株主や従業員に説明できるかどうかを重視します。生成AIはモデル指標や統計解釈を提供できますが、それを経営の言葉に翻訳し、組織を動かす物語にすることは得意ではありません。人間のデータサイエンティストは、データを背景としたストーリーを紡ぎ、経営判断を正当化し、組織を巻き込む力を持っています。これはROIを超えた「推進力」として機能します。

こうして考えると、ROIとは単なる収益向上やコスト削減の数値ではなく、リスク回避・競争優位・意思決定推進といった多面的な要素を含むべきだと言えます。生成AIが効率性を担う時代において、人間のデータサイエンティストが果たす価値は、この再定義されたROIの中でこそ正しく評価されます。

図4:人間のデータサイエンティストの価値はなにか?

未来のデータサイエンティスト像

生成AIの進化は、データサイエンティストの役割を大きく変えつつあります。欠損値処理やモデル選定、グラフ作成といった定型業務はAIに代替され、効率的に進められるようになりました。もはや「コードを書ける」ことや「アルゴリズムを知っている」ことだけでは差別化が難しい時代です。
では、これからのデータサイエンティストに求められる姿とは何でしょうか。それは、AIを活用しながらも、その限界を補い、さらにはその先を描く存在となることです。

はじめに求められるのは、幅広い経験です。単一領域の深い知識だけではなく、複数の業種や分野をまたぐ経験が、データを新たに解釈する基盤となります。小売、金融、製造、医療といった多様な現場を横断的に理解しているほど、データに潜む意外な要因や因果関係を見抜く力は強まっていきます。

ここで言う「経験」は、必ずしも業務経験に限定されません。日々の生活や社会の動きに対してアンテナを張り、ニュース、SNS、テクノロジー、文化的潮流といった変化を敏感に感じ取る力もまた重要です。例えば、新しい消費トレンドや社会課題の兆しを早期に察知できれば、データの背後にある人間行動の変化を先読みすることができます。こうした「感度の高さ」は、データを単なる数値としてではなく、社会の鼓動として読み解く力を育みます。業務経験と社会的感性、その両輪が未来のデータサイエンティストの思考基盤を形づくるのです。生成AIが過去の知識を再構成するにとどまる一方で、人間は異分野を横断することで新しい結合を発見できます。

次に必要なのは、思考のジャンプ力です。AIが直線的な思考で「既知の延長線上の答え」を導くのに対し、人間は異なる知識体系をつなぎ合わせ、飛躍的な洞察を生み出すことができます。例えば、労働環境の改善が製造品質に寄与することや、都市インフラの変化が金融サービス利用に影響することは、データを超えた知識を組み合わせることによって見えてきます。未来のデータサイエンティストは、この「異質な要素を結びつける力」を磨くことが不可欠です。

さらに欠かせないのが、創造的ストーリーテリングです。データを分析して終わるのではなく、そこで得られた洞察を経営や社会の言葉に翻訳し、人を動かす物語に変える力が必要になります。AIが数値や指標を示すことはできても、それを「なぜ今この一手を打つべきなのか」という意思決定に結びつける説明は人間にしかできません。ストーリー化の力がなければ、せっかくの分析も組織を動かすことはできないのです。
総じて言えるのは、未来のデータサイエンティストは「データを読む人」ではなく、「データを起点に世界をつなぎ直す人」へと進化するということです。

図5:未来のデータサイエンティストのスキルピラミッド

記事の内容に関するご依頼やご相談は、こちらからお問い合わせください。

お問い合わせ

お問い合わせ

記事の内容に関するご依頼やご相談は、
こちらからお問い合わせください。

お問い合わせ