日本初、電子カルテから薬物治療効果判定に有益な情報を取得 ~宮崎大学・NTTデータ・ファイザー、自然言語処理による非構造化データからの臨床アウトカム評価の共同研究を実施~

ニュースリリース/NTTデータ

2021年11月24日

国立大学法人宮崎大学
株式会社NTTデータ
ファイザー株式会社

国立大学法人宮崎大学(宮崎県宮崎市、学長:鮫島 浩、以下:宮崎大学)、株式会社NTTデータ(本社:東京都江東区、代表取締役社長:本間 洋、以下:NTTデータ)およびファイザー株式会社(本社:東京都渋谷区、代表取締役社長:原田 明久、以下:ファイザー)は、日本における医療分野での科学技術の向上と、リアルワールドデータ(以下、RWD)注1の利活用の推進を目的に、コンピューターの自然言語処理による臨床アウトカム評価に関する共同研究を実施しました。その結果、日本で初めて、がん患者さんにおける電子カルテの非構造化データから、薬物治療効果などの臨床アウトカムを評価するための有益な情報を得ることができました。
臨床アウトカムは、電子カルテなど、臨床の現場で作成される文書から評価することが可能と考えられています。しかしながらその文書の多くは、経過記録などの入力形式が定められていない状況で作成される非構造化データであり、日本ではそのデータから評価する手法は確立されていません。今回の共同研究は、その手法確立に向けた前段階として行われ、自然言語処理技術を用いて非構造化データから、薬物治療効果判定に関連するキーワードや、遺伝子検査の結果などを抽出することができました。

今回の共同研究を実施した背景

臨床試験と日常診療との間に存在する、患者集団や投与状況のギャップなどの課題に対する解決方法のひとつとして、日常診療で得られる医療や健康情報などのRWDの利活用が近年注目されています。なかでも、従来RWDとして活用されてきた診療報酬請求データ注2からは得られにくい、薬剤の治療効果や安全性などの臨床アウトカムの取得の可能性があるデータとして、電子カルテの利活用が期待されています。しかしながら、臨床アウトカムに関連する多くのデータは入力形式が定められていない非構造化データであることから、データを構造化しなければ、その解析が困難です。日本ではRWDの利活用が進んでいる海外とは状況が異なり、電子カルテの非構造化データを用いた臨床アウトカムの評価手法は確立されていません。
そこで、今回の共同研究では、その方法論の確立に向け、電子カルテに保存されている非構造化データに、単語の重要度評価や態度表現分析などの自然言語処理技術を適用することで、臨床アウトカムの評価に資するデータ取得の可能性を検討しました。なお、本研究は、次世代医療基盤法注3に基づいて得られたRWDを基に、がん患者さんの臨床アウトカムを評価するための方法論に関する研究の実施に際して、その前段階として行われました注4。また、本研究結果の一部は、第41回医療情報学連合大会(2021年11月18日~21日)において発表されました。

図:共同研究のイメージ

図:共同研究のイメージ

共同研究の概要

研究目的 電子カルテに保存されているデータを用いて、がん患者さんを対象に、薬物治療効果などの臨床アウトカムを客観的に評価する手法を検討する。また、遺伝子検査結果などの診療報酬請求データベースでは得られにくい情報についても、電子カルテから収集可能かを検討する。
研究期間 2020年12月~2021年3月
研究手法 宮崎大学医学部附属病院に2018年4月から2020年9月に通院または入院した、がん患者さん115例の経過記録や放射線レポートなどの電子カルテデータを研究対象とした。
主要評価項目として、薬物治療効果とその判定に重要と考えられるキーワードを設定し、副次的評価項目としては、薬物治療ラインや遺伝子検査結果を設定した。
評価の際、単語の重要度評価や態度表現分析などの自然言語処理技術を適用した。
各者役割

宮崎大学:

  • 研究計画の立案
  • 研究対象者として選択基準を満たす患者さんの匿名化された電子カルテデータを提供
  • 医療情報学分野の専門家としての評価および助言

NTTデータ

  • 研究計画の立案
  • 匿名化されたデータの解析

ファイザー:

  • 研究計画の立案
  • 研究に利用するデータの特定
  • データ解析結果の評価
研究結果 薬物治療効果判定に関連したキーワードとして、臨床上重要な単語(縮小、効果、著変、改善)などが特定された。
また、遺伝子検査296件のうち77%における検査結果を電子カルテデータから抽出することができた。
結論として、電子カルテの非構造化データから、薬物治療効果判定に関連するキーワードや遺伝子検査結果など、がん患者さんの治療効果判定に有益な情報が得られることが分かった。

今後について

今後、複数のキーワードの関係性や文脈を考慮したAI(人工知能)による薬物治療効果判定モデルの構築に向けて、一般社団法人ライフデータイニシアティブを含めた4者はAIを活用した自然言語処理技術であるドメイン特化BERT注5注6を用いた薬物治療の効果判定モデル生成の研究にも取り組む予定です。また、生成した薬物治療の効果判定モデルについては、次世代医療基盤法に基づき得られた多施設の電子カルテデータへの適用も予定しています。医療に関する臨床アウトカムの情報を効率的に収集して活用することができれば、さらなる個別化医療の進展や、適切な医薬品への早期のアクセスなど、さまざまなベネフィットが期待されます。今後も、RWD利活用の有用性を高める取り組みにより、医薬品をより適切な患者さんに届け、医薬品の価値を最大化し、医療に貢献することを目指していきます。

注釈

  • 注1リアルワールドデータとは、医療現場での診療行為から得られる医療情報の総称です。
  • 注2レセプトなどの病院が健康保険などの報酬を公的機関に請求するために提出する書類データを指します。
  • 注3国民の医療情報を先進的な研究開発に利活用し、健康長寿社会を実現するための医療情報の利活用促進を目的とした法律です。
    2017年5月12日に交付され、2018年5月11日に施行されました。
    https://www8.cao.go.jp/iryou/gaiyou/gaiyou.html
  • 注4NTTデータとファイザーは、一般社団法人ライフデータイニシアティブとともに、2020年に次世代医療基盤法に基づく匿名加工医療情報提供に関する契約を締結し、電子カルテなど医療ビッグデータ活用によるがん患者臨床アウトカム評価の研究を実施しています。
    (参考)2020年12月14日プレスリリース「電子カルテなど医療ビッグデータ活用によるがん患者臨床アウトカム評価の研究開始」
    https://www.nttdata.com/jp/ja/news/release/2020/121402/
    https://www.pfizer.co.jp/pfizer/company/press/2020/2020_12_14.html
  • 注5BERT(Bidirectional Encoder Representations from Transformers)とは2018年10月にGoogleが発表した自然言語処理モデルであり、自然言語処理分野のさまざまなベンチマークにおいて従来モデルの精度を上回るなど近年注目されています。
    https://arxiv.org/abs/1810.04805
  • 注6ドメイン特化BERTは、業務領域(ドメイン)特有な用語や言い回しを含む文書に対して、類似表現を含む文書を大量に用意してBERTに追加学習を施すことで、専門性の高い文書でも高い精度を出せるようにしたものです。
    https://www.nttdata.com/jp/ja/data-insight/2021/032202/

国立大学法人宮崎大学について

宮崎大学は、「世界を視野に 地域から始めよう」のスローガンのもと、地域との連携を密にした人材育成を行うとともに、宮崎最大の知的拠点として発展しています。生命科学、環境科学、エネルギー科学、食の科学、多領域共生分野の科学などを中心に、分野を超えた、融合的で特色ある高度な学術研究成果を世界へ発信しています。

NTTデータについて

NTTデータは、豊かで調和のとれた社会づくりを目指し、世界50カ国以上でITサービスを提供しています。デジタル技術を活用したビジネス変革や社会課題の解決に向けて、お客さまとともに未来を見つめ、コンサルティングからシステムづくり、システムの運用に至るまで、さまざまなサービスを提供します。

ファイザーについて

ファイザーはサイエンスとグローバルなリソースを活用し、人々が健康で長生きし、生活を大きく改善するための治療法をお届けしています。私たちは、革新的な医薬品やワクチンを含むヘルスケア製品の探索・開発・製造における品質・安全性・価値の基準を確立するよう努めています。ファイザーの社員は、生命や生活を脅かす疾患に対するより良い予防法や治療法を提供することで、日々、世界中の人々の健康に貢献しています。世界有数の革新的医薬品企業の責務として、信頼できる医療に誰もが容易にアクセスできるように、世界中の医療従事者、政府、地域社会と協力しています。人々の期待に応えるため、私たちは170年以上にわたり前進し続けてきました。詳細はホームページをご覧ください。 www.pfizer.com(グローバル) www.pfizer.co.jp(日本法人)

本件に関するお問い合わせ先

報道関係のお問い合わせ先

株式会社NTTデータ
広報部
西澤、宮尾
TEL:070-4437-3848

本研究に関するお問い合わせ先

株式会社NTTデータ
製造ITイノベーション事業本部
第四製造事業部
長谷川、竹本、藤井
E-mail:milkr_support@kits.nttdata.co.jp

BERTに関する問い合わせ先

株式会社NTTデータ
技術革新統括本部
技術開発本部
E-mail:rdhkouhou@kits.nttdata.co.jp