医学・疫学研究者が活用するレセプト情報・特定健診等情報の利便性向上に向けた取り組みについて

サービスインフォメーション

2017年10月17日

株式会社NTTデータ

株式会社NTTデータ(以下:NTTデータ)は国立研究開発法人日本医療研究開発機構(以下:AMED)の受託研究としてレセプト情報・特定健診等情報データベース(National Database of Health Insurance Claims and Specific Health Checkups of Japan、以下:NDB)の利便性向上に向けた取り組みを実施しています。

NDBとは、国内で行われている保険診療のほぼ全てのレセプトと特定健診の情報が集積された国家的データベースであり、医学・疫学研究者は、NDBに格納されているデータを医療の質向上や日本発の医学技術の臨床開発を目指した研究に役立てることができます。

今回の受託研究においては、NDBのデータ研究における第一人者と連携して分析に必要なデータクレンジング(重複や誤記等を探し出し、削除や修正等を行ってデータの品質を高めること)に関する知見を取り入れつつ、基盤部分にはApache HadoopやApache Sparkを導入し、効率的なビッグデータの活用を実現する次世代NDB研究基盤の構築を行います。本研究を通じて構築した次世代NDB研究基盤により、これまで研究者にとって非常に負荷の高い作業であった患者単位・時系列での名寄せ等、研究者の多様なニーズに合わせた処理を高速かつ柔軟に実現することが可能になります。

NTTデータは2018年3月までに受託研究を完了させ、本受託研究で構築した次世代NDB研究基盤を将来的に本格運用に繋げていくことで、日本の医学の発展に貢献していきます。

背景

NDBは、国内で行われている保険診療のほぼ全てのレセプトと特定健診の情報が集積された国家的データベースであり、医療の質向上や日本発の医療技術の臨床開発の促進のためには、NDB利活用の裾野を多くの研究者に広げる必要があります。

その実現に向け、患者単位・時系列の名寄せなどの利用者の多様なニーズに合わせた処理を、高速かつ柔軟に実現する環境を構築することが課題として認識されています。

NTTデータはレセプトと特定健診情報のデータ特性に係る知見を有し、大規模分散処理基盤Hadoop、Sparkを使った処理高速化の開発実績があったため、このたび本研究に取り組むこととなりました。

概要

現在のNDBは記録条件仕様に定められた第三正規形のリレーショナル・データベース(以下:RDB)に情報が格納されていますが、この形式は情報を最小化して保管するには適しているものの、処理速度を必ずしも向上させるものではないことが知られています。特に、多くの研究で必要となる患者単位で追跡・統合する作業を円滑化するにはNDBデータに一定の前処理を施しておくことが求められますが、RDBで格納されたデータの構造を変更することは非常に負荷が高い作業となるため、現在のデータ構造のままでは利用者に対して抜本的な利便性の改善をもたらすことは困難でした。

NTTデータは今回の研究において、基盤部分においてはビッグデータ活用において導入実績が多いApache HadoopやApache Sparkを導入することで、従来のRDBの限界性能を超えた処理速度を実現します。

加えて、本分野の研究における第一人者と連携して、分析前に必要なデータのクレンジングに関する知見を取り入れることで、医学・疫学研究者にとって利便性の高いNDBを実現します。

今後について

NTTデータは2018年3月までに受託研究を完了予定です。また、医療研究者にとって利便性の高いNDBを実現することにより、医療の質向上や日本発の医療技術の臨床開発促進の一助となることを目指します。

参考

本取り組みに関する講演について

2017年10月30日に「みんなが使いやすいNDBを目指して-AMED臨床研究等ICT基盤構築研究事業「新たなエビデンス創出のための次世代NDBデータ研究基盤構築に関する研究」のご報告-」と題して、本取り組みの背景と目的について、国立研究開発法人日本医療研究開発機構 臨床研究・治験基盤事業部臨床研究課 課長 川口 貴史様および京都大学医学部附属病院 医療情報企画部 教授 黒田 知宏様から発表予定です。

注釈

  • 文中の商品名、会社名、団体名は、各社の商標または登録商標です。

本件に関するお問い合わせ先

株式会社NTTデータ
第二公共事業本部
社会保障事業部
原野、小島、中山
TEL:050-5546-8727

株式会社NTTデータ
技術革新統括本部
システム技術本部
プラットフォームPoC担当
徳田、下垣、山口(永)
TEL:050-5546-9000