概要

Hadoopは、Apacheソフトウェア財団が運営するオープンソースプロジェクトのひとつとして開発が進められている並列分散処理を実現するオープンソースソフトウェアであり、NTTグループ各社をはじめとして、TwitterやFacebookなど先進的企業で利用されている、極めて巨大なデータを高速に処理することを実現するオープンソースソフトウェアになります。大規模データを効率的に格納・処理できることから、ビッグデータ活用を支える基盤として普及が進んでおり、ビッグデータの蓄積・分析・活用を支えております。

Hadoopコミュニティでは、PMC(プロジェクトマネジメント委員)・コミッタ(主要開発者)・貢献者(開発者)により開発が行われております。

【図】

図:HadoopコミュニティとSpark、Yetusコミュニティ鳥瞰図

NTTおよびNTTデータのこれまでの取り組みについて

NTTおよびNTTデータは、Hadoopの主要コンポーネントに対して、これまで継続的に貢献してまいりました。Hadoopのコミッタ(主要開発者)として、新たに岩崎 正剛(NTTデータ 基盤システム事業本部)が就任(2016年1月27日)しました。また、Hadoopと同じく並列分散処理を実現するオープンソースソフトウェアApache Sparkのコミッタに猿田 浩輔(NTTデータ 基盤システム事業本部)が就任(2015年6月17日)し、Hadoopの品質を担保するプロジェクトであるApache Yetusのコミッタ(主要開発者)に関 堅吾(NTTデータ 基盤システム事業本部)が就任(2015年12月2日)しており、HadoopコミュニティにおけるNTTグループのプレゼンスは大きく向上しております。日本においても各種のサービスを支える基盤技術として活用が進んでおり、NTTデータでは、Hadoopを使ったシステムインテグレーションやサービスを提供してまいります。

【写真】

写真:左から、猿田、鯵坂、小沢、岩崎、関。