NTTデータのOSSソリューション

ビッグデータ活用を支える大量データ処理基盤を提供

Hadoop、Spark、Kafkaを利用した分散処理システムに強み

NTTデータでは、Hadoopをはじめとしたオープンソースソフトウェアを適切に組み合わせることで、最適な分散処理基盤を提供します。
例えば、メッセージングシステムとしてKafka、データの蓄積にHadoop、データの処理にSparkを利用し、基盤全体をカバーすることで、分散処理基盤を実現します。

データ生成元からFluentdやembulkで収集し、Kafkaでメッセージング、Sparkで処理、HadoopやPostgreSQLに格納し、APサーバやクライアントに連携するデータ処理基盤の構成図

NTTデータのソリューション

NTTデータは、大規模データの活用にHadoopを利用した、分散処理のアプローチで多くの実績があります。
従来は夜間時間帯で実行していたバッチ処理を高速化することで、より早く情報を活用できる機会を創りました。
また、機器の容量不足などにより数日間分で捨てていたデータを数か月~年単位で保存することで、分析の精度を高めることができるようになりました。
実現したいことに応じて、数台~千台規模のサーバーからなるHadoopシステムを導入するなどの実績がございます。加えて、データの活用シーンに応じてさまざまな分散処理環境を提供してきた実績もございます。そして、数年以上のHadoopシステム運用で得られたノウハウを蓄積しています。

分散処理技術Hadoopについてはこちら

業務情報やセンサーデータをHadoop、Spark、Kafkaで処理し、可視化・評価する仕組みのイメージ

補足・商標

  • 記載されている会社名、商品名、サービス名等は、各社の登録商標または商標です。