NTTデータのOSSソリューションとは
オープンソースの分散処理基盤Apache Hadoop、Apache Spark、Apache Kafkaなどによる大量データ処理システムの構築・運用サービスです。他社に先駆けてこれまでに培ってきたHadoopおよびSpark、Kafkaに関するノウハウをもとに、コンサルティングから構築・サポートサービスの提供まで幅広く対応します。
ウェビナー
NTT DATA Tech
NTTデータから技術やその活用情報を中心に発信しているYouTubeチャンネルです。
技術革新統括本部やテクノロジーコンサルティング&ソリューション分野のメンバを中心にお届けします。
NTTデータのOSSソリューションの特長
NTTデータでは、2008年よりHadoopへの取り組みを進めており、数多くの構築・運用実績を有しています。培ったノウハウをもとに、業務システムや社会インフラにHadoop/Spark/Kafkaなどを安心して活用頂けるソリューションをご提供しています。BI/DWH領域で培ったデータ分析のノウハウとあわせてご提供することで、大量データの活用に向けたコンサルティングも行うことができます。
データを蓄積するところから、活用するところまでトータルに支援します
大規模データ活用は、単にHadoopを導入すれば実現できるわけではありません。データをHadoopにどのように蓄積するか、Hadoopエコシステムとの組み合わせ、Sparkなど他の並列分散処理技術との使い分けなど、考慮すべき事がたくさんあります。NTTデータは、それら全てをトータルにご支援します。
並列分散処理に長けた技術者が高速な大量データ処理を安定運用させます
NTTデータは他社に先駆けて2008年よりHadoopに取り組み、数台~千台規模のHadoop基盤の構築やペタバイト級のデータを扱う等、国内最大規模の構築・運用実績を保持しています。Hadoopの開発コミュニティでも活躍する技術者が、実システムで得られた豊富な知見をもってお客さまの大量データ処理を安定運用させます。
小さくはじめて、大きく育てる。PoCからはじめられます
並列分散処理のための特殊なサーバやストレージは不要です。小規模から始めて、必要な容量や処理性能に応じて拡張可能です。最近では商用システム導入前のPoCのご相談も増えています。何かございましたらお気軽にお問い合わせください。
Hadoop、Spark、Kafkaを利用した分散処理システムに強み
NTTデータでは、Hadoopをはじめとしたオープンソースソフトウェアを適切に組み合わせることで、最適な分散処理基盤を提供します。
例えば、メッセージングシステムとしてKafka、データの蓄積にHadoop、データの処理にSparkを利用し、基盤全体をカバーすることで、分散処理基盤を実現します。
NTTデータのソリューション
NTTデータは、大規模データの活用にHadoopを利用した、分散処理のアプローチで多くの実績があります。
従来は夜間時間帯で実行していたバッチ処理を高速化することで、より早く情報を活用できる機会を創りました。
また、機器の容量不足などにより数日間分で捨てていたデータを数か月~年単位で保存することで、分析の精度を高めることができるようになりました。
実現したいことに応じて、数台~千台規模のサーバーからなるHadoopシステムを導入するなどの実績がございます。加えて、データの活用シーンに応じてさまざまな分散処理環境を提供してきた実績もございます。そして、数年以上のHadoopシステム運用で得られたノウハウを蓄積しています。
商品ラインナップ
NTTデータのOSSソリューションを紹介
お客さま事例
NTTデータとの提携により、さまざまな業種の企業がどのように課題を解決したかをご覧ください。
Hadoop導入のPoCからスタートし、メインフレーム上のバッチ処理の一部をHadoopにオフロード。
「さまざまな切り口を組み合わせた柔軟な分析」「全期間データに対する精緻な分析」「個人スキルに依存しない分析」をHadoopで実現。Hadoopにデータを集約し、事前に加工しておくことで、分析ススピードも大幅に向上。
大量のログデータの分析基盤として「Hadoop」に着目し、さまざまな事業分野で商用システムへの導入が決定。Hadoopサポートサービスも活用中!
国立国会図書館サーチの検索基盤にHadoopを導入し、数千万件・約5TBの書誌データを分散処理化。名寄せやインデックス生成を高速化し、横断検索の利便性を向上しました。
NTTデータはDatabricksブログでSpark導入事例を紹介。Hadoop基盤にSparkを統合し、大規模検証やIoT分析を実施。開発コミュニティへの技術貢献も行い、分散処理の高度化を推進しています。
全国民のレセプト情報を格納する次世代NDB構築においてHadoop/Sparkの活用により高い処理能力とスケーラビリティを実現
DATA INSIGHTブログ
2023.4.13
データ活用基盤を支えるオープンソースへの取り組み
OSSソリューション
詳細はこちら
2022.4.25
データ活用基盤を支えるBigtopソリューション
企業が抱えるデータが年々巨大化し、また将来の事業拡大規模を見通すことが難しい中、それらの変化を見据えたデータ活用基盤の構築や運用に課題を持つ企業は多い。長期的なデータ活用基盤運用に向けたApache Bigtop活用のメリットとBigtopソリューションの活用法を解説する。
データ&インテリジェンス オープンソースソフトウェア デジタル化・DX OSSソリューション
詳細はこちら
2021.10.12
デジタル時代のデータ活用新潮流 ストリーム処理
ストリーム処理は、リアルタイムにデータの持つ価値を引き出す、デジタル時代の新しいデータ活用スタイルである。本記事では、ストリーム処理の概要と、エンタープライズに適したストリーム処理プラットフォームの考え方を紹介する。
データ&インテリジェンス オープンソースソフトウェア データ活用 デジタル化・DX OSSソリューション
詳細はこちら
お知らせ
-
2021年8月30日
株式会社NTTデータ(持株会社体制移行前) トピックス
NTTおよびNTTデータからのApache Sparkのプロジェクトマネジメント委員会メンバ就任について新しいウィンドウで開きます。
-
2021年1月29日
株式会社NTTデータ(持株会社体制移行前) トピックス
-
2020年4月28日
株式会社NTTデータ(持株会社体制移行前) トピックス
オープンソースプロジェクト Apache Hadoop、Apache BigtopのPMC(プロジェクトマネジメント委員)就任新しいウィンドウで開きます。
ライブラリ
業界・技術トレンドや展望を、NTTデータが提供するホワイトペーパーやインサイト動画などでご覧ください。
-
動画
-
SlideShare
-
SlideShare / NTTデータ テクノロジーカンファレンス2018
-
SlideShare / NTTデータ テクノロジーカンファレンス2018
-
SlideShare / NTTデータ テクノロジーカンファレンス2018
-
SlideShare / NTTデータ テクノロジーカンファレンス2017
-
SlideShare / NTTデータ テクノロジーカンファレンス2017
-
SlideShare / NTTデータ テクノロジーカンファレンス2017
-
雑誌掲載 / Spark・Hadoopコミッター就任関連記事
-
雑誌掲載 / Spark・Hadoopコミッター就任関連記事
-
雑誌掲載 / Spark・Hadoopコミッター就任関連記事
-
雑誌掲載 / Spark・Hadoopコミッター就任関連記事
-
雑誌掲載 / Spark・Hadoopコミッター就任関連記事
-
雑誌掲載 / 日経Systems : ITインフラReport
-
雑誌掲載 / 日経Systems : ITインフラReport
-
雑誌掲載 / 過去記事
-
雑誌掲載 / 過去記事
-
論文情報 / 電子情報通信学会誌
低レイテンシ性を重視した大規模データ分析のための分散ストリーム処理システムの設計と実装
-
論文情報 / 情報処理学会デジタルプラクティス
-
論文情報 / 情報処理学会デジタルプラクティス
-
論文情報 / 情報処理学会デジタルプラクティス
-
論文情報 / 情報処理学会デジタルプラクティス
-
論文情報 / 情報処理学会デジタルプラクティス
-
論文情報
平成21年度 産学連携ソフトウェア工学実践事業報告書
補足・商標
- 記載されている会社名、商品名、サービス名等は、各社の登録商標または商標です。