お知らせ
-
2024年5月28日
-
2024年5月23日
株式会社NTTデータ トピックス
統合データ分析基盤を提供するデータブリックスのパートナー評価で日本企業初の「Elite」を獲得新しいウィンドウで開きます。
-
2023年10月13日
Databricksとは
Databricksは、データウェアハウスとデータレイクを統合する、次世代のクラウド型統合データ分析基盤「レイクハウス・プラットフォーム」を提供しています。これにより、全てのデータエキスパートが、あらゆるデータを簡単に統合、迅速に分析し、AIを活⽤したインサイトを獲得することが可能になります。
Databricksの特長
-
ペタバイト級のデータや大量の機械学習モデルをリアルタイムで処理可能
- 並列分散処理による高パフォーマンスなETL(Extract Transform Load:抽出/変換/格納)と機械学習の実行
- 価値の実現/市場への展開のリードタイムの高速化
-
データチーム内の共同作業の効率化
- コメントやチャット機能などのモダンなコミュニケーション機能や、各データやモデルのバージョン履歴管理などをブラウザベースのNotebook上で提供
-
データ管理のシンプル化
- 非構造化/半構造化データに対し、構造化データライクに、信頼向上や意味(タグ)付けが可能
- ストリーミングデータを、リアルタイムでバッチデータと統合して処理が可能
-
SQLアナリティクス
- BIツールから直接データレイクにアクセスし、ダッシュボードを作成することも可能
-
機械学習ライフサイクルのシンプル化
- 機械学習の実験から本番活用までのライフサイクルを一元的に管理可能
- 単一の機械学習モデルのレポジトリー機能により、全モデルのホワイトボックス化が実現し、データサイエンティスト間のモデルの共有/再利用が実現
-
マルチクラウド対応で簡単にデータ分析環境を構築することが可能
- Microsoft Azure, Amazon Web Service, Google Croud Platform をサポート
- データ分析基盤を数クリックで構築可能
データ & AI プロジェクトにおける課題
【データを保存しているシステムがバラバラ】
複数システムに跨る多種多様なデータを一元的に分析しなければ適切な分析結果を得られない。
【データ量の増加に伴い、処理が追いつかない&コストが上がる】
データ量に比例して処理時間/コストが上がってしまう一方でサンプリングデータでは、アウトプットの質が落ちてしまう。
【プロジェクトを進める上で、チーム内の効率的な連携が難しい】
分析データを用意するデータエンジニアリング、モデルの作成/検証を行うデータサイエンティスト、検証結果に対して洞察を導き出すデータアナリスト。スキルセット、言語、ツールがそれぞれ異なるため、効率的な連携が難しい。
【データ分析基盤の柔軟性とオープン性の担保】
対象となるデータセットやデータ量、必要な処理のサイズは、スコープや時期によって大幅に変化するため、コスト最適化のためには、ベンダーロックインを回避する必要がある。
Databricks × NTT DATAが解決します
NTTデータは、お客様企業のデジタル変⾰・DXの成功に向けて、「Databricks」のソリューションの提供に加え、情報活⽤戦略の⽴案から、AI技術の活⽤も含めたアナリティクス、分析基盤構築・運⽤、分析業務のアウトソースまで、ワンストップの⽀援を提供いたします。
レポート&コラム
2023.11.29
Databricksがデータ仮想化を実現!レイクハウスフェデレーションで社内データ活用を効率化
社内にある複数のデータソースを用いたデータ活用を推進する際に、IT部門はいくつかの課題に直面する。まず、複数のデータソースのアクセス権限設定に多くのコストがかかる。また、社内に散逸したデータを探し出したり、データの来歴を調査したりする手間が多くかかる。加えて、データ移行にともなう時間的・経済的コストも懸念される。 以上の課題を解決するものとして、Databricksの新機能「レイクハウスフェデレーション」が最近注目されている。 本稿では、レイクハウスフェデレーションの特長や他のデータ仮想化製品との比較について解説する。
データ&インテリジェンス クラウド Trusted Data Foundation Databricks
詳細はこちら
2023.6.20
いまさら聞けない!「レイクハウス」とDWH、データレイクの違いとは
ビッグデータ、機械学習(AI)、クラウド、DXといった昨今のエンタープライズITのトレンドにおいて、データサイエンスは基幹の技術となりつつある。それにともない、分析の元となるデータの保管もDWHからデータレイクへと広がってきた。そのような中注目される新しい概念が「レイクハウス」だ。(データレイクハウスとも呼ばれるが、本稿では「レイクハウス」とする)。本稿ではレイクハウスについて、類似するデータレイク、データウェアハウスとの違いにも触れながら解説する。
データ&インテリジェンス クラウド コンサルティング デジタル化・DX Trusted Data Foundation Databricks
詳細はこちら
2023.1.26
データ活用におけるトレンド予想2023
企業におけるデータ活用は年々注目度が増しており、ほぼすべての企業の中期経営計画においてデータ活用について触れられている。とはいえ、いきなり大きな投資をするのではなく、小さく始めて成功を重ねたい企業も多い。小さく始め、大きく成長させる、もしくは大きく成長した後に発生する課題に対応するための技術トレンドとして、モダンデータスタック、データファブリック、データメッシュという3つのキーワードを紹介する。
データ&インテリジェンス クラウド デジタル化・DX Trusted Data Foundation Snowflake Databricks
詳細はこちら
東京海上日動火災保険株式会社様事例
~資料ダウンロード~
本事例資料では、東京海上日動火災保険様がデータドリブンな意思決定を推進するデータ分析基盤として、なぜDatabricksを採用されたか紹介しております。750名ものユーザーが活用するデータ分析基盤整備のため、高いユーザビリティと柔軟なアクセス制御をDatabricksにより実現されています。
無料トライアルのご案内
Databricksの無料トライアル実施しております。
ご興味のある方は下記リンク先フォームよりお申込みください。
(Google Chromeでの閲覧を推奨)
※本トライアルはDatabricks社が提供しており、下記ボタンをクリックするとDatabricks社の入力フォーム画面に移動します。申込みフォームに入力されたお客様情報(個人情報)については、Databricks社とNTTデータで共有し、以下のプライバシーポリシーに則って取り扱います。
NTTデータ:プライバシーポリシー Databricks:プライバシーポリシー
Databricksに関するご依頼やご相談は、こちらからお問い合わせください。