企業を取り巻くビッグデータ
企業の内外には様々なデータが存在しています。これまでの社内システムで生成されてきたトランザクションデータやログデータ、企業活動を通じて発生する膨大な電子メールやオフィス文書、また、インターネット上を流通する様々な形態をもつデータなどです。
その中でも、とりわけ大量なのはテキストデータであり、こうしたビッグデータは電子化されてはいるのですが、それぞれが単独で存在し、ITサービスとして複合的に活用できていないのが現状です。その理由は、以下のような情報系システムの特性が挙げられます。
- 1.バッチ処理ベースの定型処理が多い
- 2.データ保持のための仕組みが柔軟でなく、仕様変更や追加機能開発に時間がかかる
- 3.RDBMS中心であり、多様/複雑な構造を持つデータを扱うことが困難
図:企業を取り巻くビッグデータ
企業におけるビッグデータの活用
よくビッグデータの引き合いに出されるビジネスインテリジェンス(BI)について、これまでの数値を中心とした伝統的なBIで行われるような、「何が起こったのか」「なぜ起こったのか」を把握するには、大きな問題はありません。
しかし、「今何が起こっているのか(リアルタイムモニタリング)」「これから何が起こるのか(予測)」を的確に把握し、
- ガバナンス/コンプライアンスチェック
- プロセスのモニタリング
- ホワイトカラーの生産性向上(手集計からの脱却)
といった面での効果を発揮していくには、数値データだけではなく、企業を取り巻く様々なテキストデータも含めた多様/複雑なデータから価値を創出していくことが求められます。
そのためには、データと意味の関連づけを行い、データの集計や比較が行えるXMLDBや、Hadoopのような並列分散処理の活用が有効なアプローチです。いずれもスキーマレスであり、多様/複雑な構造を持つ大量なデータを柔軟に扱うことができるという特徴を持ちます。ビッグデータを活用するためのIT要素技術は上記に挙げたもの以外にも多数存在し、それぞれが実用レベルに達しつつありますが、適切に組み合わせた活用はこれからです。
NTTデータの役割は、IT要素技術をプロアクティブに活用可能なソリューションに仕立てることだと認識しています。
参考文献
- 2012年2月3日ニュースリリース