1.ビッグデータの「今」
"ビッグデータ"という言葉が叫ばれてから数年、バズワードとしての扱いから徐々にビジネスでも取り組まれつつある。一方で、ビッグデータとは何か、具体的にどのように活用するのか、どのような道具立てを利用するのか、などが模索されている状況は依然として変わっていないように見える。ビッグデータというと3V(Volume,Variety,Velocity)とよく言われるが、これまではどちらかと言うとVolumeに焦点が当てられていた。多量のデータをどのように扱うのか、という視点が中心になってしまうと、それだけでは効果的な活用にまでなかなか至らず、今の状況につながっている。
2."多様さ"の活用
実際のビジネスでは多量のみならず、むしろさまざまなデータをまとめて扱うことで意味が出ることが多いのではないか。1つ1つのボリュームが小さなデータでも、まとめて扱うことで立派なビッグデータ活用になる。これまでも、こうしたニーズはビジネスの現場ではあった。一方で、技術的には多様なデータを扱うにあたり、データベースの制約や、非構造化データ(SNS・動画・メール等)といった形が定まりづらいデータ自体を取り扱う周辺技術が未整備だったことから、ハードルが高く、なかなか実現してこなかったという背景がある。
3.技術の進化
「システム目線では難しいとしても、ビジネスの現場では実現のニーズが相応にある」というギャップが生じると、それを埋めるべく自然と技術が進化していくのはこれまでも見られたことであり、この分野でも同様である。Hadoopを始めとする分散処理技術やNoSQLデータベースといった要素技術が一般的に使われるようになり、データ処理自体は性能面・機能面で飛躍的に進歩しつつある。
4.利用者目線での非構造化データを含むビッグデータ活用に必要なもの
その一方で、実際に利用者目線で各種データが使われているかと言うと、まだそこには至っていない。その要因は主に以下の2つだと考える。
- データそのものが持つ意味を捉まえて活用するに至っていない
- ビジネスフローにデータの活用が自然な形で組み込まれていない
前者は、データそのもののコンテキスト(文脈と照らし合わせた意味)の解釈まで組み込んでデータ自体の意味付けを行うことで、そのデータが意味するものは何なのかをデータ自身とセットで属性として持てるようになる。後から利用する際にその属性も参照することで、さまざまなシーンに応じたデータの活用が可能となる。特に非構造化データにおいては、データそれ自体だけでは他のデータとの組み合わせなどを含めて活用が難しいため、より属性とのセットによる活用が重要となる。
また、後者に際しては、ビッグデータを活用する、と意識させるのではなく、普段のビジネスの中で気がつくとさまざまなデータを活用しながら業務を行っている、という環境を作り出すことが必要である。
そんな環境作りとビッグデータ活用が、利用者にとって当たり前になるような仕組みを先進的な技術も組み合わせながら、ソリューションのような使いやすい形で作っていきたい。