Apache Hadoop

Hadoopは、大規模データを効率的に処理するための分散処理基盤です。
Hadoop環境の構築・運用などをトータルで支援いたします。

Hadoop登場の背景

Hadoopは、Google社が論文として公開した、Google社内の以下の基盤技術をオープンソースとして実装したものを利用しています。

  • GFS(Google File System:Google社の分散ファイルシステム)
  • Google MapReduce(Google社での分散処理技術)

検索サービスで扱うWebページの情報をGFSに保存して、検索用インデックスをGoogle MapReduceで生成するなどの用途で利用されました。

これらの論文をもとに、Doug Cutting氏(現在、Apacheコミュニティの議長)を中心としたメンバーがJavaベースで開発したものが始まりです。

Doug氏たちは、Hadoopとして以下のコンポーネントを開発しました。そして、現在に至っています。

  • HDFS(Hadoop Distributed File System:Hadoop分散ファイルシステム)
  • Hadoop MapReduce Framework(Hadoop MapReduceフレームワーク)

なお、Hadoopという名前は、Doug氏のお子さんが持っていたお気に入りの象のぬいぐるみの名前を利用しています。

補足・商標

  • 記載されている会社名、商品名、サービス名等は、各社の登録商標または商標です。