用語解説辞典

用語解説辞典 知りたい用語はここで検索

用語解説辞典トップに戻る

【Apache Hadoop】

  • Hadoop
  • アパッチ・ハドゥープ
  • ハドゥープ

 Hadoop(ハドゥープ)は、ビッグデータ解析などの分野で活用が期待されてる特殊なソフトウェアの名称。今は、Apache ソフトウェア財団(Apache Software Foundation)が開発・管理しているため、Apache Hadoop(アパッチ・ハドゥープ)と呼ばれることもある。

 現在、ビッグデータと呼ばれる膨大な量の情報が日々刻々と収集・蓄積されている。しかし、単に情報を集めただけでは役に立たない。それを適切に分析して、サービス向上につながる規則性などを見つけることが肝要だ。こうした処理を、ビッグデータ解析という。

 しかし、ビッグデータ解析には膨大な時間、あるいはコンピュータ処理能力が必要だ。とはいえ、情報量の増加に合わせて高性能なコンピュータを次々と導入するのは現実的ではない。

 そこで、ひとつの解決法として、膨大なデータを小分けして一般的な能力のパソコンやサーバーに振り分けて並行処理する技術が開発された。Hadoop もそのひとつで、オープンソース方式で公開されているため誰でも無償で利用できる。

 とはいえ、データを小分けして分散処理するといっても、現実にはさまざまな課題がある。そのため Hadoop は、小分けしたデータを管理する機能、そのための独自のファイルシステム、分析が終わったデータを統合する機能、さらに一部のコンピュータに不具合が発生してもデータを失わないように複数のコピーを用意して、トラブル発生時には自動的に別のコンピュータが作業を引き継ぐ機能などが用意されている。

 一般に Hadoop (あるいは Apache Hadoop)と呼ばれるソフトウェアは、こうした複数のプログラムの集合体となっている。

 Hadoop を使うことで、従来は何時間もかかったデータ分析が数分で終わるといった事例も報告されている。担当者が自分でデータを小分けしたり統合するといった手間もかからない。さらに、安価なコンピュータを利用できるためコスト面でも有利だし、必要に応じてコンピュータの台数を増やすこともできる。

Aの一覧に戻る

用語解説:下島 朗(株式会社エントラータ)監修

page top