NTTデータ、米国ClouderaのHadoop製品「CDH3」の販売・サポートを開始 | RBB TODAY

NTTデータ、米国ClouderaのHadoop製品「CDH3」の販売・サポートを開始

エンタープライズ ソフトウェア・サービス

大量データや大規模分散処理のイメージ
  • 大量データや大規模分散処理のイメージ
  • NTTデータとClouderaがHadoop製品「CDH3」を提供
 NTTデータは30日、米国ClouderaのHadoop製品「Cloudera's Distribution including Apache Hadoop v3(CDH3)」の販売および本製品に対応したサポートサービスを発表した。6月2日から提供を開始する。

 「Hadoop」は、大規模データ処理を実現する、オープンソースの分散処理基盤ソフトウェア。グーグルが検索エンジン用に開発した「MapReduceフレームワーク」を参考に開発されており、大量データ整理・分析し、新しい発見を生んだり、社会をより効率化したりするソフトウェアとして注目を集めている。「CDH3」は、Hadoopおよびその拡張機能の導入を容易にするディストリビューション(配布用パッケージ)だ。

 CDH3は、従来Hadoopを用いたシステムを構築する際に手間がかかっていた、Hadoopとほかのシステムとのデータ連携を容易に実現する機能や、日々増え続ける大規模なデータに対しても素速いレスポンスが求められるWebシステムなどの構築を可能にする機能などを有している。NTTデータは、日本国内でのCDH3の販売およびサポートサービスを開始することで、同社の「BizXaaS Hadoop構築・運用ソリューション」の強化を行うのが狙いだ。

 CDH3は、前バージョンのCDH2からさらに数百のパッチ追加がなされ、商用システムで利用するための品質強化が行われた。さらに、商用システムでHadoopを活用する上で欠かせない有用な7つのソフトウェアが新たに正式パッケージとして提供される。また、「Red Hat Package Manager(RPM)」などのパッケージ管理機能を利用した導入も可能となっている。

 CDH3では、RDBMSのデータをHadoopにインポート・エクスポートするツール「Sqoop」と、様々なサーバからのログや機器が生成するデータをHadoopへ効率的に取り込むツール「Flume」、高いレスポンス性能を実現する分散型データベース「HBase」などがあらたに採用された。また、認証モデルを拡張することでHadoopに格納されるデータに対するアクセス権を、要件に応じてよりきめ細かく管理することができるようになった。さらに、Hueを利用することでコマンドラインからではなくブラウザからHadoopに対するジョブの実行やデータ操作が可能となっている。

 Hadoopは、金融業界では不正解析、取引分析、通信業界ではネットワーク分析、コンテンツサービス分析、小売業界ではロイヤリティ分析、プロモーション分析、メディア業界ではコンテンツ最適化、ページ遷移・セッション分析、Web業界ではソーシャルネットワーク分析、ページ遷移・セッション分析、政府機関ではエンティティ分析、防衛テータ分析など、あらゆる業界に対し、以前は実現が難しかった高度なデータ分析やデータ処理を実現できるとされている。

 NTTデータは、大規模データや大規模処理に対応するためにHadoopの利用を推進し、これまでに数十台~千台のサーバーで構成したHadoopシステムをユーザーに提供してきた。さらにそこで培ったHadoopの構築・運用に関するノウハウをもとに「BizXaaS Hadoop構築・運用ソリューション」を提供している。そして2010年10月に、米国Clouderaとの協業を発表し、日本およびアジア太平洋地域でのHadoopシステムの普及を目指している。
《池本淳》

関連ニュース

特集

page top