ビッグデータ統合ツールを開発するTalendのデータ統合ツール製品が、米国 Cloudera の Hadoop ベース統合ビッグデータソリューション最新版「Cloudera Enterprise 5」の認定を取得した。

これを受けて、日本市場で Talend はCloudera 日本法人と、技術およびマーケティング分野で協業を開始する。

Talend の Hadoop 技術に対する取り組みには、データストアとしての Hadoop 基盤と、並列分散処理をする Hadoop 基盤の、2つがある。

ビッグデータを統合するには、基幹業務システムで運用されている構造化データ、SNS のコメントなどの非構造化データ、センサーなどが生成する M2M データ、外部機関による統計データや気象情報、交通情報などのオープンデータなど、多種多様なデータソース、データタイプをサポートしなければならない。

Talend の統合ツールは、オープンソースモデルを採用、大規模な開発コミュニティに支えられているため、500種類以上の接続コンポーネントを持ち、様々なデータソースに対応できる。そのため、既存の RDB から Hadoop プラットホームへ、あるいは Hadoop プラットホームからトランザクションシステムへと、Hadoop をひとつのデータストア(データソース)として取り扱うことができる。

また、大量データを短時間で並列分散処理する Hadoop は、今後のビッグデータ活用に有望な処理基盤だが、OSS の Apache Hadoop は、開発、運用に高度なスキルやノウハウが必要。

「Cloudera Enterprise」は、Cloudera の Hadoop 商用ディストリビューションをコアに、システム管理ツール「Cloudera Manager」、データ管理ツール「Cloudera Navigator」、テクニカルサポートサービスを一体化した、Hadoopを使いこなすためのソリューションだ。

Talend の統合ツールは、シンプルな GUI で統合コード(実行ジョブ)を生成できる。この実行ジョブは Hadoop 上でネイティブに稼働できるので、センサーやスマートメータ―などが生成する膨大なデータでも、リアルタイムに統合処理できる。

Talend 統合ツールは、「Cloudera Certified Technology」プログラムで、Hadoop と統合するための API をサポートし、Cloudera の開発ガイドラインに則していることがテストにより確認され、「Cloudera Enterprise 5」の認定テクノロジーとなった。

Cloudera Enterprise 5 の認定製品となったのは、OSS 統合ツール「Talend Open Studio for Big Data」、商用製品「Talend Enterprise Big Data」、ソリューションパッケージ「Talend Platform for Big Data」の3製品。