統合基盤ソフトウェアの Talend は、統合データツールの最新版「Talend 5.4」を OSS として提供を開始した。商用製品の販売開始は年内の予定。

最新版 5.4 では、Apache Hadoop での最新フレームワーク、YARN をネイティブにサポートしている。また、開発ツール「Talend Studio」の機能を拡張、MapReduce ジョブの実行パフォーマンスを本番環境で稼働させる前に、GUI で事前に最適化できるようになった。そのほか、Hadoop のセキュリティフレームワークである Kerberos 認証にも対応した。

Talend、Hadoop YARN をネイティブサポートする Talend 5.4 を OSS で
Talend Studio (開発ツール)画面

YARN(Yet Another Resource Negotiator)は、任意の分散処理フレームワークやアプリケーションを簡単に作成できる Hadoop のフレームワーク。汎用的な分散アプリケーションの開発や、分散アプリケーションからのリソース(メモリ、CPU など)要求のハンドリング、スケジュールリングを行い、実行を監督するデーモンと API を提供する。MapReduce(MRv1)と違い、MapReduce モデルに従っていないアプリケーションも実行できる。MapReduce の後継としてバイナリ互換を保持し、MapReduce 2.0(MRv2)とも呼ばれる。

大規模分散データ処理基盤 Hadoop の導入は拡大しており、今年10月には、YARN を含む追加機能を実装した Hadoop 2 がリリースされ、ビッグデータ時代のプラットフォームとして注目を集めている。

Talend は 5.4 で YARN をネイティブにサポートし、Hadoop 内で ETL(データ抽出/変換)やデータクレンジングを実行するので、YARN のリソース管理機能と Hadoop の分散処理環境のメリットを最大限に生かすことができる。

オープンソース版は、こちらから無償でダウンロードできる。

Administration Center(管理ツール)画面
Administration Center(管理ツール)画面