japan.internet.com
テクノロジー2012年6月8日 19:00

日本 IBM、Hadoop 連携の非構造化データ分析ソフトを発表

この記事のURLhttp://japan.internet.com/webtech/20120608/3.html
著者:japan.internet.com 編集部
国内internet.com発の記事
日本 IBM は2012年6月7日、非構造化データのテキストデータを分析するソフトウェア製品で、Hadoop と連携してソーシャルメディアの書込み数億件分を一括で分析できる「IBM Content Analytics with Enterprise Search V3.0」(ICA V3.0)を発表した。

今回のバージョンアップで、分析データの容量が拡大しただけでなく、検索機能も統合、検索結果を文脈に応じて絞り込んだり、検索結果の時系列分析、相関分析など、高度な検索ができるようになった。

ICA V3.0 は、IBM の Hadoop ソフトウェア「IBM InfoSphere BigInsights」と連携、ソーシャルメディア上の書込み数億件という大量データを一括で分析できる。

2011年10月の調査では、Twitter の言語別つぶやき件数の第2位が日本語で、1日当たりの日本語つぶやきは約2,600万件だそうだ。ICA V3.0 では、数億件規模になる1〜2週間分の日本語のつぶやきをすべて、1度で分析できる。

また、IBM 検索ソフトウェア「IBM OmniFind」を統合、新バージョンでは、単語レベルの検索でなく、文章の意味を踏まえた検索結果の絞込みや、検索結果の時系列分析、相関分析などを検索画面に表示できるようになった。

さらに、新バージョンでは、従来の11言語に加え、ロシア語、チェコ語、ヘブライ語、ポーランド語の4言語に対応、計15言語、世界の総人口の約70%の言語に対応した。製品やサービス提供に必要な市場調査や競合調査などをより広い範囲でできるようになる。

ICA ソフトウェア料金は 8,01万円(税別)(100 Processor Value Unit)から。
japan.internet.comのウエブサイトの内容は全て、国際法、日本国内法の定める著作権法並びに商標法の規定によって保護されており、その知的財産権、著作権、商標の所有者はインターネットコム株式会社、インターネットコム株式会社の関連会社または第三者にあたる権利者となっています。
本サイトの全てのコンテンツ、テキスト、グラフィック、写真、表、グラフ、音声、動画などに関して、その一部または全部を、japan.internet.comの許諾なしに、変更、複製、再出版、アップロード、掲示、転送、配布、さらには、社内LAN、メーリングリストなどにおいて共有することはできません。
ただし、コンテンツの著作権又は所有権情報を変更あるいは削除せず、利用者自身の個人的かつ非商業的な利用目的に限ってのみ、本サイトのコンテンツをプリント、ダウンロードすることは認められています。

Copyright 2014 internet.com K.K. (Japan) All Rights Reserved.