SRA OSS 日本支社は、MS Office、OpenOffice.org、PDF などのファイルからテキストを抽出する「libTextConv」新版 V3 の販売を開始した。

libTextConv V3 では、新たに、Microsoft Visio、Lotus1-2-3、Lotus Word Pro に対応した。また、アーカイブファイルライブラリ libreadarchive が rar ファイルに対応、PHP インターフェイスに libreadarchive の API を追加した。

これで libTextConv が対応するファイルフォーマットは以下になった。

SRA OSS、MS Office からテキストを抽出する最新版 libTextConv V3 を販売
対応するファイルフォーマット

提供形式は、コマンドラインツール、C言語ライブラリ、PHP 拡張モジュールで、対応プラットフォームは、Linux、Solaris、Windows。

libTextconv は、製品や応用アプリケーションに組み込んでの利用を想定しており、libTextConv を導入することで、メールの添付ファイルの解析、ドキュメント管理システムの全文検索機能、ビッグデータ解析などの大量のデータ処理ができるようになる。

2007年の販売開始以来、トランスウエアのメールアーカイブ製品「Active! Vault」、SRA のメールアーカイブ製品「MailDepot」などに組み込まれている。

SRA OSS トップページ
SRA OSS トップページ