TextPorter - Server - V4.2

by Antenna House - 製品のタイプ: コンポーネント / DLL

TextPorter - Server - V4.2 のスクリーンショット Web/Internetサーバ組込用テキスト抽出エンジン。Text Porterは、文書を作成したアプリケーションがなくても文書を直接読み込んで、テキスト文字列を抽出することが可能なほか、文書に埋め込まれたOLEオブジェクトからでもテキストを抽出することができます。また、サーバ上に組み込んでのシステム構築も可能です。社内文書のセキュリティ管理や文書サーバの検索用インデックス作成、音声ブラウザ用のテキスト作成エンジンとして様々な方面に活用できます。

¥511,875 (税込)

一般向け価格については下記に表示されています。お客様用の割引価格をご覧になるには、ログインしてください。

TextPorter V4.2 Server

カートに追加 ¥ 511,875 (税込) 1 CPUライセンス 出荷 
カートに追加 ¥ 409,500 (税込) 2-10 CPUライセンス 出荷 
カートに追加 ¥ 358,365 (税込) 11-20 CPUライセンス 出荷 
カートに追加 ¥ 307,125 (税込) 21-50 CPUライセンス 出荷 
カートに追加 ¥ 255,990 (税込) 51-100 CPUライセンス 出荷 

TextPorter V4.2 デベロッパ ライセンス

カートに追加 ¥ 204,750 (税込) 1 開発ライセンス 出荷 

すべてのご注文にて弊社標準の 契約条件および返品条件の内容が適用されます。 

一般向け価格については上記に表示されています。お客様用の割引価格をご覧になるには、ログインしてください。

V4.2で新たに抽出対象とした対応ファイルフォーマット

  • Office2007(Word2007, Excel2007, PowerPoint2007)
  • Acrobat8(PDF1.7)
  • 一太郎2007

Office2007で、対応致します拡張子は次のとおりです。

  • DOCX/DOCM/DOTX/DOTM
  • XLSX/XLSM/XLTX/XLTM
  • PPTX/PPTM/POTX/POTM/PPSX/PPSM

MS OFFICE製品、QuarkXPress、Page Makerに代表されるDTPソフト、PDFファイルなどからテキスト情報を抽出します。ワープロソフトやプレゼンテーションソフトなどで作製した様々な形式の既存ファイルからテキスト情報を抽出するソフトです。Text Porterの最大の特徴は、文書を作成したアプリケーションに関係なく、テキストの抽出ができることです。抽出機能では、ワード文書に張り付けたエクセル文書のテキストといったOLEオブジェクトにも対応しております。

その他、表はセルの内容を文章として抽出し、図形、イメージ、線画、枠、数式などは無視する。パワーポイントなどプレゼンテーションファイルからは、スライドとノートのテキストを抽出、各種設定によってタグによるスライドとノートの区別の有無も選択できます。 また"行"はワークシートの一行を文字列の一行として出力し、"列"は一行内の出力は、列の先頭から列順に出力します。HTMLやXML文書では、タグと属性以外のテキスト文字列のみを抽出できます。


主な特徴

  • ファイル識別機能
    ファイルを作成したアプリケーション名称とそのバージョンを識別します。  
  • テキスト抽出機能
    指定したファイルからアプリケーション独自の制御コードを取り除き、テキスト文字列を取り出せます。  
  • プロパティ抽出機能
    指定したファイルの持つプロパティ情報を取り出します。
  • ページ抽出機能
    指定したファイルを1ページ毎に取り出せます。プログラムは、テキスト抽出に最適化しておりコンパクトです。高速にテキスト抽出出来ます。
  • ストリーム出力機能
    テキスト抽出、プロパティ抽出、ページ抽出の出力の出力先のストリームを指定することが出来ます。

利用例

  • 文書管理ソフトウェア製品に組み込み
  • 全文検索エンジンと共にグループウェアに組み込み
  • 企業内文書管理のシステムに組み込み
  • 電子メール・サーバ製品に組み込み
  • インターネット情報検索アプリケーションに組み込み
  • イントラネット・テキスト・マイリング・サーバに組み込み
  • セキュリティ管理システムに組み込み

さまざまな文字コードに対応

  • 国際規格:ISO-10646-UCS-2、ISO-10646-UCS-4、UTF-8、UTF-16
  • 日本語:Shift_JIS、Windows31J、EUC-JP、ISO-2022-JP
  • 英 語:ISO-8859-1
  • 中国語/韓国語:GB18030、GBK、Big5、KS_C_5601_1987

対応インターペース

  • Cインターフェイスの他に、COM、Java、Perlインターフェースを提供します。

商品検索

検索したい単語を入力して下さい: