活字認識ライブラリー(日本語版)
日本語活字OCRソフトウェア開発キット。
Panasonic Solution Technologies 社の製品
2010 年より日本国内にてComponentSourceで販売中。
活字認識ライブラリーは、ソフトウェア開発者向けに提供する日本語活字OCRソフトウェア用の開発キット(SDK)です。本ライブラリーは、「日本語文字認識」、「レイアウト認識」、「表認識」の3つの機能がセットになっています。の既存ソフトウェアやシステムに本ライブラリーを組み込むことによって、手軽にOCR機能(文字認識機能)を付加することができます。また、より多くのソフトウェア開発者の方々に日本語活字OCR技術をご利用いただくために、Microsoft .NET対応アプリケーションでの利用が可能です。
基本機能
日本語文字認識
日本語文字認識機能は、ビットマップデータ内の文字画像を認識し、文字コードに変換する機能です。文字に外接する矩形の幅と高さ、最大10文字までの候補文字などの情報を取得することも可能です。
レイアウト認識
レイアウト認識機能は、ビットマップデータ内の文書画像をレイアウト認識し、領域情報を出力する機能です。文字領域(縦書き/横書きを自動判定)、表領域、図形、画像の情報を取得することも可能です。
表認識
表認識機能は、ビットマップデータ内の表画像を認識し、表構造を出力する機能です。セル単位の文字画像を認識し、文字コードに変換することも可能です。
主な特徴
低品質文字に強い日本語文字認識エンジンを搭載
認識ロジックの改良により、「取り消し線付き文字」、「下線付き文字」にも対応。「かすれ文字」、「つぶれ文字」などの低品質文字の認識精度がさらに向上しました。また、段落の先頭文字が大きくレイアウトされている「ドロップキャップ文字」認識に加え、日本語第二水準漢字(3,388文字)に完全対応しました。第二水準漢字がよく利用される人名・地名の認識精度が向上しました...