ExpertPDF PdfToText について

PDF文書からテキストを抽出

ExpertPDF PdfToText で、PDF 書類からテキストを抽出するためにどんな .NET アプリケーションでも利用できる、.NET用変換+抽出を提供します。インテグレーションは既存の .NET アプリケーションに対して極めて容易で、コンバータを動かすためにインストレーションは必要ありません。ExpertPDF PdfToText はPDFストリームあるいはPDFファイルからテキストを抽出して、オリジナルのPDFレイアウトを維持してテキストを抽出し、抽出されるページの範囲を指定して、 HTML 書式で抽出されたテキストをセーブして、そして記述にメタタグを加えて、パスワードで保護されたPDFドキュメントからテキストを抽出するなどさせます。

ExpertPDF PdfToText Features

  • .NET development library and C# samples
  • Extract text from a PDF stream or a PDF file
  • Extract text preserving the original PDF layout
  • Extract text in PDF reading order
  • Specify the range of pages to be extracted
  • Save the extracted text in a HTML format and add description meta tags
  • Add the title, keywords, author from PDF description in HTML meta tags
  • Mark the page breaks in the extracted text with a special character
  • Extract text from password protected PDF documents