ActiBookアプリアイコンActiBookアプリをダウンロード(無償)

  • Available on the Appstore
  • Available on the Google play

概要

TET5

tet --targetdir out --image --pageopt "imageanalysis={merge={disable}}" file.pdf2.3.3 TETMLを生成PDF文書file.pdfに対するTETML出力を単語モードで生成し、それをfile.tetmlに格納:tet --tetml word file.pdfTETML出力を、Optionsエレメント一切なしで生成。これは、適切な文書オプションのリストを与えることで実現できます:tet --docopt "tetml={elements={options=false}}" --tetml word file.pdfTETML出力を、すべてのグリフ情報を持った単語モードで生成し、それをfile.tetmlに格納:tet --tetml word --pageopt "tetml={glyphdetails={all}}" file.pdf画像群を抽出し、テキスト・画像情報を持ったTETMLを生成:tet --image --tetml word file.pdf画像群を抽出し、画像情報を持った、しかしテキスト情報を持たないTETMLを生成:tet --tetml image --image file.pdf下向き座標によるTETML出力を生成:tet --tetml word --pageopt "topdown={output}" file.pdf向上した表組検出によるTETML出力を生成:tet --tetml word --pageopt "vectoranalysis={structures=tables}" file.pdf2.3.4高度なオプションある種のTeX由来のPDF文書に対して、文書オプションcheckglyphlistsを与えてUnicodeマッピングを改善します:tet --docopt checkglyphlists file.pdfUnicode字形統合を適用します。たとえば空白字形統合:すべての種類のUnicode空白キャラクタをU+0020へマップします:tet --docopt "fold={{[:blank:] U+0020}}" file.pdf句読点を単語境界として無効にします:tet --pageopt "contentanalysis={punctuationbreaks=false}" file.pdf2.3コマンドラインの例23