ActiBookアプリアイコンActiBookアプリをダウンロード(無償)

  • Available on the Appstore
  • Available on the Google play

概要

TET5

PDFlib FontReporter Plugin 1でPDF文書を分析正しいUnicodeマッピングテーブルを作りたいとき、それに必要な情報を得るには、問題を含むそのPDF文書を分析しなければなりません。PDFlib GmbHはこうした場面で役立つTETの無償派生製品PDFlib FontReporterを提供しています。これは、フォント・エンコーディング・グリフの情報を簡単に収集できるAdobe Acrobatプラグインです。このプラグインは、実際の各グリフに以下の情報を付した詳しいフォントレポートを作成します。>その対応するコード:16進の1桁目が左端の列に示され、16進の2桁目が上端の行に示されます。CIDフォントの場合はヘッダに印字されるオフセットを加えると、グリフに対応するコードが得られます。>そのグリフ名:もしあれば。>そのグリフに対応する(1つないし複数の)Unicode値(Acrobatがそれを決定できる場合)。こうしたさまざまな情報は、TETのグリフマッピング制御に対して重要な役割を演じます。あるフォントレポートの一例から2つのページを抜き出して図7.2に示します。FontReporter Pluginによって作成されたフォントレポートを利用すれば、PDFフォントを分析し、ひいてはTETがテキストを正しく抽出できるようにマッピングテーブルを作ることが可能です。TETのテキスト抽出を制御するためにUnicodeマッピングテーブルやグリフ名ヒューリスティックスを書こうと思うならば、それに対応するフォントレポートに目を通しておくことを強く推奨します。1. PDFlib FontReporter Pluginはwww.pdflib.com/products/fontreporterから無償ダウンロード可能です。116 7章:高度なUnicode処理