ActiBookアプリアイコンActiBookアプリをダウンロード(無償)

  • Available on the Appstore
  • Available on the Google play

概要

TET5

10.4ページ関数C++ Java C# int open_page(int doc, int pagenumber, String optlist)Perl PHP long open_page(long pagenumber, string optlist)C int TET_open_page(TET *tet, int doc, int pagenumber, const char *optlist)内容抽出したいページを開きます。doc TET_open_document*( )で得られた有効な文書ハンドル。pagenumber開きたいページの物理的番号。最初のページをページ番号1とします。総ページ数はTET_pcos_get_number( )とpCOSパスlength:pagesで取得できます。optlist表10.10に従ってページオプション群を指定したオプションリスト。右記のオプションが使えます:clippingarea・contentanalysis・docstyle・emptycheck・excludebox・fontsizerange・granularity・ignoreartifacts・ignoreinvisibletext・imageanalysis・includebox・layers・layoutanalysis・layouteffort・structureanalysis・topdown・vectoranalysis。戻り値詳細ページのハンドル。エラーの場合には-1。-1が返された場合には、TET_get_errmsg( )を呼び出してエラーの詳細を知ることを推奨します。1個の文書内で任意の数のページを同時に開いておくことができます。同じページを異なるオプションで複数回開くこともできます。しかし、1つのページを処理している途中にオプションを変えることはできません。レイヤー定義(オプショナル内容グループ):ページ上のすべての可視レイヤーの内容がデフォルトで抽出されます。この動作はlayersオプションを用いて変えることもできます。表10.10 TET_open_page( )・TET_process_page( )のページオプション一覧オプションclippingareacontentanalysis説明(キーワード。includeboxを指定しているとこれは無視されます)テキストと画像が抽出される領域を指定します(デフォルト:cropbox):mediabox MediaBoxを用います(これは必ず存在します)cropbox CropBoxを用います(Acrobatで表示される領域です)。なければMediaBoxを用いますbleedbox BleedBoxを用います。なければCropBoxを用いますtrimbox TrimBoxを用います。なければCropBoxを用いますartbox ArtBoxを用います。なければCropBoxを用いますunlimited位置にかかわらずすべてのテキストを考慮します。(オプションリスト。granularity=glyphの場合には不可)表10.11に従った、高レベル内容分析とテキスト処理のためのサブオプション群のリスト。10.4ページ関数191