ActiBookアプリアイコンActiBookアプリをダウンロード(無償)

  • Available on the Appstore
  • Available on the Google play

概要

TET5

10.5テキスト・グリフ詳細抽出関数C++ Java C# String get_text(int page)Perl PHP string get_text(long page)C const char *TET_get_text(TET *tet, int page, int *len)ページの内容から、次のテキスト断片を得ます。pageTET_open_page( )で得られた有効なページハンドル。len(C言語バインディングのみ)返される文字列の長さを、TET_set_option( )のoutputformatオプションに応じて保持する変数へのポインタ:outputformat=utf8の場合、長さはUnicodeキャラクタの数として報告されます。ヌル終端文字列のバイト数(これは8ビットコードユニットの数に等しいです)はstrlen( )関数で求められます。outputformat=utf16の場合、長さは16ビットコードユニットの数として報告されます。サロゲートペアは2個のコードユニットとしてカウントされます。文字列のバイト数は2*lenです。outputformat=utf32の場合、長さは32ビットコードユニットの数として報告されます(これはUnicodeキャラクタの数に等しいです)。文字列のバイト数は4*lenです。戻り値バインディングページ上の、次のテキスト断片を内容として持つ文字列。この断片の長さは、TET_open_page( )のgranularityオプションによって決定されます。granularity=glyphの場合であっても、この文字列は複数のキャラクタを内容として持つ場合があります(99ページの7.1「Unicodeのさまざまな重要概念」を参照)。ページ上のテキストがすべて取得されていた場合には、空文字列かヌルオブジェクトが返されます(後述)。この場合には、テキストがもうない理由はページ上のエラーによるものなのか、それともページの末尾に到達したからなのかを知るために、TET_get_errnum( )を呼び出すべきです。C言語バインディング:結果は、TET_set_option( )のoutputformatオプションに従って、ヌル終端UTF-8(デフォルト)かUTF-16/UTF-32のいずれかの文字列で提供されます。i5/iSeriesとzSeriesでは、EBCDIC符号化されたUTF-8を選択することもでき、かつこれがデフォルトで有効になっています。テキストがそれ以上得られないときは、NULLポインタと*len=0が返されます。C++・COM:結果は、UTF-16形式(C++ではwstring)のUnicode文字列として提供されます。テキストがそれ以上得られないときは、空文字列が返されます。Java・.NET・Objective-C:結果は、Unicode文字列として提供されます。テキストがそれ以上得られないときは、ヌル(Objective-Cではnil)オブジェクトが返されます。Perl・PHP:結果は、TET_set_option( )のoutputformatオプションに従って、UTF-8(デフォルト)かUTF-16/UTF-32の文字列として提供されます。テキストがそれ以上得られないときは、空文字列が返されます。Python:結果は、TET_set_option( )のoutputformatオプションに従って、UTF-8(デフォルト)かUTF-16/UTF-32の文字列として提供されます。Python 3では、UTF-16/UTF-32の結果はバイト列として返されます。テキストがそれ以上得られないときは、Noneが返されます。10.5テキスト・グリフ詳細抽出関数201