ActiBookアプリアイコンActiBookアプリをダウンロード(無償)

  • Available on the Appstore
  • Available on the Google play

概要

TET5

データの解凍とASCIIフィルタの除去に加えて、convertオプションに従ってテキスト変換が適用される場合もあります。JPX圧縮されたストリームは以下のように扱われます:要素あたり1~8ビットの画像データは、要素あたり8ビットで返されます。要素あたり9~16ビットの画像データは、要素あたり16ビットで返されます。PDF色空間が一切存在していない場合、かつ、JPX圧縮されたストリームが内部カラーパレットを内容として持っている場合には、圧縮されていないストリームデータを返す前にこのパレットを適用することによって、レポートされている色空間と要素数にそのピクセルデータが必ず一致するようにします。なお、PDF色空間Indexedが存在している場合にはパレットは適用されません。詳細この関数は、pCOSがフルモードで動作していないときには例外を発生させます(pCOSパスリファレンス参照)。例外として、オブジェクト/Root/Metadataは制限pCOSモードでもnocopy=falseかplainmetadata=trueならば取得することができます。パスがstream型・fstream型・文字列型のいずれかのオブジェクトを指し示していない場合にも、例外が発生します。この関数は、その名前にもかかわらず、文字列型のオブジェクトを取得するために使うこともできます。オブジェクトをテキスト文字列として扱うTET_pcos_get_string( )と違って、この関数は、返されたデータに対していかなる変更をも加えません。バイナリ文字列データはPDF内でめったに用いられませんので、自動的にはきちんと検出できません。文字列オブジェクトをバイナリデータとして取得するか、それともテキストとして取得するのかを決めるのは、したがってユーザ側の役割です。バインディングCOM:多くのクライアントプログラムは、Variant型を用いてストリーム内容を保持します。COMによるJavaScriptは、返されたバリアント配列の長さを取得することを許しません(しかしこれは他の言語とCOMでは動作します)。C・C++言語バインディング:返されたデータバッファは、次にこの関数を呼び出すまで使えます。Python:結果は、8ビット文字列として返されます(Python 3:bytes)。注記この関数を利用すると、PDFに埋め込まれているフォントデータを取得することができます。ユーザは、フォントは各フォントベンダの使用許諾の対象であり、それぞれの知的所有権保有者の明示的許諾なしでは再利用してはならないという事実に留意してください。お使いのフォントベンダに連絡して、関連するライセンス契約を協議してください。表10.22 TET_pcos_get_stream( )のオプション一覧オプションconvert説明(キーワード。非対応フィルタで圧縮されているストリームに対しては無視されます)文字列またはストリーム内容が変換されるかどうかを制御します(デフォルト:none):none内容をバイナリデータとして扱い、何の変換も行いません。unicode内容をテキストデータとして(すなわち、TET_pcos_get_string( )におけるのと全く同じに)扱い、Unicodeへ正規化します。Unicode非対応言語バインディングでは、これは、データはBOMなしUTF-8形式へ変換されることを意味します。このオプションは、めったに用いられないPDF内のデータ型「テキストストリーム」(たとえばこれはJavaScriptのために用いられる場合がありますが、JavaScriptのほとんどはストリームオブジェクトでなく文字列オブジェクト内に入っています)のために必要です。216 10章: TETライブラリAPIリファレンス