ブックタイトルTET5
- ページ
- 126/228
このページは TET5 の電子ブックに掲載されている126ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
このページは TET5 の電子ブックに掲載されている126ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
TET5
8.2画像を抽出8.2.1配置画像と画像リソースTETでは、配置画像と画像リソースを区別します:>配置画像は、ページ上の画像に照応します。配置画像は視覚特性群を持ちます:それは特定の位置に配置されており、寸法(ポイント・ミリメートルなど絶対単位で測られる)を持っています。多くの場合その画像はページ上で可視になっていますが、場合によっては、ページ上の他のオブジェクトによって隠されていたり、可視ページ領域の外に配置されていたり、全体的ないし部分的にクリップされていたりして、不可視になっています。配置画像はTETML内ではPlacedImageエレメントで表されています。配置画像の処理はclippingarea・excludebox・includeboxオプションに従います。>画像リソースは、実際のピクセルデータ・色空間・要素数・要素あたりビット数などを表現するリソースです。配置画像と違って、画像リソースは明示的な視覚情報を一切持ちません。ただし、幅・高さ特性(ピクセル単位で測られる)は持っています。画像リソースはそれぞれ一意なIDを持っており、それを用いてそのピクセルデータを抽出することができます。画像リソースはTETML内ではImageエレメントで表されています。画像リソースの処理はclippingarea・excludebox・includeboxオプションに従いません。1個の画像リソースが、その文書内の任意の数の配置画像の元として使われることがありえます。通常、画像リソースはそれぞれ1回だけ配置されますが、繰り返し、同一ページ上や複数ページ上に配置されることもありえます。たとえば、文書内の各ページのヘッダに繰り返し用いられる企業ロゴの画像を考えてみましょう。ページ上のロゴはそれぞれ、1個の配置画像から成っていますが、最適化されたPDFにおいては、それらの配置画像がすべて同一の画像リソースに紐付けられることが可能です。一方、最適化されていないPDFにおいては、配置ロゴはそれぞれ、同一の画像リソースの自分用の複製を元にしていることがありえます。これは見た目は同じ結果になりますが、PDF文書のファイルサイズは大きくなります。最適化されていないPDF文書は、どのページからも参照すらされていない画像リソース(すなわち未使用リソース)を含んでいることもありえます。表8.1で、配置画像と画像リソースのさまざまな特性を比較しています。文書内に画像がいくつあるかなんと、この質問には簡単な答えがありません。答えは以下の決定によって変わります:>画像リソースを数えたいか、それとも配置された画像を数えたいのか。>連結済画像の一部分としてのみ用いられている、単独では配置されていない画像を数えたいか。>マスクとしてのみ用いられている画像を数えたいか。TETとpCOS擬似オブジェクトを用いれば、これらすべての種類の画像数の答えを知ることができます。TETクックブック内のimage_countトピックでは、画像のさまざまな数え方の可能性を演示しています。それは以下のような出力を生成します:No of raw image resources before merging: 82No of placed images: 12No of images after merging (all types): 83normal images: 1artificial (merged) images: 1consumed images: 81No of relevant (normal or artificial) image resources: 2126 8章:画像抽出