ブックタイトルTET5
- ページ
- 14/228
このページは TET5 の電子ブックに掲載されている14ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
このページは TET5 の電子ブックに掲載されている14ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
TET5
>テキストが、ページ上の画像等何か他の要素によって隠されている場合。1.2 TETのさまざまな使用法TETは、さまざまな開発環境用のプログラミングライブラリ(コンポーネント)としても提供されますし、バッチ操作のためのコマンドラインツールとしても提供されます。両者の機能は同様ですが、それぞれ実用に適する場面が異なっています。TETライブラリとコマンドラインツールはどちらも、TETのXMLベースの出力形式であるTETMLを生成することができます。どちらのTETを選べばよいか、以下にそのガイドラインを掲げます。> TETプログラミングライブラリはデスクトップアプリケーションやサーバアプリケーションに組み込んで使うことができます。さまざまなプログラミング言語に対応しています。TETパッケージには、TETライブラリのすべての対応言語バインディングにおける使用例が同梱されています。> TETコマンドラインツールはPDF文書のバッチ処理に適しています。プログラミングは一切不要で、かわりにさまざまなコマンドラインオプションをそなえており、それを用いて複雑なワークフローでの活用が可能です。> TETML出力は、XMLベースのワークフローと、さまざまなXML処理ツールやXSLT等のXML処理言語に通じた開発者に適しています。> TETコネクタは、データベースや検索エンジン等、広く利用されているさまざまなソフトウェアパッケージにTETを統合させるために適しています。> TET Pluginは、TETを対話的に利用できるようにする、Adobe Acrobat用の無償拡張です(詳しくは47ページの4.1「Adobe Acrobat用無償TET Plugin」を参照)。1.3文書とサンプルへのロードマップTETライブラリ用ミニサンプルTETディストリビューションは、すべての対応言語バインディングのためのプログラミング作成例を含んでいます。これらのミニサンプルは、自分のアプリケーションのための出発点として利用したり、自分のTETインストレーションを試験したりするために利用できます。以下のアプリケーションのためのソースコードから成っています:> extractorサンプル:PDF文書からテキストを抽出するための基本的なループを演示しています。> image_resourcesサンプル:各ページ上の画像群を抽出して、その寸法などのプロパティについてレポートします。> image_resourcesサンプル:PDF文書から画像をリソース志向な方式(寸法情報を得ない)で抽出するための基本的なループを演示しています。> dumperサンプル:PDF文書に関する一般情報を取得するための内蔵pCOSインタフェースの使用を示しています。> fontfilterサンプル:フォント名や文字サイズといったフォント関連情報の処理方法を示しています。> glyphinfoサンプル:グリフに関する情報(フォント・サイズ・位置等)や、dropcap・shadow・hyphenationといったテキスト属性の取得方法を演示しています。テキストカラー情報にアクセスする方法も示しています。> tetmlサンプル:PDF文書からTETML(PDFの内容を表現するためのTETのXML言語)を生成するためのコードを内容としています。14 1章:はじめに