ブックタイトルTET5
- ページ
- 50/228
このページは TET5 の電子ブックに掲載されている50ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
このページは TET5 の電子ブックに掲載されている50ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
TET5
2つのクエリが実行されています:1つはテキスト内の単語PDFlibに対して、もう1つはtitleフィールド内の単語XMPに対してです。結果ページングモードを抜けて次のクエリを始められるようにする前にはqを入力する必要がある点に留意してください。Ant build.xmlファイル内のパスとファイル名はすべて、プロパティを通じて定義されています。これは、このファイルをさまざまな環境で使えるようにするためです。すなわち、プロパティ群をコマンドラインで与えることもできますし、上書きさせたいプロパティ群をファイルbuild.properties内に、あるいはプラットフォーム個別のプロパティをファイルwindows.propertiesかunix.properties内に記入することもできます。たとえば、Antを下記のように呼び出せば、/tmp下にインストールされているLucene JARファイルでサンプルを実行することができます:ant -Dlucene-core.jar=/tmp/lucene-core-x.x.x.jar -Dlucene-analyzers-common.jar=/tmp/lucene-analyzers-common-x.x.x.jar -Dlucene-queryparser.jar=/tmp/lucene-queryparserx.x.x.jarindexメタデータフィールドをインデックスLucene用TETコネクタは以下のメタデータフィールドをインデックスします:> path(StringField):文書のパス名> modified(DateLongField):最終更新日(PDFメタデータからではなくPDFファイルのタイムスタンプから採られます)> contents(ReaderTextField):文書の全テキスト内容> Title・Subject・Author等、定義済み・カスタムのPDF文書情報項目すべて。文書情報項目は、TETに内蔵されているpCOSインタフェースで取得することができます(pCOSについて詳しくはpCOSパスリファレンスを参照してください)。たとえばString objType = tet.pcos_get_string(tetHandle, "type:/Info/Subject");if (!objType.equals("null")) {doc.add(new TextField("summary",tet.pcos_get_string(tetHandle, "/Info/Subject"),Field.Store.YES));}> font:PDF文書内のすべてのフォントの名前PdfDocument.java内で、インデックスする文書情報項目のセットを変更、あるいはpCOSに基づいて情報を追加することによって、メタデータフィールドをカスタマイズすることも可能です。PDFファイル添付Lucene用TETコネクタは、文書内のすべてのPDFファイル添付を再帰的に処理し、各添付のテキストとメタデータをインデックスできるようLucene検索エンジンに与えます。これによって、検索テキストがメイン文書内になく添付内にあるときでも、検索ヒットが生成されます。再帰的添付横断はとりわけ、PDFパッケージ・ポートフォリオに対して重要です。50 4章: TETコネクタ