ブックタイトルTET5
- ページ
- 52/228
このページは TET5 の電子ブックに掲載されている52ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
このページは TET5 の電子ブックに掲載されている52ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
TET5
4.4 Oracle用TETコネクタOracle用TETコネクタは、TETをOracleデータベースに結合して、PDF文書をOracleTextでインデックスしクエリできるようにします。PDF文書は、データベース内のそのパス名を通じて参照することもできますし、データベース内にBLOBとして直接格納することもできます。注記暗号化文書は、特定の条件下ではshrugオプションでインデックスできます(詳しくは、63ページの5.1「暗号化PDFから内容を抽出」を参照)。これはConnectorファイル群の中で用意されますが、このオプションを手作業で有効にする必要があります。要件とインストールTETコネクタはOracle 10iとOracle 11gでテストされています。TETコネクタを利用するためには、データベースを作成する際にAL32UTF8データベース文字集合を指定する必要があります。これは、Oracle ExpressのUniversal版ではつねにそうなります(しかしWestern European版では異なります)。AL32UTF8はOracleが推奨しているデータベース文字集合であり、TETでPDF文書をインデックスする場合にも最良の動作をします。ただし、以下の方式のいずれかに従えば、他の文字集合でTETをOracleTextに接続することも可能です:> Oracle Text 11.1.0.7からは、必要な文字集合変換をデータベースが行えます。下記にあるOracle Text 11.1.0.7文書の「Using USER_FILTER with Charset and Format Columns」節を参照してください:docs.oracle.com/cd/B28359_01/text.111/b28304/cdatadic.htm#sthref497> Oracle Text 11.1.0.6までは、TETフィルタスクリプトが生成するUTF-8テキストをデータベース文字集合へ変換する必要があります。これは、文字集合変換コマンドをtetfilter.shに追加することによって実現できます:Unix:iconv(オープンソースソフトウェア)かuconv(無償のICU Unicodeライブラリに含まれています)を呼び出します。Windows:tetfilter.bat内の適切なコードページコンバータを呼び出します。Oracle用TETコネクタを活用できるようにするには、以下のようにしてTETフィルタスクリプトをOracleから利用可能にする必要があります:> TETフィルタスクリプトを、Oracleがそれを見つけることができるディレクトリへ複製:Unix:connectors/Oracle/tetfilter.shを$ORACLE_HOME/ctx/binへ複製Windows:connectors/Oracle/tetfilter.batを%ORACLE_HOME%\binへ複製> TETフィルタスクリプト(それぞれtetfilter.sh・tetfilter.bat)内のTETDIR変数が必ずTETインストレーションディレクトを指しているようにします。>必要に応じて、追加のTETオプション群を、グローバル・文書レベル・ページレベルのいずれかについてTETOPT・DOCOPT・PAGEOPT変数内で与えることもできます(オプションリストについて詳しくは、163ページの10章「TETライブラリAPIリファレンス」を参照)。これは特にTETライセンスキーを与えるために有用です。例:TETOPT="license=aaaaaaa-bbbbbb-cccccc-dddddd-eeeeee"TETライセンスキーを与えるための他の選択肢については8ページの0.2「TETライセンスキーを適用」を参照してください。Oracleユーザに権限を付与以下の例はいずれも、Oracleユーザがインデックスを作成しクエリする適切な権限を持っていることを前提としています。以下のコマンド群は、52 4章: TETコネクタ