ブックタイトルTET5
- ページ
- 89/228
このページは TET5 の電子ブックに掲載されている89ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
このページは TET5 の電子ブックに掲載されている89ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
TET5
いることもあるため、たとえ分解が無効化されていても、出力が表示形を含むことをTETは保証はできません。表6.3アラビア文字の表示形をdecomposeオプションで処理説明とオプションリスト分解前分解後(論理順で)語尾形・語頭形・単独形・語中形を分解:decomposeオプションなし(デフォルト)またはdecompose={final=_all medial=_all initial=_all isolated=_all}合字は、実際に合字グリフによって表されている場合にのみ分解されることに留意してください。複数の独立したグリフが用いられている場合には、それらが出力内で温存されます。?U+FEB2?U+FEB3?U+FD0E?U+FEB4?U+FEFC??U+0644 U+0627?U+0633?U+0633?U+0633 U+0631?U+0633??U+0644 U+0627???U+0644 U+0627語尾形・語頭形・単独形・語中形を温存:decompose={final=_none medial=_none initial=_none isolated=_none}またはdecompose=none?U+FEB2?U+FEB3?U+FD0E?U+FEB4?U+FEFC?U+FEB2?U+FEB3?U+FD0E?U+FEB4?U+FEFCアラビア文字のタトウィールキャラクタを除去タトウィールキャラクタU+0640(カシーダとも呼ばれます)は、単語を伸ばして行を埋めつくすようにするために頻繁に用いられます。タトウィールはそれ自体は何のテキスト情報も持ちませんので、通常これは、抽出されるテキスト内では必要ではありません。表6.4に示すように、foldオプションを用いてタトウィールキャラクタを温存することもできます(104ページの7.3.1「Unicode字形統合」を参照)。表6.4タトウィールキャラクタU+0640をfoldオプションで処理説明とオプションリスト字形統合前字形統合後アラビア文字のタトウィールキャラクタを除去:foldオプションなし(デフォルト)またはfold={{[U+0640] remove}}またはfold={default}アラビア文字のタトウィールキャラクタ(デフォルトでは除去される)を温存:fold={{[U+0640] preserve}}?U+0640?U+0640なし?U+06406.5双方向アラビア文字・ヘブライ文字テキスト89