ブックタイトルTET5
- ページ
- 105/228
このページは TET5 の電子ブックに掲載されている105ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
このページは TET5 の電子ブックに掲載されている105ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
TET5
その文法は、166ページの「Unicode集合」で解説しています。表7.2さまざまなfoldオプションの例説明とオプションリスト字形統合前字形統合後1個のUnicode集合内のすべてのキャラクタを除去ISO 8859-1(Latin-1)内のキャラクタのみを出力内に保持、すなわち、基本欧文ブロック外のすべてのキャラクタを除去:fold={{[^U+0020-U+00FF] remove} default}すべての非アルファベットキャラクタ(句読点・数字など)を除去:fold={{[:Alphabetic=No:] remove} default}?U+0104?U+0037なしなし数字以外のすべてのキャラクタを除去:fold={{[^[:General_Category=Decimal_Number:]] remove} default}すべてのダーシ・約物キャラクタを除去します:fold={{[:General_Category=Dash_Punctuation:] remove} default}すべての双方向制御キャラクタを除去します:fold={{[:Bidi_Control:] remove} default}標準または表意文字異体字シーケンス(IVS)に対するすべての異体字セレクタを除去します:fold={{[[\uFE00-\uFE0F][\U000E0100-\U000E01EF]] remove} default}1個のUnicode集合内のすべてのキャラクタを別のキャラクタへ置き換え空白字形統合:Unicode空白キャラクタのすべての種類をU+0020へマップ:fold={{[:blank:] U+0020} default}ダーシ字形統合:Unicodeダーシキャラクタのすべての種類をU+002Dへマップ:fold={{[:Dash:] U+002D} default}?U+0037?U+0041?U+002DU+200E?U+2268 U+FE00?U+00A0?U+2011??U+0037なしなしなし?U+2268?U+0020?U+002Dすべての未割り当てキャラクタ(すなわち、キャラクタが割り当てられていないUnicodeコード点)をU+FFFDへマップ:fold={{[:Unassigned:] U+FFFD} default}個別のキャラクタに対して特別処理改行位置のすべてのハイフンキャラクタを温存しつつ、残りのデフォルト字形統合を保持。これらのキャラクタはTETによって内部的に識別されていますので(固定のUnicodeプロパティを持つのではなく)、この字形統合のドメインを指定するにはキーワード_dehyphenationを用います:fold={{_dehyphenation preserve} default}アラビア文字のタトウィールキャラクタ(デフォルトでは除去されます)を温存:fold={{[U+0640] preserve} default}?U+03A2?U+002D?U+0640?U+FFFD?U+002D?U+0640さまざまな約物キャラクタをおのおの対応するASCIIキャラクタへ置き換え:fold={ {[U+2018] U+0027} {[U+2019] U+0027} {[U+201C] U+0022}{[U+201D] U+0022} default}フォント独自のPUAキャラクタを処理。例:日本語の外字やロゴフォントデフォルト動作:PUAキャラクタ群をUnicode置換キャラクタU+FFFDへ置き換え:fold={{[:Private_Use:] U+FFFD} default}?U+201Ct??U+002D U+0022?U+FFFD7.3 Unicode後処理105