ActiBookアプリアイコンActiBookアプリをダウンロード(無償)

  • Available on the Appstore
  • Available on the Google play

概要

TET5

??7.3.2 Unicode分解分解は、1個のキャラクタを、他の1個ないし複数の等価なキャラクタ列へ置き換えます。あるUnicodeキャラクタが、他の1個ないし複数のキャラクタと実際には同じ意味でありながら、歴史的理由によりUnicode内で別々のコードを与えられているとき(多くはレガシ符号化形式との可逆のからみで)、そのUnicodeキャラクタはそのキャラクタ(群)と(互換あるいは正準)等価であるといいます。分解は情報を破壊します。これは、元のキャラクタとその等価キャラクタとの使い分けに関心がない場合には有用です。しかし使い分けに関心がある場合には、その分解は適用するべきではありません。Unicode分解に関する完全な説明は下記を参照してください:www.unicode.org/versions/Unicode8.0.0/Unicode5.2.0/ch02.pdf(section 2.12)およびwww.unicode.org/versions/Unicode8.0.0/ch03.pdf(section 3.7)注記ここで用いている「分解」という用語は、Unicode規格で定義されているものですが、実際には多くの分解は、1個のキャラクタを複数の部分へ分割するのではなく、1個のキャラクタを別の1個のキャラクタへ変換します。正準分解互いに正準等価であるキャラクタまたはキャラクタ列は、同一の抽象キャラクタを表現しており、したがって必ず同一の体裁と動作を持つべきものです。よくある例と?しては、合成済みキャラクタ(例:)と連結キャラクタ列(例:)が挙げU+00C4られます:2つの表現は互いに正準等価です。1つの表現から別の表現へ切り替えても情報は失われません。正準分解は、1つの表現を、正準表現と見なされる別の表現へ置き換えます。Unicodeコードチャート1では、正準マッピングには記号IDENTICAL TOが付けられています(キャラクタテーブルにはなし)。分解名と暗黙的に見なされます。表7.4にいくつかの例を挙げます。?U+0041 U+0308??U+00C4 U+2261表7.4正準分解:decomposeオプションのサブオプション(正準等価なキャラクタには、Unicodeコード??チャートで記号IDENTICAL TOが付けられています)U+00C4 U+2261分解名説明分解前分解後canonical 1正準分解??U+00C0U+0041 U+0300?U+F9F4?U+2126?U+3070?U+FB2F?U+6797?U+03A91.デフォルトではこの分解は、特定のキャラクタ群を温存するために、すべてのキャラクタに対しては適用されません。詳しくは、106ページの「デフォルト字形統合」を参照してください。?????U+2126 U+306F U+2126 U+306F U+3099??U+05D0 U+05B81. www.unicode.org/Public/8.0.0/charts/を参照。7.3 Unicode後処理107