ブックタイトルTET5
- ページ
- 107/228
このページは TET5 の電子ブックに掲載されている107ページの概要です。
10秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
このページは TET5 の電子ブックに掲載されている107ページの概要です。
10秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。
TET5
??7.3.2 Unicode分解分解は、1個のキャラクタを、他の1個ないし複数の等価なキャラクタ列へ置き換えます。あるUnicodeキャラクタが、他の1個ないし複数のキャラクタと実際には同じ意味でありながら、歴史的理由によりUnicode内で別々のコードを与えられているとき(多くはレガシ符号化形式との可逆のからみで)、そのUnicodeキャラクタはそのキャラクタ(群)と(互換あるいは正準)等価であるといいます。分解は情報を破壊します。これは、元のキャラクタとその等価キャラクタとの使い分けに関心がない場合には有用です。しかし使い分けに関心がある場合には、その分解は適用するべきではありません。Unicode分解に関する完全な説明は下記を参照してください:www.unicode.org/versions/Unicode8.0.0/Unicode5.2.0/ch02.pdf(section 2.12)およびwww.unicode.org/versions/Unicode8.0.0/ch03.pdf(section 3.7)注記ここで用いている「分解」という用語は、Unicode規格で定義されているものですが、実際には多くの分解は、1個のキャラクタを複数の部分へ分割するのではなく、1個のキャラクタを別の1個のキャラクタへ変換します。正準分解互いに正準等価であるキャラクタまたはキャラクタ列は、同一の抽象キャラクタを表現しており、したがって必ず同一の体裁と動作を持つべきものです。よくある例と?しては、合成済みキャラクタ(例:)と連結キャラクタ列(例:)が挙げU+00C4られます:2つの表現は互いに正準等価です。1つの表現から別の表現へ切り替えても情報は失われません。正準分解は、1つの表現を、正準表現と見なされる別の表現へ置き換えます。Unicodeコードチャート1では、正準マッピングには記号IDENTICAL TOが付けられています(キャラクタテーブルにはなし)。分解名