図3 文字列全体を「合成ずみの形」に揃える処理(赤線が分解・合成、黒線が不変)。ここに挙げた語の最初の文字を表現するのにUnicodeでは複数の並べ方があり得るが、ここではU+1F49とU+0301を結合させたとする(1)。U+1F49は正規等価としてU+039FとU+0314に対応付けられており、まずこれに分解される(2)。これで語全体が極限まで分解されたことになる。そこで今度はこれ以上合成できないまで合成が続けられる。(3)の段階ではまだU+1F49とU+0301が合成できる余地を残している。このような余地がなくなるまで合成は続き、最終的に(4)に至る |
Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved. |