特別企画

UnicodeのWAVE DASH例示字形が、25年ぶりに修正された理由

はじめに

 2014年9月29日から10月3日にかけて、スリランカのコロンボで国際文字コード規格を審議するWG2会議が開催された。この会議において、WAVE DASH(符号位置U+301C)の例示字形を変更をする提案、文書番号「N4606」[*1](図1)が審議され、特に反対が出ないまま、無事に勧告として承認された[*2]。この勧告は、今年中ごろに発行を予定されるUnicode 8.0でも反映される予定だ。

図1 コロンボ会議に提出された「N4606」。冒頭で問題のありかを大きく図示する一方、文章は端的で短い。提案者のコミュニケーション能力が伺える。(“Proposal for the modification of the sample character layout of WAVE_DASH (U+301C)”)

 少しパソコンに詳しい人なら、WAVE DASHと聞くと「ああ、あれ」と顔をしかめるかもしれない。文字コードにはいくつか扱いが厄介な文字が存在する。WAVE DASHはその代表格だ。

 この文字には2つの問題が組み合わさって存在する。1つはシフトJISからUnicodeへの変換先が、2つありうるというマッピングの問題。具体的にはシフトJISで0x8160(JIS X 0208では1-33)をUnicodeに変換した場合、Microsoftの製品群ではU+FF5E、それ以外の多くはU+301Cと異なってしまう。しかも大半のフォントはU+FF5EとU+301Cのグリフを同一にしているので、外見からは全く判定できない。

 そしてもう1つの問題を解決しようというのがN4606だ。文書そのものはごく短いものだが、この文字の問題点とその処方箋を端的に描き出している。

We propose to change the sample character layout from the current shape to the original shape.
私たちは例示字形を現在の形状からオリジナルの形状に変更することを提案します。

The fonts used in Windows XP (e.g. MS Mincho and MS Gothic) follow Unicode’s sample character layout. However the other platform - e.g. Windows Vista and later, Mac OS X, Linux / Unix, iOS, Android, Chrome OS - already do not follow Unicode’s sample character layout, but the original layout.
Windows XPで使われるフォント(例えばMS明朝とMSゴシック)は、Unicodeの例示字形を適用していました。しかし他のプラットフォーム、例えばWindows Vistaとそれ以降、Mac OS X、Linux/Unix、iOS、Android、Chrome OSは、すでにUnicodeの例示字形を適用しておらず、オリジナルの形状になっています。

Since the support of Windows XP has been discontinued, this is a good time to change the sample character layout to the original one.
Windows XPのサポートが打ち切られたので、これはオリジナルのものに例示字形を変更する好機です。

 少し付け加えると、Unicode規格票が最初のバージョン(1991年)から日本のJIS文字コードを間違って引用してしまった。その結果、Unicodeの例示字形を実装したMicrosoftと、JIS文字コードの例示字形を実装した大多数のメーカーとの間で、互いに反対向き(正確には線対称)のグリフを実装する状況が続いた(図2)。Microsoftは2006年発売のWindows Vistaでグリフを修整したが、今でも古いMS明朝・MSゴシックのWAVE DASHを見ることがある。

図2 Windows Vista以前と以後のMS明朝、及びそれ以外のフォントの形状

 コロンボ会議に提出された「N4606」により、四半世紀もの時を経て、ようやくこの問題は解決に向かうことになった。

修正提案を出した日本人エンジニア

 このN4606の筆者が、Google日本語入力のエンジニアとして知られる小松弘幸だ。彼はどういう理由でこのような提案をすることにしたのだろう。

「すいません、あまり深い理由はないんですよ。」

 そういって小松は照れたように笑った。その物腰は鋭さよりも柔らかさ、落ち着きを感じさせる。

「きっかけは2つありました。Googleにはマーク・デイビスというUnicodeコンソーシアムの共同創設者が国際化エンジニアとして在籍してます。それからもう1人、絵文字をUnicodeに提案した桃井勝彦。去年この2人と同じ部署に異動したんです。彼等と話し合う機会が増えて、あ、Unicodeやっている人達がこんなに身近にいるんだなあという環境に変わったのが1つ目。」

 マーク・デイビスは、今も先頭に立ってUnicodeを牽引するカリスマエンジニア。例えば絵文字の実装指針を定めた文書UTR #51 “Unicode Emoji”[*3]も、彼が著者の1人だ。

「それからもう1つ、去年の夏ごろ、SlideShareで『全角チルダ問題』というスライドが話題になったんです[*4]。これはあるエンジニアが、同一のグリフが割り当てられている全角チルダ(U+FF5E, FULLWIDTH TILDE)とWAVE DASHの扱いに苦労させられた報告なんですが、それを見て、間違っているんなら直せばいいじゃん、と。」

 それで提案書を書こうと思った?

「はい。まずマーク・デイビスと桃井に聞いてみたんですね、こういう提案をしようと思うんだけど、どう思いますかと。2人とも間違ったままの例示字形が残っているということは、何か深い理由があるのかもしれない。けれど出すのは出してみたらと、まあ背中を押していただいた。それで具体的な日付を出して、この日に会議があるから、それまでに書けば持っていけるよって言っていただいて、じゃあ書きますと。」

 これが冒頭で紹介したISO/IEC 10646(詳しくは後述)を審議するWG2のコロンボ会議(2014年9月29日~10月3日開催)だ。そこでの勧告後、小松の提案は2週間後にアメリカ、ワシントン州で開催された第140回UTC(Unicode Technical Committee/年4回開催される規格についての意志決定会議)であらためて提案、審議される。公開されている議事録によると、賛成5(Adobe, Apple, Google, IBM, Microsoft)、反対0、保留3で可決、正式にUnicde 8.0に反映させるための手続きが開始されることになった[*5]

 それにしても、軽いノリなのに驚かされる。じつは取材前までは、長年WAVE DASHに悩まされてきた思いがあったのかと勝手に想像していたのだ。

「すいません、そういうのじゃないんです。個人的には倒れている自転車を元に戻したくらいの気持ちで。」

 なるほど、どうやらWAVE DASHの問題は、Unicodeが世界中の実装を覆い、Windows XPのサポートが終了するような長い時間がたつうちに、倒れた自転車のように「通行のジャマ」程度まで影が薄くなったのだ。そこにたまたま心あるエンジニアが行き会わせ、手を差し伸べたということのようだ。

 となると問題は「誰が、いつ自転車を倒したのか」ということになる。少し時間を巻き戻して調べてみよう。

UnicodeとISO/IEC 10646の連繋

 報告の前に、3つの国際文字コード規格について説明が必要だ。まずUnicodeとISO/IEC 10646、そして後者の翻訳規格JIS X 0221。これらの規格はレパートリを同期させているが、それぞれ成り立ちや性質が異なる。そうした違いの狭間でWAVE DASHの問題が起きた。

 ISO/IEC 10646は公的機関が定める公的標準だ。政府調達でも条件にされるなど、民間の標準より何倍も権威がある。原案作成にあたっては世界各国の代表(ナショナルボディ)が集まり、投票と修正を繰り返しながら練り上げていく。権威がある分だけ動きが遅い訳だ。

 規格番号「10646」として開発が始まったのは1984年。それまであった規格の符号空間(収録可能なスペース)が7ビット(128字)や8ビット(256字)だったのに対し、10646は16ビット(65,536字)、のちには32ビット(4,294,967,296字)にまで拡張され、漢字を含む世界各国の言語を収録する規格とされた。しかし各国の意見が激しく対立、開発作業は難航する。特に議論の的となったのが文字数の多い漢字の収容方法で、日本、中国、韓国は最後まで激しく意見を戦わせている。

 一方、1980年代末から民間企業であるApple、Microsoft、IBMなどが集まり、独自に開発を始めたのがUnicodeだ。彼等は同じ業界という利害の一致しやすさを生かし、例えば文字数の多い漢字については字形の違いが少ないものは統合するというように、割り切ったアイデアにより開発を進めていった。10646がぐずぐずしている間に、1989年に最初のドラフト、翌1990年4月にはドラフト2、そして同年12月には最終ドラフトを発行するところまで進めていった。

 そうした中、ようやくできた10646の草案が、1991年6月に行われた国際投票で否決されてしまう。この時、反対票を投じた多くの国が要求していたのが、同様な目的を持ち、着々と完成度を高めていたUnicodeとの一本化だった。こうして1991年8月ジュネーブで行われたWG2会議で、正式に10646とUnicodeとの合併が決定する。同年10月、漢字部分は先送りしたUnicode 1.0 Vol. 1が刊行される。この後、10646との一本化作業がUnicodeのメンバーも加わって進められ、同年12月に草案が完成。国際投票の結果、今度はめでたく賛成多数で可決、1993年5月に制定されたのがISO/IEC 10646-1:1993だ[*6]

 3番目の国際文字コード規格JIS X 0221は、ISO/IEC 10646と技術的な内容や様式が一致する翻訳JISとして1995年に制定された。日本はISO/IEC 10646の開発に深くかかわっており、それもあって普及を目的に翻訳出版されたものだ。日本語で書かれたJIS X 0221は、日本人にとってISO/IEC 10646に関する最も信頼できる情報源なのだ。

 ここまで3つの規格の成立を駆け足で見たが、ここで大事なのは、UnicodeとISO/IEC 10646はそれぞれ別個に開発が始まったが、やがて共通の利害を見出してレパートリを同期することにしたという歴史だ。小松の提案は、まずISO/IEC 10646の会議で審議された。そこで承認されると、今度はUTCに提案、再び審議されている。ここから分かるとおり、2つの規格は互いにチェックをし合いながら開発を進めている。Unicodeは文字の追加について、ISO/IEC 10646の承認なしに独断では進めない。

3つの国際規格におけるWAVE DASHの比較

 ではWAVE DASHに戻ろう。調べた限り、この文字を前述国際文字コード規格の中で、最も早くU+301Cに割り当てたのは、1990年12月のUnicode 最終ドラフトだ。この記述は1996年の2.0まで受け継がれている(図3)。ここでは「JIS Punctuation」(JISの記述記号)と注記しているが、これはどのJISなのか。

図3 Unicode最終ドラフト(1990年12月)からUnicode 2.0(1996年)のキャラクター・ネーム・リストにおけるU+301C WAVE DASHの示し方

 1990年12月時点における該当しそうなJIS文字コードは、JIS X 0208(当初の名前はJIS C 6226、1987年に改称)とJIS X 0212の2つだ。このうちJIS X 0208の1-33に「WAVE DASH」と大変よく似た「波ダッシュ」がある(図4)。Unicodeはこれを引用したのだろう。

図4 JIS C 6226-1978(1978年)からJIS X 0208:1990(1990年9月) 附属書1における1-33の示し方

 その上で図5をご覧いただきたい。これは前節で説明した3つの国際文字コード規格のWAVE DASH、及びこれらの引用元であるJIS X 0208「1-33 波ダッシュ」の、改訂バージョンごとの例示字形を年代順に一覧表にしたものだ。左から制定が古い順に配列してある[*7]

図5 国際文字コード規格における「U+301C WAVE DASH」と、JIS X 0208における「1-33 波ダッシュ」の例示字形一覧。水色が「上→下→上」、ピンクが「下→上→下」

 原典であるJIS X 0208が一貫して「上→下→上」であるのに対し、これを最初に引用したUnicodeは一貫して「下→上→下」にしている(MS明朝・MSゴシックは、このUnicodeの例示字形を実装したのだろう)。ただし、1999年の3.0で「下→上→下」は変わらないまま、より抑揚が強いグリフ・デザインに変更されている。

 Unicodeに次いで現れるのが1993年のISO/IEC 10646第1版だ。そしてUnicode 3.0に追随する形で、2000年から変更された同じグリフを使うようになる。

 目を惹くのは、太枠で囲ったJIS X 0201:1995(第1版)だ。原典のJIS X 0208を除けば、この版だけが「上→下→上」であること。これについては後で検討しよう。ただし2001年の第2版以降はUnicodeやISO/IEC 10646と同一のものになる。

 以上をまとめると、最初にJIS X 0208を引用したのも、最初にJIS X 0208と違った例示字形を掲載したのも、そしてそれまでの例示字形を最初に変更したのも、いずれもUnicodeである。

JIS X 0221第1版の例示字形が特異である理由

 WAVE DASHの例示字形がJIS X 0208と違ってしまったのは、どうやらUnicodeに原因がありそうだということが分かった。そこで素朴な疑問として思うのは、小松提案までなぜ四半世紀もの間、訂正の働きかけがされなかったのかということだ。しかし、結果として訂正されなかったのは確かだが、努力は続けられていた。

 それが伺えるのが前述、図5赤枠で示した1995年のJIS X 0221第1版だ。なぜ、この版だけがUnicodeとも、ISO/IEC 10646とも、そして他ならぬJIS X 0221の2版以降とも異なる例示字形を掲載したのか? これについては、第1版の解説で説明されている[*8]

4.4.3 字形・字体の変更(一部反映) 符号表に例示されている図形文字の字体や字形の変更要求が何点か出されていて、訂正が合意されている。
(1)日本の文字や図形で、明らかに誤りであるもの、極端に字形が悪いもの。
これらについては、この規格では訂正したものを使った。(P.995)

 つまり、すでにISO/IEC 10646を審議するWG2会議では訂正することが合意済みなので、原規格ではまだ変更されていないけれど、先取りして変更することにしたということだ。

 では、なぜ2001年の第2版(JIS X 0221-1:2001)で、合意されたはずの訂正がされなかったのだろう。第2版の解説を見ると第1版以降の出来事が分かる。以下に引用する部分は「3.3.8 b 波ダッシュ」として、WAVE DASH(U+301C)がJIS X 0208のどの符号と対応するかを解説した部分だ。そこで備考として、次のように追記されている。

備考 原国際規格の詳細符号表の(引用者注・WAVE DASHの)例示字形は、JIS X 0208の例示字形との相違が大きい。このため、ISO/IEC JTC1/SC2/WG2に問題提起を行い、その第25回会議で、この対応が規格の意図に一致していることを確認した。国際規格の詳細符号表の例示字形については、日本からの提案で変更の検討が行われ、いったんはJIS X 0208の例示字形に近い形に変更することで合意されたが、その後反対意見が再提出され、原国際規格の第2版の出版までに結論が出ず、第1版と同様の例示字形で示されている。この規格では、誤解を避けるため、我が国で一般的なJIS X 0208の例示字形に近い形で示している。(P.1108~P.1119)

 つまり第1版で書かれていたように、WG2会議でいったんは訂正が合意されたのだが、その後反対意見が出て合意は差し戻されたということのようだ。

規格上、例示字形は正式な規定ではない

 ただし、ここで理解不能なのは、「JIS X 0208の例示字形に近い形で示している」と書かれているのに、図5で分かるように実際にはJIS X 0208と違う形(Unicodeと同じ形)に変えられていることだ。これについて、JIS X 0221:2001の原案作成委員会で、原稿の取りまとめ役だった関口正裕委員は以下のようにコメントした。

U+301Cの例示字形については、原案作成委員会の段階では第1版と同様にISO/IEC 10646の符号表を元に、U+301Cの例示字形を差し替えることになっていました。ところが原案完成後の作業ミスにより、差し替えないまま出版されてしまったのです。出版後に気付き、正誤表の発行を検討しましたが、以下のような声があり、結局は訂正しないままになりました。

  • 規格の位置付け上、例示字形は適応範囲外。
  • 差し替えないことで正誤表が必要になるほど大きな変更ならば、そもそも国際規格との整合性の観点からは差し替えるべきでなかった。

 ここで注目するべきは、例示字形は適応範囲外、つまり正式な規定ではないということだ。意外にも、実際にJIS X 0221規格本文にあたってみるとその通りなのである。

図形記号は、文字の代表的な可視化表現と見なさなければならない。この規格群は、各文字の形を正確に規定しようとするものではない。文字の形は、採用するフォントのデザインに左右されるものであり、この規格群の適応範囲外とする。(17 符号表及び一覧表の構造 P.13)[*9]

 これは第2版の本文だが、現行規格まで同じ文意が継承されている。じつは文字コード一般において、文字の同定で重視されるのは例示字形ではなく文字の名前なのだ。例えば文字にどのような名前を付けるべきか、JIS X 0221(ISO/IEC 10646)は幾重にも丁寧なルールを作っている[*10]。一方で例示字形はフォントに左右される不安定な情報だからほとんど規定はない。後述するように、U+301C例示字形の引用ミスがそのままになったのも、こうした考え方が影響している可能性が強い。

WAVE DASHをめぐる修正提案の歴史

 では実際に、WAVE DASHをめぐってどのような議論があったのだろう。ISO/IEC 10646を審議するWG2会議で配布されている文書は基本的に公開されており、誰でも読むことができる。そこから当時の審議の様子をたどってみよう。

 まずWAVE DASHについて、最初の修正提案は、当時JIS X 0221の原案作成をリードしていた芝野耕司委員長による下記の2つの文書と思われる。

  • N 939 “Defects of Japanese graphic characters” Japan - K. Shibano; 1993-10-28
  • N 1014 “Defects of Japanese graphic characters (revised N 939)” Japan - K. Shibano; 1994-04-18

 ただし、これらはなぜかWG2の文書ページから消えており、後述する議事録から内容が推測できるだけだ(筆者にも問い合わせてみたが見つからないとのことだった)。先のJIS X 0221解説では、これらの文書によって「問題提起を行い、その第25回会議で、この対応が規格の意図に一致していることを確認した」としていた。この会議は1994年4月18~22日にトルコ南西部の観光都市アンタルヤで開催されており、議事録が下記のように公開されている。

  • N1033 “Unconfirmed Minutes of ISO/IEC JTC 1/SC 2/WG 2 Meeting 25” V.S. UMAmaheswaran, Meeting Secretary; Mike Ksar, Convener, 1994-06-01 (ftp://std.dkuug.dk/ftp.anonymous/JTC1/SC2/WG2/docs/n1033.pdf)

 上記文書16ページに「All the items in N 1014 were accepted」(N1014のすべての項目は受理された)とあり、芝野委員長の修正提案が受諾されたことが分かる。ところが、この決定により規格の例示字形が修正されるはずだが、なぜか実際の規格では何の変化も見られないのは、図5で示したとおり。

Unicode役員による5年後の再検討

 その後、再びWAVE DASHを取り上げたのが、アンタルヤ会議から5年も後の1999年6月、当時Uniciodeコンソーシアムの役員を務めていたアスムス・フライタグによって提出された文書だ。前述、JIS X 0221第2版の解説にあった、いったん合意された修正が差し戻しになる原因となった「反対意見」も、この文書と考えられる。

 フライタグはこの当時、Unicode 3.0とISO/IEC 10646-1-2000(第2版)を印刷するためAFII(Association for Font Information Interchange)という団体を設立、WG2とUTCの協力を得ながら規格に収録された文字の典拠を洗い直し、フォントをデザインし直す作業をまかされていた(図5で、Unicode 3.0以降のU+301C例示字形統一も彼の仕事か)。その難事業が1文字を除いて、ようやく終了したというのが、上記文書の報告だ。そして、その1文字というのが他ならぬWAVE DASHなのだった。

 彼はWAVE DASHの典拠を検討した結果、これがもともとJIS C 6226-1978をソースとする(つまり引用ミスをした)ことを認めた上で、それでもUnicode 3.0とISO/IEC 10646(第2版)の出版にあたっては、JIS C 6226-1978例示字形と一致させないつもりだと書く。

Because of the deficient nature of the original glyph and the presence of the full width character, implementers of the standard have widely mapped x2141 to U+FF5E. Independently, both WG2 and UTC have tried to ‘correct’ the glyph for 301C.
オリジナル(引用者注:Unicode 1.0)の例示字形の不十分な性質と全角文字の存在のため、標準の実装者は、広く0x2141(引用者注:区点では1-33)をU+FF5E(引用者注:全角チルダ)に対応させました。WG2とUTCはそれぞれ、U+301C例示字形を「修正」しようと努めました。

 つまり、引用ミスも原因で、JIS X 0208の1-33に対応するのはU+301Cでなく、U+FF5Eにする実装が多い。そこでWG2とUTCは例示字形を修正しようとしている。しかし、フライタグはこうした修正には反対だという。

In AFII's opinion, and given the implementation history, at this point, the only possible resolution is to return the glyph to the shape that was shown in the original publications of both standards where it was synchronized. This avoids the problem of inadvertently re-interpreting the standard, long after it has been published.
AFIIの意見では、そして実装の歴史を考えると、ここまでで唯一の可能性がある解決案は、(引用者注:修正はせずに)UnicodeとISO/IEC 10646の最初の版で一致していた形状に例示字形を戻すことです。出版から長い時間が経過した後では、それが規格をうっかり再解釈する問題を避けることです。

 ここで、フライタグが心配した「規格をうっかり再解釈する問題」とは何だろう。思い出してほしいのだが、この当時巨大なシェアを握っていたWindows XPは、Unicodeの「下→上→下」を実装していた(前掲図2を参照)。こうした状況において規格の例示字形を変更すればどうなるか?

 これから参入するフォントベンダーは、新しい例示字形を実装するだろう。そうすればWindows XPとの間に非互換が生じてしまう。そうした実害が予想されるなら、現在の例示字形が誤った形であるとしても変えない方がいい、フライタグはそのように考えたのではないか。

 ただし、「出版から長い時間が経過した後では」という部分には違和感がある。アンタルヤ会議の決定後すぐに修正されさえすれば、「出版から長い時間」はたたなかったはずだからだ。もっとも、修正されなかった原因が分からない以上、誰の責任とも言えないのだが。

 この後、日本ナショナルボディは、2000年1月になって、“N2166 U-301C WAVE DASH” として、フライタグへの反論文書を提出[*11]、これが2000年9月19~22日にアテネで開催された第39回会議で取り上げられている。しかし議事録はごく短く、にべもないという感じで以下のように書くのみだ[*12]

To convey to Japan that the glyph change proposal in document N2166 for 301C WAVE DASH is not accepted. The glyph in the standard should be treated as a glyph variant in JIS 208 standard.
文書N2166、U+301C WAVE DASH例示字形を修正する提案は、受け入れられないことを日本に伝達する。規格の例示字形は、JIS X 0208のグリフ・バリアントとして処理されるべきだ。

 ここでいう「グリフ・バリアント」とは、前述した「例示字形はフォントのデザインで変わるもの」との考え方からでたものだろう。つまり規格の上からは「グリフ・バリアント=大きな違いのない文字」だから、特に変更の必要もないということだ。

 その後、WG2会議やUTCでは、WAVE DASHについて振り返ることのないまま時間が過ぎてゆく。そして小松提案を承認したコロンボ会議が開催されたのは、あの旧バージョンのMS明朝・MSゴシックを最後に実装したWindows XPのサポート終了日[*13]――いいかえればフライタグが心配した要因のサポート終了日――から半年たった、2014年9月のことだった。(文中敬称略)

注釈

[*1]……Hiroyuki Komatsu “Proposal for the modification of the sample character layout of WAVE_DASH (U+301C)” 2014-08-06
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n4606.pdf

[*2]……“Recommendations from WG 2 meeting 63” 2014-10-30
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n4604.pdf

[*3]……Mark Davis(Google Inc.), Peter Edberg(Apple Inc.)“UTR #51 Unicode Emoji” 2015-02-26
http://www.unicode.org/reports/tr51/

[*4]……tsudaa『全角チルダ問題』2014-07-05
http://www.slideshare.net/tsudaa/ss-36658329

[*5]……“UTC 140 Draft Minutes” 2014-10-17
http://www.unicode.org/L2/L2014/14177.htm#140-M2

[*6]……この節の国際文字コード規格の制定について、安岡孝一・安岡素子『文字符号の歴史 欧米と日本編』(2006年、共立出版)を参考にさせていただいた。

[*7]……使用した規格の一覧は下記の通り。

  • JIS C 6226-1978 情報交換用漢字符号系、1978-01-01、P.5、日本規格協会
  • JIS C 6226-1983 情報交換用漢字符号系、1983-07-01、P.5、日本規格協会
  • JIS X 0208-1990 情報交換用漢字符号、1990-09-1、P.7、日本規格協会
  • JIS X 0208:1997 7ビット及び8ビットの2バイト情報交換用符号化文字集合、1997年1月20日、P.45
  • The Unicode Consortium “Unicode 1.0 Draft Standard Final Review Document” 1990-12, P.270.
  • The Unicode Consortium “The Unicode Standard Worldwide Character Encoding Version 1.0, Volume 1” 1991-10, P.332, Massachusetts: Addision-Wesley Publishing Company.
  • The Unicode Consortium “The Unicode Standard Version 2.0” P.218, Massachusetts: Addision-Wesley Publishing Company.
  • The Unicode Consortium “The Unicode Standard Version 3.0” 2000-01, P.567, Massachusetts: Addision-Wesley Publishing Company.
  • The Unicode Consortium “The Unicode Standard Version 4.0” 2003-08, P.681, Massachusetts: Addision-Wesley Publishing Company.
  • The Unicode Consortium “The Unicode Standard, Version 5.0 Archived Code Charts” P.259 (ftp://unicode.org/Public/5.0.0/charts/CodeCharts.pdf)
  • The Unicode Consortium “The Unicode Standard, Version 6.0 Archived Code Charts” P.301 (ftp://unicode.org/Public/6.0.0/charts/CodeCharts.pdf)
  • The Unicode Consortium “The Unicode Standard, Version 7.0 Archived Code Charts” P.318 (ftp://unicode.org/Public/7.0.0/charts/CodeCharts.pdf)
  • ISO/IEC 10646-1:1993 (E) “Information technology ― Universal Multiple-Octet Coded Character Set (UCS) ―Part 1:Architecture and Basic Multilingual Plane” 1993-05-01, P.114, Geneva: ISO/IEC
  • ISO/IEC 10646-1:2000 (E) “Information technology ― Universal Multiple-Octet Coded Character Set (UCS) ―Part 1:Architecture and Basic Multilingual Plane” 2000-09-15, P.174, Geneva: ISO/IEC
  • ISO/IEC 10646-1:2003 (E) “IInformation technology ― Universal Multiple-Octet Coded Character Set (UCS)” 2003-12-15, P.218, Geneva: ISO/IEC
  • ISO/IEC 10646:2011(E) “Information technology ― Universal Coded Character Set (UCS)” 2011-03-15, P.356, Geneva: ISO/IEC
  • ISO/IEC 10646:2012(E) “Information technology ― Universal Coded Character Set (UCS)” 2012-06-01
  • ISO/IEC 10646:2014(E) “Information technology ― Universal Coded Character Set (UCS)” 2014-09-01, P.368, Geneva: ISO/IEC
  • JIS X 0221-1995 国際符号化文字集合(UCS)第1部体系及び基本多言語面、1995-01-01、P.120、日本規格協会
  • JIS X 0221-1:2001 国際符号化文字集合(UCS)第1部体系及び基本多言語面、2001-04-20、P.174、日本規格協会
  • JIS X 0221-1:2007 国際符号化文字集合(UCS)、2007-12-20、P.220、日本規格協会
  • JIS X 0221-1:2014 国際符号化文字集合(UCS)、2014-06-20、P.303、日本規格協会

[*8]……日本工業標準調査会『国際化符号化文字集合(USC)第1部体系及び基本多言語面』1995年、P.994、日本規格協会

[*9]……JIS X 0221:2014 国際符号化文字集合(UCS)、2014-06-20、P.19、日本規格協会

[*10]……JIS X 0221:1995(第1版)では附属書K。同第2版では箇条26、附属書L。同第3版では箇条28、29、附属書L。同第4版では箇条24、25、附属書Lで文字の命名方法を規定している。

[*11]……小林龍生 N2166 “U-301C WAVE DASH” 2000-01-04
ftp://std.dkuug.dk/ftp.anonymous/JTC1/SC2/WG2/docs/n2166.doc

[*12]……V.S. Umamaheswaran, Recording Secretary, and Mike Ksar, Convener “Unconfirmed Minutes of WG 2 meeting 39, Vouliagmeni, Athens, Greece” 2001-01-21
http://www.unicode.org/L2/L2001/01050-n2353.pdf

[*13]……Microsoft「Windows XP のサポートを終了させていただきました。」
http://windows.microsoft.com/ja-jp/windows/end-support-help

【追記 2015/3/9 19:10】
 本文の内容を、下記のセミナーにて発表します。お近くの方は、ぜひご参加ください。

第26回「東洋学へのコンピュータ利用」研究セミナー
http://www.kanji.zinbun.kyoto-u.ac.jp/seminars/oricom/
開催日:2015年3月20日
場 所:京都大学人文科学研究所本館1Fガラス張りセミナー室(http://www.zinbun.kyoto-u.ac.jp/access/access.htm

 なお、予稿集に掲載したテキストの修正版(本文と同文)PDFはこちら(https://dl.dropboxusercontent.com/u/794816/20150226_WAVE%20DASH_e.pdf)。

【記事訂正 2015/3/9 19:10】
 以下のように訂正します。ご指摘くださった後藤裕文さん、内田明さん(訂正1)、@wlt_lainさん、匿名希望の読者の方(訂正2)に感謝します。

訂正1

 「はじめに」の節にある以下の部分への訳文について、「オリジナル」はJIS X 0208を指すので、間違いではないかと指摘を受けました。

原文
However the other platform - e.g. Windows Vista and later, Mac OS X, Linux / Unix, iOS, Android, Chrome OS - already do not follow Unicode’s sample character layout, but the original layout.

訳文
しかし他のプラットフォーム、例えばWindows Vistaとそれ以降、Mac OS X、Linux/Unix、iOS、Android、Chrome OSは、すでにUnicodeのオリジナルの例示字形を適用していません。

 筆者に確認した上で、以下のように訂正します。

訳文
しかし他のプラットフォーム、例えばWindows Vistaとそれ以降、Mac OS X、Linux/Unix、iOS、Android、Chrome OSは、すでにUnicodeの例示字形を適用しておらず、オリジナルの形状になっています。

訂正2

 「はじめに」の節の、以下の部分が間違っていました。

誤:具体的にはシフトJISで0x8186
正:具体的にはシフトJISで0x8160

小形 克宏

文字とコンピューターのフリーライター。2001年に本誌連載「文字の海、ビットの舟」で文字の世界に漕ぎ出してから早くも15年が過ぎようとしています。知るほどに「海」の広さ深さに打ちのめされる毎日です。Twitterアカウント:@ogwata