Internet Watch logo
記事検索
バックナンバー
速報 マイクロソフト・プレスセミナー報告(下)
[2006/5/24]
速報 マイクロソフト・プレスセミナー報告(上)
[2006/5/23]
特別編31 JIS X 0213の改正を総括する(3)
[2006/2/14]
特別編30 JIS X 0213の改正を総括する(2)
[2006/1/12]
特別編29 JIS X 0213の改正を総括する(1)
[2005/12/26]
特別編28 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(11)
[2004/12/1]
特別編27 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(10)
[2004/11/30]
特別編26 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(9)
[2004/11/29]
特別編25 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(8)
[2004/9/16]
特別編24 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(7)
[2004/9/13]
特別編23 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(6)
[2004/6/2]
特別編22 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(5)
[2004/4/16]
特別編21 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(4)
[2004/4/12]
特別編20 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(3)
[2004/4/6]
特別編19 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(2)
[2004/4/2]
特別編18 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(1)
[2004/3/30]
バックナンバーINDEX[2000/1/19〜]
Illustation:青木光恵
小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの


特別編29
JIS X 0213の改正を総括する(1)
改正を繰り返した挙げ句、78JISの字体に戻ってしまったJIS文字コード

いよいよ「Windows Vista」のリリースが視野に

 前回、特別編28を公開したのが2004年12月。なんと1年も空いてしまった。読者の皆さん、そして取材に応じていただいた各社の皆さんに、私の怠慢を深くお詫びしたい。そうこうしている間に、これまで「Longhorn」として知られていたマイクロソフトの新OS名を「Windows Vista」とすること、そしてそこに全く新しいフォント「メイリオ」を搭載することが発表された(このフォントについて、私は特別編23で「MEIRYO」として、本田雅一氏の原稿[*1]を引用する形でお伝えした)。

 マイクロソフトのニュースリリース[*2]を読むと、Windows Vistaの特徴として改正JIS X 0213に対応し、印刷標準字体が採用されていることが謳われている。今までこの連載で考え続けてきた問題が、いよいよ現実のものになろうとしている。

 前回まで、改正JIS X 0213への対応のために、フォントの文字の形を変更するマイクロソフト(特別編23)、それに対して、改正前の例示字体にもとづいた形のままで「すでに改正JIS X 0213には対応済み」とするアップルコンピュータ(特別編26特別編27特別編28)の2社について説明した。ここからはそれを踏まえつつ、両社の方針はいったい何を意味するのか、そして我々の生活にJIS X 0213の改正はどのようなインパクトを与え得るのか、最新の情報を交えつつ、掘り下げて考えてみたい。


改正JIS X 0213の要点は?

 最初に復習から始めよう。JIS X 0213は日本の文字コードとして基幹となる重要な規格だ。従来まではJIS X 0208[*3]という規格が、長らくデファクトスタンダードであった符号化方法シフトJISに、キャラクターセット(文字集合)を提供する形で文字コード規格の中心の座を占めていたが、より新しいUnicodeが符号化方法の主流になるとともに、JIS X 0208に代わる存在となった。JIS X 0213はそのままJIS X 0208を内包する部分(第1、第2水準)と、これを拡張する部分(第3、第4水準)とに分かれる。従って以下に述べるようなJIS X 0208の矛盾も、そのまま受け継ぐことになった。JIS X 0213は2000年に制定され、4年後の2004年に改正されている。Windows Vistaに実装されるのは、この改正版だ。

 ではそのJIS X 0213の改正について。ここでは10字が追加(特別編21特別編22参照)、その他に168字の例示字体が変更されている(特別編20参照)[*4]。このように書くと大きな変更のようにも思えてくるが、実際はそれほどでもない。いまだに誤解が多いが、もともと文字コード規格とは具体的な文字の形を規定するものではない[*5]。そこで規定されているのは、社会で「同じ字」とされる範囲=包摂の範囲(特別編28図2参照)と符号位置との対応付けだ。だから規格の本質は例示されている字体ではなく、包摂の範囲にこそある。しかし今回の改正によって包摂範囲が変更されたのは、基本的には追加10字に関わる部分だ。その意味では変更の幅は少ないと言ってよい。

 規格の本質である包摂範囲を変更した規格は、厳密には変更前と非互換の関係になる。かつて1983年のJIS X 0208改正(以下、83JIS)では、1981年の常用漢字表制定に合わせ、そこで定められた簡易な略字体に合わせること等を目的に[*6]、符号位置の入れ替えなど非互換な変更が大量に行なわれた。そしてこれにより、折りから普及期を迎えていたパソコンの世界で、メーカーごとにフォントの字体が変わってしまうという混乱が起きてしまった。

 しかし、今回の改正での非互換変更は入れ替えではなく単純な追加であり、追加に関わる部分以外の互換性は保たれている。もしも旧規格の実装との間で情報交換したとしても、追加10字以外の互換性は確保されるわけだ(これを上位互換と呼ぶ)。追加は新字種ではなく既収録の異体字で、文字数も10字と比較的少ない。従って現実にはこの部分での混乱は起きないと考えられる。

 2004年のJIS改正について、世間の関心は高いと言えないように感じるが、それも新旧の違いがあまり感じられないところによるのではないか。ただし、本当にこのJIS改正が混乱を引き起こさないかというと、そう簡単には済まない。心配されるのは、厳密には非互換変更になる10字追加の部分ではなく、皮肉なことに規格の本質から見れば、わずかな変更であるはずの例示字体を変えた部分だ。どういうことだろう? 改正の前後でフォントに収録された文字の形は、以下の2つの実装に分かれるはずだ。

 A)改正後の例示字体にもとづいた形
 B)改正前の例示字体にもとづいた形

 ところが改正したにもかかわらず、AとBのいずれも改正JIS X 0213に適合してしまう。なぜならどちらも規格上は包摂の範囲に収まるからだ。前述したように文字コード規格は包摂範囲は規定しても、文字の形は規定しない。例示字体はあくまで「例示」にすぎない。従って、追加10字を正しい符号位置に収録しさえすれば、A、Bいずれの形を収録しようとも改正JIS X 0213に適合するというわけだ(それぞれの具体的な文字の形は後述するリスト「JIS X 0213 改正の前後、及びJIS C 6226-1978(78JIS)、各例示字体の比較」を参照)。

 じつを言うと、上に述べたAはWindows Vistaに搭載される新MSフォントのことだし、Bはアップルのヒラギノフォントのことだ(具体的な両社の方針は回を改めて説明)。さらに言うと、フォントのレパートリーをJIS X 0213の部分集合であるJIS X 0208に限れば、Windows Vistaより前のMSフォントを含め、現時点の日本語フォントは、ほとんどすべてBに分類される。こうしてAとBの間で包摂の範囲内、つまり字体レベルの文字化け、「字体化け」が発生することになった。


『表外漢字字体表』に対応させるためにJIS X 0213を改正

 この字体化けについては改めて検討するとして、その前に私が作った以下のリストをご覧いただこう。

■JIS X 0213 改正の前後、及びJIS C 6226-1978(78JIS)、各例示字体の比較
http://homepage.mac.com/ogwata/.Public/78_04JIS.pdf(PDF、3.41MB)

 このリストでわかるように、JIS X 0213改正後の例示字体とは、じつは78JIS(JIS X 0208の第1次規格)の例示字体とだいたい同じと言えるのだ。78JISとは漢字を符号化する文字コード規格として最初のもの。つまり私たちの国の文字コードは、後述するようなドタバタの挙げ句、スタート地点に戻ってしまったとも言える。しかも、この2004年の改正により字体化けが起きる。どうしてこんな面倒くさいことになったのだろう? 1978年から2004年まで、およそ四半世紀にわたる歴史には、いったいどんな意味があったのだろう? 思わず考え込んでしまうような事実ではある。

 私なりに思うに、JIS文字コードの歴史とは、例示字体をめぐる大いなる誤解の歴史なのかもしれない。しかし、ここで説明を急いでも誤解を重ねるだけだ。まずJIS X 0213が改正されるまでの歴史から押さえておこう。そもそもなぜ改正は必要だったのか? 少なくともJISを管轄する経済産業省の意図は、『文字コード規格の見直しについて』[*7]という文書に明らかだ。これは改正原案を審議する新JCS委員会発足にあたり同省が配布した文書。

 この文書を読むと、『表外漢字字体表』[*8]にJISを対応させようとしたこと、そしてこれは、文部科学省の諮問機関である国語審議会が2000年12月に答申したものであることがわかる。つまり、経済産業省は単独で改正しようとしたのではなく、国語施策を管轄する文部科学省との連繋プレイで改正しようとした。なぜそうしたのかは先の回で考えるが、ここでは他省庁と連繋したということを覚えておいてほしい。

 では表外漢字字体表とはどんなものなのか。まず、ここでの「表外」とは国語施策の根本である常用漢字表(1981年制定)に定められた1,945文字「以外」のことを指す(反対に常用漢字表の漢字を「表内字」とも呼ぶ)。ちなみに表外漢字字体表のもととなった使用頻度調査によれば、常用漢字だけで全体の約96%を占めるという。これに人名用漢字を加えれば、表外字の使用頻度は3%弱にとどまる。しかしこのわずか3%の中に約5,000もの漢字がひしめいている。つまり表外字は使用頻度が低く、その上字種が非常に多いという厄介な性質を持っている。そのような性質を持つ表外字だからこそ、複数の字体が乱立すれば読み書きを覚えるにも使い分けるにも大変になるだろう。そのように表外漢字字体表は言っている[*9]

 ならば、なぜ表外漢字字体表は作られたのか? その前文では、以下のように書いている。

 現時点で、国語審議会が表外漢字字体表を作成したのは、この問題が既に一般の文字生活に大きな影響を与えているだけでなく、今後予想される情報機器の一層の普及によって、表外漢字における標準字体確立の必要性がますます増大すると判断したためである。
(『表外漢字字体表』「(1)従来の漢字政策と表外漢字の字体問題」http://www.mext.go.jp/b_menu/shingi/12/kokugo/toushin/001218b.htm#1


表外漢字字体表が作られる原因となった、83JISの混乱とは何か?

 上記の「この問題」とは、前節で少しだけ述べた83JISによる混乱を指す。つまり、もともと表外漢字字体表とは、83JIS問題への対処も大きな理由の1つだった。そこで表外漢字字体表について説明を進める前に、83JISの変更とはどんなものだったか見てみよう。漢字に関する限り、そこで行なわれた変更は以下の3つに分類できる。

 a)伝統的な字体を略字体に入れ換え、入れ換えられた字を別区点に追加
  (4文字×2=全8文字)
 b)略字体と伝統的な字体の区点を入れ換えた(22文字×2=全44文字)
 c)例示字体を、主に略字体へ変更した(256文字)[*10]

 このうちaとbは言うまでもなく非互換変更だ(図1)。これらの文字の多くは形の違いがとても大きく、この変更によって別の文字に置き換わってしまったように受け取られた(実際は形は違うが発音と意味が同じ異体字で、別字ではない)。

■図1 83JISにおける入れ換え26組(本文のaとb)
http://internet.watch.impress.co.jp/www/column/ogata/sp29/83jis.pdf(PDF)

 aやbもさることながら、それ以上に混乱を巻き起こしたのがcだ。この改正以降にパソコンを販売し始めた多くのメーカー(例えばエプソン、アップル等)は、素直に上記cで変更された例示字体にもとづいてフォントの字形を設計した。しかし一方で83JISは変更前の例示字体の実装を禁止してはいない[*11]。そこで以前からパソコンを販売していたメーカー(例えばNEC、富士通等)は変更しなかった。そうして略字体の形を実装するところと、伝統的な文字の形を実装するところの2つに分かれてしまった。

 83JISの混乱とは、aやbが引き起こした文字化けだけでなく、cの変更により略字体の形が実装されるようになり、結果として伝統的な字体を使えなくなったことによる混乱という側面もある。こうしてメーカーだけでなくユーザーも規格にある例示字体に翻弄されることになった。まさにここから前述した「例示字体をめぐる大いなる誤解の歴史」は始まることになる。


83JISの混乱に対する国語審議会の回答が「印刷標準字体」

 このような混乱に対処するため、国語審議会は大規模な使用頻度調査を2回にわたって行ない、これにもとづき推奨する「印刷標準字体」というものを決めていった。使用頻度が高いものを標準にすれば社会の混乱も避けられるからだ。そこで表外漢字字体表を乱暴を承知で一言にまとめれば、以下のようになるだろう。

 表外字は、83JISの略字体ではなく印刷標準字体を使いましょう[*12]

 JIS X 0213の改正とはこの印刷標準字体を例示字体に採用するためのものだ。この印刷標準字体について、表外漢字字体表は以下のように定義する。

 明治以来、活字字体として最も普通に用いられてきた印刷文字字体であって、かつ現在においても常用漢字の字体に準じた略字体以上に高い頻度で用いられている印刷文字字体」及び「明治以来、活字字体として、康熙字典における正字体と同程度か、それ以上に用いられてきた俗字体や略字体などで、現在も康熙字典の正字体以上に使用頻度が高いと判断される印刷文字字体
(「(2)表外漢字字体表作成に当たっての基本的な考え方」『表外漢字字体表』国語審議会答申、2000年、p.2〜p.3)

 大変に回りくどい表現なので、わかりやすく言えば「表外漢字のうち最も使用頻度が高い字体」となるだろう。つまり誰かの好みなどではなく、数字の裏付けのある字体が印刷標準字体だ。そしてそれは、結果として明治以来の伝統的な字体と重なるものが多かった。ただし伝統的な字体イコール印刷標準字体ではなく、中には「讃」や「楕」等のように略字体の方が使用頻度が高く、伝統的な字体を押しのけて印刷標準字体になったものもある。

■図2
左が康煕字典に載っている伝統的な字体、右が印刷標準字

 この話にはまだ続きがある。確かに表外漢字字体表は83JISの混乱に対処するためのものだった。だがそれをしようとしたのは、なにも国語審議会/文部科学省だけではなかった。それが他ならぬJIS自身であり、そのために生まれたのが1997年、JIS X 0208の3回目の改正(97JIS)、そして表外漢字字体表に先立つことわずか11カ月前、2000年1月に制定されていたJIS X 0213だった。無視できないことには、こうした複数機関の対処が、実装にまで影を落とすことに繋がっていくのである。

[*1]……「本田雅一の週刊MOBILE通信 WinHEC配布版Longhornインストールレポート」(『PC Watch』2004年5月9日)
http://pc.watch.impress.co.jp/docs/2004/0509/mobile241.htm
[*2]……「Windowsの次期バージョンWindows Vistaにおいて日本語フォント環境を一新」(2005年7月29日)。また、メイリオのタイプフェイスについては「添付資料 メイリオのスナップショット」を参照
http://www.microsoft.com/japan/presspass/detail.aspx?newsid=2353
http://www.microsoft.com/japan/presspass/addcont.aspx?addid=666
[*3]……制定時の規格名は『JIS C 6226』だが、1987年(つまり1983年改正の4年後)に『JIS X 0208』と変更されている。ただし、この原稿ではすべてJIS X 0208に統一して呼ぶ。
[*4]……ただし、そのうち41文字は字形の違いしかない変更だ。すなわち比較的違いの大きな字体レベルの変更がされたのは127文字だ。これについては、後述するリスト「JIS X 0213 改正の前後、及びJIS C 6226-1978(78JIS)、各例示字体の比較」も参照。
[*5]……『JIS X 0208:1997』「1.適用範囲」(日本規格協会、1997年、P.1)
[*6]……〈常用漢字等の字体に準じて若干の文字の表中に用いる字形を変更した〉
(『JIS C 6226-1983』日本規格協会、1983年、p.65)

〈漢字については、昭和56年10月に、常用漢字表及び新人名用漢字別表が内閣訓令、法務省令により公示され、その観点からの見直しが必要になった。〉
(野村雅昭「JIS C 6226情報交換用漢字符号系の改正」、『情報化ジャーナル』1984年3月号、日本規格協会、p.4)

なお、ここでは詳細に触れないが、この時の改正には、常用漢字表に合わせる以外に、同じ頃に制定されたドットプリンタの印刷字形を定めるJIS C 6234(現在のJIS X 9052)に合わせるという目的もあったと上記記事にはある。
[*7]……『文字コード規格の見直しについて』(経済産業省産業技術環境局標準課情報電気標準化推進室、2001年)
http://www.jsa.or.jp/domestic/instac/committe/JCS/JCSNNP-1/JCSNNP-1-02.PDF(PDF)
[*8]……『表外漢字字体表』(2000年)
http://www.mext.go.jp/b_menu/shingi/12/kokugo/toushin/001218.htm
また、本連載の特別編10特別編11でも、表外漢字字体表について考察している。
[*9]……『表外漢字字体表』「(2)表外漢字字体表作成に当たっての基本的な考え方」
http://www.mext.go.jp/b_menu/shingi/12/kokugo/toushin/001218b.htm#1
[*10]……『JIS X 0208:1997』「附属書6 漢字の分類及び配列」において〈第2次規格で改変〉とされた「78」及び「78/4-」のマークが付けられた区点位置を数えた数字。
[*11]……83JISでは改正前の78JISと全く別の文字概念(今でいう包摂範囲と同じ)を採用してはいないと、解説で明言している。

  これに関連して注意が必要なのは、今回の改正では、主として第1水準内の常用漢字等以外の漢字の中に、表中の字形を改めたものがあることである。これは、第1水準内の常用漢字等の字形との整合を図ることを目的としたもので、別の文字概念を採用したわけではない。また、二つの水準に振り分けたもののうち、水準間で字形を入れ替えたものがあるが、これも同様の趣旨からの措置である。(『JIS C 6226-1983』「解説 3.4 漢字の異体字の取扱い」日本規格協会、p.71)


 別の文字概念を採用していないのなら、78JISをそのまま実装し続けても83JISに適合することになる。もしこの記述が本当なら、改正の必要性そのものに疑問が生じるのだが、ともあれ、このようにして78JISを実装するメーカーのパソコンと、83JISを実装するメーカーのパソコンの間で文字化けが発生し、混乱が起こることになった。これについては『JIS X 0208:1997』「解説 2.3 第2次規格」(日本規格協会、p.379)も参照のこと。
[*12]……後述するように、印刷標準字体は略字体も含まれていることに注意。これはあくまで大ざっぱな傾向を言い当てようとしたもの。

※原稿執筆にあたって作成した資料を、下記URLで公開している。よろしければ、お役立て下さい。
http://homepage.mac.com/ogwata/FileSharing13.html

( 小形克宏 )
2005/12/26
INTERNET Watch ホームページ
 Copyright (c)2005 Impress Watch Corporation, an Impress Group company. All rights reserved.