Internet Watch logo
記事検索
バックナンバー
速報 マイクロソフト・プレスセミナー報告(下)
[2006/5/24]
速報 マイクロソフト・プレスセミナー報告(上)
[2006/5/23]
特別編31 JIS X 0213の改正を総括する(3)
[2006/2/14]
特別編30 JIS X 0213の改正を総括する(2)
[2006/1/12]
特別編29 JIS X 0213の改正を総括する(1)
[2005/12/26]
特別編28 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(11)
[2004/12/1]
特別編27 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(10)
[2004/11/30]
特別編26 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(9)
[2004/11/29]
特別編25 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(8)
[2004/9/16]
特別編24 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(7)
[2004/9/13]
特別編23 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(6)
[2004/6/2]
特別編22 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(5)
[2004/4/16]
特別編21 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(4)
[2004/4/12]
特別編20 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(3)
[2004/4/6]
特別編19 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(2)
[2004/4/2]
特別編18 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(1)
[2004/3/30]
バックナンバーINDEX[2000/1/19〜]
Illustation:青木光恵
小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの


特別編19
JIS X 0213の改正は、文字コードにどんな未来をもたらすか(2) 改正の概要2:JIS X 0208が改正されなかった理由

JIS文字コードにある異体字、ない異体字

 異体字とはどんなものだろう? たとえば筆者としても動向が気になる最近の吉野家だが、同社は屋号の「吉」に限り土+口(土吉)につくるが(写真1、図1)、ごく一般的な明朝体では士+口(士吉)につくる。同じことが高島屋の「高」(写真)、平凡社の「平」にも言える(写真3)。このように発音や意味は同じだが、字の形が違う漢字を異体字という。

■写真1 ■図1
吉野家初台店(東京都渋谷区)における看板の「吉」 吉野家の広告より社長直筆の「吉」(朝日新聞2004年2月13日朝刊12版10面)

■写真2 ■写真3
高島屋玉川店(東京都世田谷区)における店名表示の「高」 平凡社の本に見る自社表示の「平」(『常用字解』白川静、平凡社、2003年)

 もっとも上記の例は形の違いが少なく、一般には「同じ字」として認識されることが多い異体字だが、「竜」と「龍」、「沢」と「澤」、「坂」と「阪」などのように違いが大きく、「別の字」として区別される異体字も多い。つまり異体字といっても、大きく分けると同じ字とされるものと別の字とされるものの2つがある[*1]。もっともこの両者の境界線は、使う人によって違うのはもちろん、語の内容や、記される媒体によっても変わる、きわめて流動的なものだ。

 たとえば前述の「吉」の字だ。JIS X 0208では「吉」は21区40点に収録するが、土吉と士吉を区別しない。しかし、朝日新聞は数年前から固有名詞の「吉野家」に限っては土吉で表記する方針をとっているようだ[*2]。一方、スポーツニッポンを除いた圧倒的多数の全国紙は士吉を使う(図2)。しかし、今後も朝日新聞やスポーツニッポンの方針に続くところがないとは限らず、新聞における吉野家の土吉と士吉の境界線は揺れていると言える。

■図2
(左から)朝日新聞2004年3月2日朝刊12版10面、読売新聞2月12日14版39面、産経新聞2月12日15版30面、東京新聞2月12日12版26面、日本経済新聞2月12日14版1面、(右側上から)毎日新聞2月12日14版1面、日刊スポーツ2月12日7版23面、スポーツニッポン2月12日11版20面


私たちは細かな形の違いを無視して、1つの文字と認識している

 あるいは書体によって形が変わる場合もある。いい例がしんにょうだ。図3を見てもらおう。

■図3
明朝体のしんにょう(左)と楷書体のしんにょう(右)

 パソコンや印刷物で使われる活字体では左図のように単純化されるが、手書きの筆写体ではこれと同じに書く人はおらず[*3]、右図のように屈折して書く。そしてたいていの人はこのように並べて初めて「あ、違う」と気付く。つまり私たちは、この違いを違いとして認識せず、無意識に1つの文字として読んでいる。このように、書体の違いは形の違い、つまり異体字とは別とされる。

 もっとも、冒頭で述べた「吉」や「高」も歴史的には活字体と筆写体の違いでしかなかったのが異体字に出世した例だ。つまり書体の違いは時代により異体字の違いになりうる。

 同様の例として、一点しんにょうと二点しんにょうの違いが挙げられる。これも大ざっぱに前者は筆写体、後者は活字体という違いだったが、1949年の当用漢字字体表で一点に統一されて以来、少なくともその範囲内では、二点しんにょうは異体字となった[*4]。ところが表外漢字字体表では、当用漢字字体表/常用漢字表の方針から一転して二点を印刷標準字体[*5]とした。結果として1点と2点の使い分けは、より厳密に要請されることになったと言える[*6]

 しんにょうは部首として、非常に多くの漢字を産み出しているのだが、上記の単純・屈折、一点・二点の組み合わせにより、少なくともその4倍の字の形があり得ることになる(写真4)。ついでに言うと、文字として書体の差はよくある現象で、たとえばラテン文字「g」はローマン体とイタリック体で形に大きな違いがあるが「同じ字」だ。これは漢字の特殊な現象ではない。

■写真4
これは珍しい、手書きにおける単純・二点形のしんにょう。少しブレているのは撮影者の興奮のためか(東京都世田谷区・栄寿司)

 このようにして、点の増減、棒の長短、部分字体の組み合わせ、書体の差などによって、自明な、ただ1つの漢字と思えたものは、じつはさまざまな細かな違いを持つ、たくさんの字の形の1つに過ぎないことがわかる[*7]

 JIS X 0208/JIS X 0213では、このように字の形が違っても「同じ字」とすることを「包摂」といい、同じ字とする範囲を「包摂の範囲」というが、これは私たちが、いつも無意識に行なっている文字の認識方法にもとづいたものであることがわかるだろう(図4)。

■図4
「同じ字」とする範囲を「包摂の範囲」と呼ぶ

 上図からもわかるとおり包摂の範囲内にある形の違いとは、水玉模様のように、ひとつひとつがバラバラに独立してあるのではない。点の増減、棒の長短といった違いはデジタルで二値的なものでなく、アナログで連続的なものであることからもわかるとおり、グラデーションのようにそれぞれが連続し連関した、面的な広がりを持つと考えるべきだろう。実のところその境界線は、使う人や媒体、時代によっても違う不分明なものだ。

 ちょっと脇道にそれるが、JIS X 0208/JIS X 0213では、この広がりの中にある形のうち、どれが一番でどれが二番ということをしない。工業規格であるJISは〈一般の日本語表記などについて、何らの基準を与えるものでも、制限を与えるものでもない〉(JIS X 0208 1. 適用範囲)からだ。包摂の範囲内にある字の形に優劣はないのである。たとえそれが例示字体として掲げられているものであっても。



再び、なぜ今回の改正でJIS X 0208は変更されなかったか

 以上をふまえて改めて文字コードを定義すると、1つの包摂の範囲に対して唯一の符号を与えたもの、となるだろう。これが文字コードを考える際、すべての前提になる。ついでながら、文字に符号を与えようとする限り、範囲に大小はあっても包摂はせざるを得ない。つまり、包摂をしない文字コードは存在しない。なぜなら包摂とは、文字が文字である限り必ず持つ性質に由来するからだ。そして、文字を多く収録すればするほど、包摂の範囲は狭くなっていくのが道理だ。

 さて、前回最後で述べた、97JISが行なった「明確化」とは、この包摂範囲の面的な広がりを、JIS X 0208中の共通ルールとして明文化し(包摂規準)、収録する漢字6,355字の1字ずつについて包摂の範囲を明らかにしたことだった。そのうえで、混乱を巻き起こした1983年改正(83JIS)で変更された例示字体の数は、それまで多い人で200字以上と見る人もいたが、じつはそのほとんどが包摂の範囲内に収まってしまうことを明らかにした。

 しかし、それでも包摂できなかった変更が29字残ってしまった。つまりこの29字こそは「83JISの忘れ物」といえる。97JISでは苦肉の策として、この29字については1978年の制定時の例示字体(以下、78JIS)と83JISの字体をそれぞれA・Bのグループに分け、いずれかを選ぶことができるという「過去の規格との互換性を維持するための包摂規準」[*8](以下、互換規準)というものを設けた。

 こうして97JISは明確化により、83JISの例示字体の変更とは、包摂の範囲がどの程度変更されたことを指すのかを、きわめて具体的に浮き彫りにして見せたのである[*9]

 そして、JIS X 0208を拡張するJIS X 0213では、この29字を別の符号位置に収録して新旧JISのいずれの字体も使用可能とした[*10]。これがJIS自らによって83JISの混乱を正そうとした動きである。

 他方で、今回の改正の根拠となった表外漢字字体表は、国語施策の面から83JISの混乱を正そうとしたものだ。そこでは「83JISの忘れ物」である29字について、すべて78JISの方を印刷標準字体として収録した[*11]。これらの関係をまとめたのが下の表1だ。

■表1 表外漢字字体表とJIS X 0213における「83JISの忘れ物」29字
http://internet.watch.impress.co.jp/www/column/ogata/sp19/hyo1.htm

 見るとわかるように、29字すべてが78JISと83JISで大きく変わっており、表外漢字字体表の字体は、1978年の初版(78JIS)にごくわずかな変更を加えた1字を除いて同一であることがわかるだろう[*12]

 ここでようやく前回の疑問に戻ることができる。つまり「なぜJIS X 0208は変更されなかったか」だ。それは、簡単にいうとJIS X 0213単独ならば表外漢字字体表への対応は可能だが、JIS X 0208も一緒に対応させようとすれば、再び大混乱が起きてしまうからなのだ。

 その代表が「83JISの忘れ物」29字だ。前回の図1「JIS文字コードの関係」で説明したとおりJIS X 0213は、JIS X 0208部分とJIS X 0213拡張部分の二階建てになっている。そしてこれら29組はJIS X 0208部分に83JISの字体、JIS X 0213部分に78JISの字体が収録されている。78JISの字体とは表外漢字字体表のものとほぼ同じだから、つまりこの29字に話を限定すれば、JIS X 0213ではすでに表外漢字字体表に対応しているとすることができる。

 こういう状況の中、JIS X 0208単体で対応しようとすれば、先に説明した互換規準を廃止して78JISの字体だけにすることになる[*13]。早い話、それは83JISで変更した字体を、再度78JISの字体に戻すということに他ならない。

 一方JIS X 0213との関係では、JIS X 0208部分の字体を表外漢字字体表の字体(=78JIS字体)に変えれば、拡張部分に収録した78JISの字体と衝突してしまうため、これを83JISの字体に変更せざるを得ない。結果としてJIS X 0208部分と拡張部分の字体をそっくり入れ替えることになる。

 これについて解説「3.1.9 JIS X 0208の“過去の規格との互換性を維持するための包摂規準”に関連する28字」では以下のように言う。

これはまさに83改正の再来であって、到底受け入れられるものではない。(p.57)

 実際、今回の改正では、解説 3.1.9にあるように、この29字は変更していない。さらに解説 2.9.7「情報機器」では、以下のように言う。

仮に今JIS X 0208を改正したとして、その期間(引用者注:JIS X 0213が普及するまでの期間)に比べて著しく短い期間で新JIS X 0208が普及し、情報機器が置き換わるとは到底考えられない。それどころか、機器製造業者の努力が、改正JIS X 0208への対応とこの規格の実装(UCSの符号化によるものも含む。)とに分散されることによる開発完了時期の一層の遅延や、過渡期における異なる規格を実装した機器が混在することによる混乱及び不具合が、一層増すことも考えられる。

 このような理由から、この点に関して、JIS X 0208を併せて改正することは、状況を悪化させることはあっても、何ら規格利用者の利益にならないと考え、JIS X 0208は改正しないことが妥当と判断した。(p.47)

 名を捨てて実をとる。つまり、確かにJIS X 0208は日本でもっともポピュラーな文字コード規格だ。しかし、現実には表外漢字字体表に対応するためにJIS X 0208/JIS X 0213を同時に改正しても、多くの人が困るだけ。一方で実装は符号化方法をJIS X 0221≒Unicode、文字セットをJIS X 0213とする方向に向かっている。ならば、たとえ現在ほとんどの情報機器で共通に利用できるのはJIS X 0208の文字セットだけという状況であっても、ユーザーにはJIS X 0208の文字セットで表外漢字字体表を使うことはあきらめ、新しいJIS X 0213の方を使ってもらおう。新JCS委員会はそういう現実的な選択をした。(つづく)


[*1]……ここでは異体字の種類をごく大ざっぱにしか説明していない。詳しくは『現代日本の異体字――漢字環境学序説』(笹原宏之・横山詔一他、2003年、三省堂)などを参照。同書は78JISと83JISの異体字のうち、どちらが統計的に好まれるか、そしてその理由はといった興味深い分析も試みており、関心の深い向きには必読の好著だ。
[*2]……朝日新聞社の「表記の基準」には「漢字の字体」の項で、使用する漢字の字体は常用漢字表、人名用漢字別表の通用字体とし、固有名詞であっても異体字はこれらの字体に置き換えるとしているが、例外として〈ただし、人名(学校名、会社名)で本人から強い希望があった場合はこの限りではない。〉とある(『朝日新聞の用語の手引き』2002年、同社、p.14)。してみると、吉野家から「強い希望」があったのだろうか。しかし、ほかの新聞社はなぜ士吉? なお、少なくとも1989年版『朝日新聞の用語の手引き』にはこの項が存在しない。
[*3]……以前、日本語を学習中のアメリカ人青年から日本語文のファックスを受け取った際、しんにょうが活字体のまま手書きされているのに驚いたことがある。彼はマンガで漢字を学んでいたのだ。
[*4]……ただし、一点しんにょう等の筆写体の特徴を初めて字体標準に取り入れたのは、当用漢字字体表の30年前、1919(大正8)年の『漢字整理案』にまでさかのぼる。つまり戦後の大改革は唐突に行なわれたのではなく、戦前からの紆余曲折を経たものと理解されるべきだ。なお『漢字整理案』は『国語施策沿革資料集12 漢字字体資料集(諸案集成1)』(文化庁、1996年)に収録されている。
[*5]……印刷標準字体とは、その名のとおり活字体として標準的に使われるべき字体で、明治以来、高頻度で使われている康熙字典体や俗字体、略字体を指す(1,022字)。本稿では特に断らない限り「表外漢字字体表の字体」とは、この印刷標準字体を指している。同字体表では他に簡易慣用字体として印刷標準字体と入れ替えても使用可能な俗字体・略字体を22字収録している。
[*6]……なお、表外漢字字体表では筆写体を対象としないと「はじめに」で明記していることに注意。つまり漢字を手で書く限り、表外漢字字体表は適用されるべきではない。
[*7]……ただしJIS X 0208/JIS X 0213では、ここで挙げたしんにょうでの単純・屈折のような書体の違いは包摂の対象としていない。対象とされるのは明朝体という1つの書体における部分字体の違いである。といってJIS X 0208/JIS X 0213が明朝体だけを符号化するものとはならない。「6.6.1 区点位置と字体との対応」では「備考1」としてこのように書く。〈例示字体及び包摂規準は、明朝体によって示す。これは、他の書体の利用を制限するものではなく、また書体にいかなる基準を与えるものでもない。〉
[*8]……JIS X 0208:1997規格票「6.6.4 過去の規格との互換性を維持するための包摂規準」(p.22)
[*9]……ここでは例示字体変更を俎上にのせている関係で、83JISの混乱についても、その部分だけの説明に終始してしまったが、正確には83JISでもっとも混乱を引き起こしたのは、第1水準と第2水準で符号位置を入れ替えたことだ。この非互換変更については、さすがの97JISも策の立てようがなく、そのままとせざるを得なかった。
[*10]……97JISでは互換規準により、この29字の83JIS/78JIS両者の字体を1つの符号位置に包摂する。JIS X 0213ではこの包摂を分離して、78JISの字体に新たな符号位置を与えた。これを「包摂分離」という。もっともJIS X 0213で包摂範囲を変更した訳だから、JIS X 0208と完全一致しなくなる。つまり正確には、JIS X 0213はJIS X 0208の上位互換ではないどころか、むしろ非互換なのだ。これについては解説「2.9.6 この規格とJIS X 0208との関係を維持するための改正」(p.46)を参照。また本稿では「特別編21」で後述。

 ただ、このJIS X 0213での包摂分離が、何かトラブルを引き起こしたという例は聞いたことがない。文字に包摂はつきものであるけれど、文字コード規格の中でJIS X 0208/JIS X 0213ほど厳密に包摂規準を規定したものはないはずだ。83JISでは包摂基準が明確化されていなかったからこそ、あたかも互換であるかのように言って例示字体を変更できた。だからこそ97JISはその曖昧さを解消しようと苦労の末に包摂規準の明確化をした。そしてJIS X 0213はその明確化にもとづき包摂分離をしたのだが、結果として元のJIS X 0208と非互換の関係となってしまった。このあたり、私には「どないせえ言うねん」としか言いようのない悲喜劇と思える。
[*11]……ただし字体表番号980番だけは、包摂の範囲内でデザインが変更されている。これについて解説では、3.1.4(b)を参照。

 JIS X 0213面区点1-47-64(左)と980番(右)を比べると、下図のように「串」の上下の口が、前者では微妙に離れている。この違いによって表外漢字字体表の字体そのものを例示字体にしようとする今回の改正では、面区点1-47-64の従来の例示字体と980番は「違う」ということになり、結果、互換規準そのものは29字なのに、解説3.1.9では「28字」となってしまう(わかりづらいね、どうも)。

 他にも表外漢字字体表では、「どうしてこんな」というような微細な変更を行なっているが、これらの理由の1つとして学校教師からの要望によると説明されている。「これでは学校で正確な書き方を教えられない」ということだろうが、もとより表外漢字字体表は活字体を対象とするもので、学校で書き方を教える筆写体は適用範囲外。これらの微細な変更は、980番の例でもわかるとおり、表外漢字字体表をわかりにくいものにするだけだ。
■図5
JIS X 0213面区点1-47-64(左)と字体表番号980(右)の違い
[*12]……1990年におけるJIS X 0208の2度目の改正以降、JIS X 0208/JIS X 0213は『平成明朝』というフォントを例示字体に使用している。表外漢字字体表でも同じフォントを使用することにより、JIS X 0208/JIS X 0213と表外漢字字体表は、フォントごとのデザインの偏差を考慮に入れず、例示字体間の絶対的な違いを検討できる環境が整った。

 なお、平成明朝はジャストシステムのアプリケーションにバンドルされているのをはじめ、アドビシステムズ、ダイナコムウェア等から発売されている(http://www.adobe.co.jp/products/type/heisei_ot.html)。
[*13]……また、JIS X 0208は表外漢字字体表のうち字体表番号740の印刷標準字体、および994の簡易慣用字体を収録していない。一方でJIS X 0213では、それぞれ面区点1-92-80、1-86-51に収録する。これらをJIS X 0208で追加しても変更前と上位互換になるから、「83JISの忘れ物」の29字ほど厄介な問題を引き起こさない。

 しかしそういう変更をすれば、740はJIS X 0212にも収録されているため、同時にJIS X 0212をも変更する必要が生じ、改正のための作業量も改正による影響の量も増大する。また、JIS X 0208で文字を追加すれば、今まで表外漢字字体表を使わないで済ませてきた場面でも使わせる結果になりかねず、あくまで常用漢字表が日常生活に必要な文字という表外漢字字体表の趣旨と反する。よってJIS X 0208を改正しないことになった。(解説 2.9.5「JIS X 0208で不足する文字」p.45)

( 小形克宏 )
2004/4/2

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2004 impress corporation All rights reserved.