バックナンバーへ
このほかの連載へ
【連載】

小形克宏の「文字の海、ビットの舟」
――文字コードが私たちに問いかけるもの  

特別編13
表外漢字字体表は、JIS漢字コードをどう変えるのか?(4)
いよいよ始まった『JIS改訂の考え方公開レビュー』を解説する

       
Illustation:青木光恵

●いよいよ公開レビューがはじまった

 前回の配信以来、なんと半年近くも間があいてしまった。本業である仕事に大波がおしよせ、なかなか原稿を書く時間がみつけられず、前回以来積み残したテーマだけが店ざらしになった状態で、非常に心苦しい。

 私がもたもたしているうちにも、新JCS委員会は『表外漢字字体表』をJIS文字コードに対応させる審議を続けていた。私も原稿は書けないものの、せめて取材だけはと思い、結局は第1回以外の、ワーキンググループを含むすべての委員会を傍聴し、録音しメモをとった。
 そうして新JCS委員会は、いよいよ1月15日『JIS改訂の考え方公開レビューの御案内』(以下、「考え方」)を発表した。現在日本規格協会のウェブページで、広く意見募集をしている(http://www.jsa.or.jp/domestic/instac/revue/jcsreview.htm)。

 公開レビューの期間は1月15日から2月15日までだ。あまりにも期間は短く、そして残念ながら、世間の関心は公開レビューにあるとはいえない状況だ。
 しかし今度の公開レビューでは、JIS文字コードの追加や、例示字体の変更を提案しているのだ。これはとても重大な改正であり、今後多くの人の利害に影響するだろう。本来さまざまな立場から検討されるべき問題のはず。結論が出た後で「こんなJISはけしからん」と悪口をいっても遅すぎる。もし有効な批判をしたいなら、今しかない。

 そもそも、複雑に入り組んだJIS文字コード相互の関係が、「考え方」の理解を一層むずかしくしている。そこで今回は、微力ながら「考え方」をより正しく理解できるよう、自分なりに解説し、一人でも多くの人に応募してもらうよう原稿を書いてみようと思う。

●まず、あらためて「表外漢字字体表」とは何か?

 今回の公開レビューでは、JIS X 0213の時のように規格原案をしめさず、「考え方」を公開し、その後で規格として形を整えるという形式だ。今回公開されたものは、以前と比べてはるかに読みやすく考えやすい。これは歓迎すべき変化と私は思う。

 「考え方」でしめされている対応の目的は、「JIS文字コードを表外漢字字体表に反映させ、字体の混乱を防止すること」だ。字体の混乱の防止が、本当に可能かどうかはともかく、まず、そもそもこの『表外漢字字体表』(以下、字体表)とはなんだろうか。

 「表外漢字」とは常用漢字表が掲げる1,945文字「以外」の漢字のこと。常用漢字を指す「表内字」の対語である。
 常用漢字の字体は、比較的安定しており、混乱はない。対して表外漢字については依拠すべき基準がなく、JIS X 0208の83年改正時に省略された新字体に例示字体を変更したこともあって、混乱が指摘されてきた。
 『字体表』では、まず表外字の使用頻度調査を行ない、その結果から表外漢字の基本的な考え方として、以下のように言っている。

 基本的に印刷文字としては、従来、漢和辞典等で正字体としてきた字体によることを原則とする。(p.6)

 この「正字体」のことを字体表では「いわゆる康煕字典体」とも呼んでいるが、ともあれこれが字体表にしめされた原則なのだ。

 ところが実は、この表外漢字全体の使用頻度は、『表外漢字字体表』本文によれば、漢字全体の3~4%にすぎない(逆に言えば96~97%は常用漢字がしめている)。字体表では、この3~4%の漢字の中から、使用頻度の高いなどの理由により印刷標準字体1,022文字と、簡易慣用字体22文字をえらび、これらの拠り所として、もっとも使われている字体をしめしている。

 いってみれば表外漢字字体表にある1,022文字+22文字は、漢字全体の中の3~4%でしかない[訂正2]。過去の国語施策はすべて内閣告示訓令になっているにもかかわらず、表外漢字字体表に同様の法制化の動きは見られない。また、一般の関心もごく低いように見受けられる。つまりほとんど誰も『表外漢字字体表』のことを話題にしない。
 おそらくこうした状況は、表外漢字の使用頻度(つまり存在感)と無縁ではないのだろう。ただし、かと言って表外漢字は意味のない漢字などでは決してない。
 公用文や新聞では、原則として常用漢字だけに使用を制限している。しかし、これができるには相当な馴れが必要であり、何の気なしに文章を書けば、いつのまにか表外漢字を使っているというのがむしろ普通ではないか。「嘘」「噂」「揃」「叩」「匂」などの表外漢字がないと、まともに文章が書けないというのが実情だろう[訂正3]。「なくてはならない漢字、だけど使用頻度は数パーセント」。これが表外漢字の性格だ。表外漢字を軽んじても、反対に大きく見過ぎても正確さに欠ける。恐らくこのことが、表外漢字についての考察の出発点となるべきだろう。

●JIS文字コードとはどんなもので、どんなパソコンに使われているのか

 「考え方」で反映の対象にしている「JIS文字コード」とは、具体的には以下の規格だ。

(1) JIS X 0208:1997
(2) JIS X 0212:1990
(3) JIS X 0213:2000
(4) JIS X 0221-1:2001

 これらの規格名のうち、「:」以下は制定年をしめし、JIS X 0221-1の「-1」は第1部であることをしめす(第2部以降はまだない)。これらJIS文字コードそれぞれの関係を、図にしめしてみよう。

■図1. JIS文字コードの関係

 JIS文字コードのうち、JIS X 0208はもっとも多くのシステムに実装されており、日本語文字コードの基本中の基本だ。
 そしてJIS X 0213は、JIS X 0208に漢字4,344文字を追加したもの。JIS X 0208と一体となって使われるようにできている。つまり文字によってはJIS X 0208であり、JIS X 0213でもある文字もあるということになる。

 次に、JIS X 0212はJIS X 0208を補完する意図で、JIS X 0213よりも前に作られた規格。しかし比較的実装が少ない。ただし後述するJIS X 0221の部分集合として収録されており、その意味で存在感がある。これはそれ自身で完結しており、JIS X 0213のような二重構造はない。

 最後にJIS X 0221はISO/IEC 10646(≒Unicode)の翻訳JISだ。表題の「国際符号化文字集合」(略称/UCS)がしめすとおり、世界中の書き言葉の収録を目指している。日本語としては、前述のJIS X 0208とJIS X 0212を収録している。最近これに加えて、主要コンピュータメーカー5社のJIS外字、そしてJIS X 0213を収録する改正がなされた。このJIS X 0221は、Windows XPやMacOS Xなどに符号化方法として実装されている。ごく近い将来に主流な文字コードとなると見られているが、現在はまだまだ、実装は発展途上にある。

 さて、このようなJISと、現在主流をしめるパソコン用OSの関係を大ざっぱにまとめたのが表1だ。

■表1. JIS文字コードとOSの関係[訂正1]

●対応案の概略と各社OSの関係

 「考え方」ではJIS文字コードの対応として、次のように書いている。

 JIS X 0213又はJIS X 0221を用いた場合、表外漢字字体表に示されたすべての印刷標準字体が扱えるようにする。

 現状でJIS X 0221は表外漢字字体表すべてを含み、すでにこれは対応ずみと言うこともできる。ということはつまり、あらためての対応は主にJIS X 0213で行なうということになる。同時にこれは、現在もっとも普及している基本的なJIS文字コードであるJIS X 0208単体では、表外漢字字体表への対応は不可能ということも指している。

 つまり、「考え方」によれば、Windows MeやMacOS 9では表外漢字字体表に完全には対応できないということになる。

 ここで、もう一度表1を見直してほしい。現在主流をしめるWindows MeやWindows 98SE、そしてMacOS 9ではシフトJISを符号化方法として採用してる。この符号化方法で使用可能なJIS文字コードはJIS X 0208だけであり、つまりこれらのOSでは表外漢字字体表に完全に対応することはできない。一方で、これから主流になるであろうWindows XP、そしてMacOS XではJIS X 0221にある符号化方法を採用している。したがって、これらのOSを搭載したマシンでは、表外漢字字体表への完全な対応が可能となる。
 このようにして「考え方」の対応は、過渡期の狭間にある各社のOS状況をにらんだ、未来志向とも、綱渡りとも表現できるものとなっている。

 また、もうひとつ気をつけるべきなのは、〈すべての印刷標準字体が扱えるようにする〉というくだり。これは、印刷標準字体と簡易慣用字体を同時に使う対応はしないということを意味している。

●JIS文字コード個別の対応の概略

 それぞれの対応は以下のように分かれる。

JIS X 0208………例示字体を一部変更。包摂規準は変更なし。
JIS X 0212………追加・変更など一切なし。
JIS X 0213………例示字体を一部変更、互換漢字10文字を追加、包摂規準は変更なし。
JIS X 0221………追加・変更など一切なし。

 では次に、個別の対応案を一覧表にしてみよう。

■表2. 「考え方」にしめされたJIS文字コードの対応案

●「考え方」のポイントはここだ

 全部で9つに分かれている対応案のうち、項目番号が5.1、5.2、5.3、5.4、それに5.8と5.9は大きな問題点はないだろう。おそらく一番論議が集まるのが、5.5~5.7の計138文字だ。
 5.5でしめされた100文字は、JIS X 0208の83年改正時に新字体に変更されたものを多くふくんでいる。ざっくりした言い方をすれば、そうした新字体を、78年制定時の字体にもどしたという説明もできる。となると、今度本当に例示字体を変更されれば、二度目の変更となる。これが本当に混乱を招かないかどうか。「考え方」では、これについて「注」として、以下のように書いている。

注1. この変更に関して、一部の文字については、現行の例示字形を残すべきであるという意見が寄せられている。なお、残すべきであると言われている文字はこの分類にあるすべての文字ではない。また、JIS文字コードの例示字形を残した文字については、包摂分離を行って、JIS X 0213に文字を追加し、かつJIS X 0221(ISO/IEC 10646)にJIS互換文字を追加するという提案もある。

注2. JIS文字コードの例示字形を変更するとしたものを、JIS X 0208及びJIS X 0213の両方に適用するという意見と、JIS X 0213にのみ適用し、JIS X 0208は現行どおりで維持するという二つの意見がある。

 いずれも、審議のなかで意見が割れたことを伺う内容ではある。

 次に5.6。ここでいう三部首とは食偏、示偏、しんにゅうの3つ。字体表では現に新字体の省略された部首(「虫」の下部をもつ食偏、「ネ」ではなく「示」の示偏、一点ではなく二点しんにゅう)を使用している場合について、〈これを印刷標準字体の字形に変更することを求めるものではない。〉(p.14)としている。
 簡単に言えば「すでに新しい字体の部首で使っているなら、わざわざ変更しなくてもいいよ」と言っているわけだ。これは国語審議会の審議の中で、日本新聞協会の意見を取り入れて盛り込まれた部分だ。
 その言葉に甘えて変更せずとするのか、それとも厳密に適用して変更するのか。ここで考え方が割れることになる。

 そして5.7。これは本来は5.5と同様に例示字体を変更したいのはヤマヤマなのだが、字体表にあるのと同じものが既にJIS X 0221にあり、変更するとJIS X 0221との変換表に矛盾がでてしまう文字。
 どういうことか。過去の私の記事でも何回か説明を試みているが、現代における文字コードは、実際には何回も変換されて流通しているという状況が前提にある。文字コードの変換が正しくなされなければ、途中で文字化けをし、それがさらに変換されれば思いもしない文字がユーザーの手元に届くことになる。
 そこで求められるのは、曖昧でない完全に1対1対応の変換表が維持されることだ。しかし、この場合、字体表にあわせて例示字体を変更すれば、JIS X 0221に対応する文字が2つになり、これが矛盾をおこすことになる。
 そこで「考え方」で提示された案では、まずJIS X 0208での対応をあきらめる。これらの文字はすべて元々JIS X 0208にある文字であり、JIS X 0208を引用しているJIS X 0221そのものの改正につながるからだ。つまり国際規格ISO/IEC 10646の改正を働きかけねばならなくなり、これは国際信義上、極力したくない。
 その上でJIS X 0213の方でこの字体を追加し、上位互換を保とうというアイデアだ。最初に説明したように、JIS X 0213の中では、元々のJIS X 0208と、追加した部分の二層構造になっていることを思い出してほしい。そうして、JIS X 0213では追加前のオリジナルの字体と、追加後の字体をふたつとも利用できることになる。
 しかし、その結果として比較的よく似た字体がふたつ収録されることになり、この部分でユーザーの混乱を招くおそれがある。

●最後に

 かけ足で「考え方」の解説を試みた。あまり時間がない中で、むりやり書いたので、間違いがあるかもしれない。ミスをみつけたら、どうか編集部までメールをいただきたい(間違いの指摘でなくても、なにか感想をくれたら、とっても嬉しいのだけれど)。

 この原稿を書いている2月5日。上記の「考え方」のウェブページに「正誤表」が追加された。公開レビューの締め切り10日前というタイミングだ。しかも、これは一読すればすぐに分かる誤字が目立つ、なんともお粗末なものだ。他にも、5.1の文字数が、何度数えても815文字ではないなど、間違いが随所に目だつ。これで本当に十分な意見の応募が見込めるのだろうか。私としては、疑問に思ってしまう。
 しかし、こうした凡ミスがあったからといって、今回の公開レビューの影響力まで低く見積もってはいけないだろう。くりかえすが、一人でも多くの意見を寄せて欲しいと思う。

◆訂正履歴

[訂正1]……「表1. JIS文字コードとOSの関係」について(2002年2月7日)

表1で、Windows Me付属のフォントはJIS X 0208のみのサポートであると書いた。しかし阿南康宏(マイクロソフト)さんから「Windows MeのフォントはJIS X 0212もサポートしている」という指摘をいただいた。阿南さんの説明によれば、Windows Me内部の符号化方法として、シフトJIS以外に一部Unicode(JIS X 0221)も採用しているとのことだ。とくに文字列を描画する機構がそうだとのこと。したがって、Windows Meに搭載されているMS明朝、MSゴシックなどはJIS X 0212の文字も収録したUnicodeフォントだとのことである。ご指摘を感謝し、表1を正しいものに差し替える。

◎訂正前

◎訂正後

[訂正2]……表外漢字字体表のパーセンテージについて(2002年2月13日)

文化庁国語調査官の氏原基余司さんから、「漢字出現頻度数調査」において、表外漢字字体表1,022+22文字の中で一番頻度の低い文字でも99%を超えるという指摘をいただいた。そこで以下のように私の原稿を訂正したい。ご指摘ありがとうございました。

◎訂正前
 いってみれば表外漢字字体表にある1,022文字+22文字は、この3~4%全体の、さらに数分の一でしかない。

◎訂正後
 いってみれば表外漢字字体表にある1,022文字+22文字は、漢字全体の中の3~4%でしかない。

[訂正3]……特別編第14回の注釈[*1]を参照のこと(2002年2月13日)

(2002/2/6)

[Reported by 小形克宏]

INTERNET Watchホームページ

INTERNET Watch編集部internet-watch-info@impress.co.jp
Copyright (c) 2002 Impress Corporation All rights reserved.