INTERNET Watch Title
Click

【連載】
Illustation:青木光恵

 

小形克宏の「文字の海、ビットの舟」

――文字コードが私たちに問いかけるもの

 

特別編第7回 国語審議会への手紙・上/表外漢字字体表案に欠けている視点とは?

 

●みんなで国語審議会に意見を言おう!

 文部大臣の諮問機関である国語審議会は、常用漢字にない文字(表外漢字)を使う場合の指針となる『表外漢字字体表』について審議してきたが、さる9月29日『表外漢字字体表(案)』を発表し、同時にこれに対するパブリックコメントの募集を開始した( http://www.monbu.go.jp/pcomment/00000104/ )。

 この『表外漢字字体表』は、コンピューターが急速に普及し、常用漢字以外の文字が簡単に使えるようになった実態をうけ、〈一般の社会生活で表外漢字を使う際の、字体のよりどころを示そうとするもの〉(p.2~3)。ここでは使用頻度の高さなどから1,022文字を選び、その『印刷標準字体』と、うち22文字の『簡易慣用字体』が示されている。
 最終的な答申は、パブリックコメントで寄せられた意見を検討した後、今年12月に予定されているという。

 すでに私たちの生活にすっかり定着している常用漢字だが、そこに収録された1,945文字だけでは立ちゆかないことも、また多くの人が認めるところではないか。そういう意味では、今回の『表外漢字字体表(案)』へのパブリックコメントは、自分の文字に対する考えを行政に反映させる絶好のチャンスだと思う。
 私としては、「どうせお役所のやることだ」などと言わず(ま、気持ちはわかるけど)、一人でも多くの方にぜひ応募することをお勧めしたいと思う。なにより“多数の意見を聞こう”という行政の姿勢がうれしいではないか(ぬか喜びさせないで欲しいものです)。

 本来ここで、前回までお伝えしていた『0213の最終審査で、なにがおこったか?』の完結編となる日本IBMへの取材の結果をお伝えする予定だったが、これを変更して、私のパブリックコメントへの応募原稿となるものの原案を掲載したいと思う。この原稿は、ここで公開された後、この次からの章以降を切り取って、読者の皆さんの反応をふまえて書き直し(情けないほど私の原稿は間違いが多い)、文化庁へ送ろうと思っている。つまり、いわば“パブリックコメントのパブリックコメント”ということになる。[実際に提出されたパブリックコメントのPDFファイルはこちら(2000年11月10日リンク追加)]

 応募の期限は11月1日。それを考えればもっと早く掲載するべきだったろうが、いつもの悪い癖で、このようなギリギリのタイミングとなってしまったことをお詫びしたい(どなたか遅筆につけるお薬をください)。もちろん、1カ月も前に掲載されてなければならない原稿のインタビューである日本IBMの皆さんにもお詫びする。丁寧に取材に答えてくださって、せっかく面白い話を山盛りで聞かせてくれたのに、本当に申し訳ありません。

 では、スタートである。あ、ところでBGMは、このテーマにはこれしかないでしょう、ダンス☆マンの『漢字書けるけど読めない』。表外字体案の音訓が、あまりにも知らないものばっかりだったんで、笑っちゃいましたよ。アナタは「迄」の音読みをしってた? 部首索引をつけろっつーの。

 

●とってもうれしいパブリックコメント

 拝啓、国語審議会の皆さん。

 まずは、日本語をつかう者の一人として、今回のパブリックコメントのような機会をつくったことに、共感の拍手を送りたいと思います。寄せられた意見がどのように活用されるのか、まだ慎重に見守る必要があるとしても、ごく一部の限られた人間だけで、日本語をつかう者すべてに影響をあたえるような重要な施策が決定されるべきでないことは明白で、このようなオープンで賢明な皆さんの姿勢は、これからもぜひ継続、そして拡大されるべきと考えます。

 さて、私はこの1年間、フリーライターとして文字コードの周辺を取材してきました[*1]。コンピューターで文字を使うための仕組みの一種である文字コードを調べることで、あまりに身近すぎて、かえって姿が見えづらくなっている日本語の現在、そしてひょっとしたら未来の姿まで、うまく見出すことができるのではないか、そのように考えたのです。
 残念ながら、いくら取材してもそのようなものは見つけられず、見えたと思った背中もすぐに霧の彼方に隠れてしまう、そのような失望をあじわう毎日です。

[*1]……手前味噌ながら、インターネット上での私の原稿の掲載場所のURLを挙げておきます。もしよろしければご笑覧下さい。『小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの』( http://internet.watch.impress.co.jp/www/column/ogata/

 それはともかく、そうやって文字コードを追いかけている者の一人として、今回皆さんの手によって発表された『表外漢字字体表(案)』(以下、表外字体案)を、おもにコンピューターの実装という視点から検討してみたいと考えました。どうかお付き合い下さい。

 

●ワープロで打ち出す文字だけを考えてていいの?

 日々をパソコンのディスプレイと向きあうことで過ごしている私のような者にとって、表外字体案を読んで真っ先に浮かんだ疑問は、ここで書かれている“印刷字体”という概念とは、いったいどの範囲まで適用されるのかということでした。

 たとえば、表外字体案では以下のように書いています。

 しかし、ワープロ等の急速な普及によって、表外漢字が簡単に打ち出せるようになり、常用漢字制定時の予想を超えて、表外漢字の使用が日常化した。(p.2 前文『表外漢字の字体に関する基本的な認識』)

(前略)この問題は、(1)一般の書籍類や教科書などに用いられている「鴎」「涜」[*2]がワープロ等から打ち出せないこと、(2)仮に「鴎」と「鴎」[*3]の両字体を打ち出すことができたとしても、どちらかの字体を標準と考えるかのルールがないこと、の2点にまとめられる。(p.2 前文『表外漢字の字体に関する基本的な認識』)


[*2]……前者は「区」の中を「品」に作る「鴎」(図1)、後者はさんずいに「賣」(図2)
[*3]……前者は「鴎」(図3)、後者は「区」の中を「品」に作る「鴎」。
図1図1図1
▲図1▲図2▲図3

 まず基本的な疑問として、表外字体案でいわれる〈ワープロ等〉が、常に〈打ち出す〉、すなわち印刷機能とセットで語られていることから、ワープロ専用機のことが念頭におかれているかのように読めますが、ワープロ専用機はパソコンに押されて、すでに販売の中止を決定したメーカーすらあることをご存知でしょうか[*4]

[*4]……朝日新聞2000年8月21日夕刊の記事「ワープロは今 パソコン攻勢、東芝も撤退 愛好家ら復活運動」などを参照のこと。

 もしも本当に表外字体案をまとめる際にワープロ専用機が念頭におかれていたとすれば、それは実態からかけはなれた過去の姿にすぎず、そのような場所からの思考は、やはり実態からかけはなれたものになってしまうでしょう。

 なぜならば、文字の入力と印刷に特化した単機能マシンであるワープロ専用機では、たしかにJIS文字コードの異体字問題があらわになるのは印刷された時点だけかもしれません。しかしごく普通の、大多数をしめるパソコン・ユーザーにとってJIS文字コードの問題点に直面するのは、メールやウェブページなどインターネット上で情報交換をするときだからです。しかし、表外字体案では“インターネット”という言葉も“メール”という言葉も登場しません。そう、表外字体案が文字コードを語る際に欠落しているのは、こうした“情報交換”という視点のように私には思えます。

 

●文字の形をきめていない文字コード

 では、この“情報交換”が、表外字にどのような影響をあたえるのでしょうか。ここでごく簡単に文字コードの仕組みを説明します。
 コンピューターをはじめとする電子的な機器では、文字に特定の“背番号”をあたえることで文字をあつかうようになっています。つまり文字そのものの形のデータと、それに対応する番号のデータを分離したところが、この方式のミソです。
 コンピューターの用語では、文字そのものの形のデータを“フォント”といいます。そして対応する“背番号”が“文字コード”です。
 どうしてこのような、一見面倒ともおもえることをしているのでしょう。電子的な機器は番号をあつかうのは得意でも、文字の具体的な形をあらわす画像のデータをあつかうのはあまり得手ではありません。そこで機器の内部処理には電子的にあつかいやすい形、つまり番号(文字コード)でおこなってスピードアップをはかり、人間が目でたしかめなければならない時、つまり画面表示と印刷をする時にはじめて文字の画像(フォント)におきかえるわけです。

 さて、この方式のメリットはたくさんあります。前述したように、まずコンピューター内部の処理が単純ですみ、速くなることが挙げられますが、同時にこれはプログラムの開発が簡単になり時間がかからない、つまり開発費が安くすみ生産性が向上することを意味します。
 また、コンピューターで離れたところにいる相手と文字をやりとりしようとする際、文字を容量のおおい画像データとして送ろうとすれば、通信料金がとんでもない額になってしまうでしょう。しかし番号である文字コードだけを送り、これをうけとって自分のパソコンのフォントで読むならば通信時間も短くてすみます。

 その好例が、他ならぬこの表外字体案をインターネット上で公開したファイルの形式でしょう。従来の文字コードの規格で表すことができない字体を盛り込んだこの文書は、当然ながら他の委員会の試案(例えば http://www.monbu.go.jp/pcomment/00000104/1.htm#1 )のように、自分のパソコンのフォントで表示する方式で公開することはできませんでした。
 おそらく表外字体案はいったん印刷したものを、スキャナーで画像データとして取り込んだと推察します。結果、19MB(フロッピーディスクにして13枚強!)という大容量になってしまいました。おそらく通常のテキストデータならば、この数十分の一におさまるはず。はからずも文字コードの便利さを、今回の表外字体案の公開は再認識させてくれました。

 話をもどします。おそらく文字コードを使う方式の最大の利点は、今までのべたメリットすべてが、社会資本としてのコンピューターを普及しやすくすること、つまりより容易に情報化社会が構築できることに直結するということなのです。つまり文字コードは、コンピューターが私たちの暮らしにとって必須な存在であるための、基盤技術なのだと言えるかもしれません。

 このように書くと、文字コードの方式が良いことずくめのように思えますが、もちろんそんなことはありません。そして、この欠点こそが、表外字体案ができた要因にもつながっているように思えます。その欠点とは――文字コードは番号でしかなく、本質的に文字の形まで決定し得ないということです。たとえばJISの規格票をひらけば、番号に対応する文字が掲載されているでしょう。しかし、その文字は具体性をもった字形そのものではなく、あくまで抽象的な“例示字体”でしかないのです。JISにかぎらず文字コード一般がそうなのですが、一例をあげるとJIS X 0213では、冒頭『適用範囲』の項に以下のように書かれています。

 この規格は、図形文字及びそのビット組合せを規定するもので、用途、個々の図形文字の具体的字形設計などは、この規格の適用範囲としない。

 よく誤解されますが、もともとJIS文字コードは、文字の形までをきめていません(ないしは、きめられない)。これはJISの問題ではなく、文字コードという方式の本質的な性格なのです。具体的な文字の形を表示できるのはフォントだけです。
 しかし、“文字の形をきめない”のでは実際に運用はできませんし、なにより規格に適合したフォントがつくれません。だから規格は指針として字体を例示しているのですし、なかには日本のポピュラーな文字コード規格JIS X 0208と、その拡張版JIS X 0213のように“包摂規準”を明文化して、どの場合にAという字体とBという字体の差を区別しないかという詳細なルールをきめているものさえあります。

 一例をあげると、「荘」という常用漢字は、私のMacintoshというパソコンに入っているフォントを変えると、草冠の下の右側が「土」になったり「士」になったりします。例えば『等福ゴシック』では明確に「土」(図4)、『CID リュウミン L-KL』では明確に「士」(図5)、規格票でも使われた『平成明朝』では上下が同じ長さに見えるけれど、拡大してみると微妙に上が長い「士」(図6)といった具合。

図4図5図6
▲図4▲図5▲図6

 ただし、これらは、JIS X 0208では字体差ではなく、常用漢字表の“字形デザイン差”(b)-1によって、どの形でも区別しないことになっています。ちなみにこの文字は『道光版康煕字典』では「土」、『大漢和辞典』では「士」につくります。
 このようにして、人は気づかないうちに、日々微妙に違った字の形を、同じ文字として使っているわけです。

 もっとも、このように気づかないような細かな差ならよいでしょうが、前章で表外字体案から引用した、さんずいに「賣」の「涜」を使えない問題や、「品」の「鴎」と、「区」の「鴎」のどちらを標準と考えてよいか分からないという問題となると困ります。これらは、JIS X 0208における'78年の最初のバージョンと、'83年のバージョンの違い、いわゆる“83JISの字体変更”と言われる問題です。
 しかし、その歴史的な経緯をひとまず脇にのければ、この問題の本質的な原因、発生の素地は、やはり“文字コードは文字の形を決めていない”というところに求めることができるように思います。

 

●表外字体案に問われているもの

 さきにわたしは、表外字体案が考えているのは“印刷”だけで、データをやりとりするような“情報交換”という視点が欠落していると書きました。このことは“文字の形を決めていない”という性質をもつ文字コードの視点から表外字体案を考えるとき、重要な意味をもってくるのです。

 まず、文字コードという技術じたいは、繰り返し述べているように情報交換の際に文字の形まで相手に伝わることを保証できません。私のパソコンから送ったメールは、そのままの文字の形で相手のパソコンに表示されるという保証はないのです。なぜならば、私のメールソフトで使っているフォントと同じものが、相手のパソコンにも入っている保証はなく、仮にそれが入っていたとしても、相手がそのフォントを使ってメールを読むという保証はないからです。
 これに対して、前述したとおり、このような不安定性を一定の枠内におさめようとするのが、JIS X 0208でいえば包摂規準です。JIS X 0208では、包摂規準にしたがってフォントが作られているかぎり、ユーザーは情報交換の相手と、とんでもない齟齬に出会うことはなくなります。これを表外字体案にあてはめていえば『表外漢字における字体の違いとデザインの違い』(p.34)ということになるでしょう。

 こうして考えると、表外字体案に問われているのは、このような文字コードの制約の前に、本当に有効たりうるかどうかということだと思います。ここで問題になってくるのが、以下の2点です。

 (1)表外字体案が適用範囲としている“印刷文字”なる概念が不明確であること。
 (2)表外字体案の『字体の違いとデザインの違い』が包括的といえないこと。

 そもそも、“印刷字体”とは、なにを言い当てようとしているのでしょうか? 表外字体案を読むと、1,022文字の選定には、凸版印刷と読売新聞社などが印刷に使用した文字の頻度調査を規準にしたとあります(p.10『表外漢字字体表に掲げた漢字(字体表漢字)の選定方法について』)。してみると、この“印刷字体”とは、商業印刷につかわれる字体のことのように思えます。

 しかし、一方で表外字体案は〈一般の書籍や教科書などに用いられる〉字体が〈ワープロ等から打ち出せない〉(p.2 前出引用箇所)ことを問題にしています。ワープロを対象にしているのなら、それは商業印刷のような大規模でプロフェッショナルな用途というよりも、個人が仕事に使ったり、あるいはごくプライベートな生活の中で使う文字のようにも思えます。

 自分のパソコンの使い方を振り返っても思うのですが、私たちはかつて紙に鉛筆で文書を書いていたのと同じような感覚で、現在パソコンを使ってないでしょうか? だとすれば、これは手書きの代替手段でもあると言えます。その手書きの代わりにつかう字体を、商業印刷を対象とした頻度調査で決定する根拠は、いったいどこにあるのでしょうか?
 おそらく表外字体案は、こういう用途ついては簡易慣用字体を使えと言っているように読めます。しかしこの簡易慣用字体も選定の基準は、やはり同じ凸版印刷と読売新聞社などのデータであり、これら商業印刷で使われている字体を個人の文字生活でつかうべき理由については、まったくなにも語っていません。

 本来ここで表外漢字の指針を決めようとする者に求められているのは、どのような字体が、どのような目的/場所で、どのようにして使われており、今後はどのようにあるべきかという、現実に裏打ちされた確固とした指針をしめすことだったはずです。

 たとえば、私たちは文字を書く目的や内容によって漢字の使用頻度が変わるのではないでしょうか。そういう基本的なところから“文字生活”の姿が浮かびあがるのではないでしょうか。

 実は私は、そういった行き届いた調査を表外字体案にもとめたかったのですが、残念ながら公表された案は、(それじたいは大規模な調査だったとはいえ)わずか限られた分野における数種だけの頻度調査ですべてを決めようとしています。

 別に私は、たとえばパーソナルな使用が主である情報機器では、筆写字体風のものを使うべきなどと言おうとしているのではありません。こうした個人的な使用目的の字体と、大規模な商業印刷での字体を、まったく同じものとして扱う理由がわからないのです。

 現実的に、個人から商業印刷までにわたる広範囲の頻度調査ができなかったのならば、ぐっと適用範囲を限定してはどうでしょうか。この表外字体案が、個人ではなく商業印刷だけを適用範囲とするのなら筋がとおります。そして、そのような分野にだけ表外漢字字体表を適用することが、じつは現状では一番混乱がすくない方法のように私は思います。

 たとえば、商業印刷のDTP市場におけるデファクト標準であるアドビシステムズのCIDフォントの字体切り替えという技術があります。これは、対応したアプリケーション・ソフトからある操作をすることで、選択した文字の字体を任意のものに切り換えられるというものです。
 アドビシステムズは、この技術に対応するソフトを今後拡充していく方針ですし、アップルコンピュータも、これにOSレベルでの対応を発表しています。そして重要ななことに、商業印刷のDTP市場においてこの2社の組合せは圧倒的なシェアをもっているのです。
 知人の調査によれば、表外字体案のうち、この技術で出すことができないのは3文字だけです[*5]。つまり、この3文字をのぞけば、今、実際に表外字体案を使うことが可能になるのです。

[*5]……直井靖氏の調査による。出せない3文字は「264/妍」「651/歎」「857/并」の印刷標準字体。

 表外字体案では、『情報機器との関係』として〈将来的に文字コードの見直しがある場合、表外漢字字体表の趣旨が生かせる形での改訂が望まれる〉(p.9)としており、JIS文字コードの変更をうながしています。しかし私が調査したかぎりでは、そのような変更をした場合、けっして小さくない混乱がおこりそうです。

 詳細は後の機会にゆずるとして、文字コードを無理矢理改訂させるよりも、むしろ現在の市場でじゅうぶん普及している技術によって、印刷標準字体の普及をはかることが現実的な選択なのではないでしょうか。


 さて、残念ながらここで紙幅が尽きた。次回は、表外字体案で示された具体的な表外字を見ながら、今回書きかけた表外字体案の『字体の違いとデザインの違い』が包括的といえない点や、実際にJIS文字コードが表外字体案に対応した際に、どのような問題が起こりうるかなどを書きたいと思う。

(2000/10/28)

[Reported by 小形克宏]


INTERNET Watchホームページ

ウォッチ編集部INTERNET Watch担当internet-watch-info@impress.co.jp