Internet Watch logo
記事検索
バックナンバー
【 2009/04/09 】
「新常用漢字表(仮称)」のパブコメ募集が始まった
[12:59]
【 2008/11/28 】
第3部 印刷文字から符号化文字へ
第11回 「情報化時代」へ常用漢字表を進化させよ
[11:19]
【 2008/11/27 】
第3部 印刷文字から符号化文字へ
第10回 ふたたび常用漢字表の改定を考える
[14:31]
【 2008/11/14 】
第3部 印刷文字から符号化文字へ
第9回 議員の氏名表記とRFC標準の共通点
[11:12]
【 2008/11/13 】
第3部 印刷文字から符号化文字へ
第8回 字体意識と社会的コスト
[11:27]
【 2008/11/12 】
第3部 印刷文字から符号化文字へ
第7回 『議員氏名の正確な表記』と人名表記の位相文字
[14:06]
【 2008/11/11 】
第3部 印刷文字から符号化文字へ
第6回 漢字の字体史から見た『議員氏名の正確な表記』
[17:08]
【 2008/10/31 】
第3部 印刷文字から符号化文字へ
第5回 『議員氏名の正確な表記』はどうやって作られたか
[11:21]
【 2008/10/30 】
第3部 印刷文字から符号化文字へ
第4回 議員本人のWebページとの比較結果
[15:03]
【 2008/10/29 】
第3部 印刷文字から符号化文字へ
第3回 実装の上から『議員氏名の正確な表記』を考える
[15:15]
【 2008/10/28 】
第3部 印刷文字から符号化文字へ
第2回 規格の上から『議員氏名の正確な表記』を考える
[11:08]
【 2008/10/27 】
第3部 印刷文字から符号化文字へ
第1回 現代日本の「ゴルディアスの結び目」をほどくのは?
[16:44]
“情報化時代”に追いつけるか? 
審議が進む「新常用漢字表(仮)」

第2部 新常用漢字表と文字コード規格
第2回 常用漢字表の改定で発生する、漢字政策の玉突き現象


 前回はJIS文字コードへの影響をまとめた安岡孝一氏の発表「常用漢字表の拡大はJIS漢字にどういう混乱をもたらすか」を紹介した。これをまとめると、特定の文字を常用漢字表に追加した場合、「漢字政策の玉突き現象」が起き、JIS X 0213で不整合が起こる。


(1)新常用漢字表に文字が追加
      ↓
(2)人名用漢字が新常用漢字表に対応し、同じ文字を追加、1字種2字体になる
      ↓
(3)JIS X 0213は従来包摂していた2字体を区別しなければならなくなり、包摂を分離、その結果不整合が発生する


 今のところ一応は安定しているJIS X 0213における包摂の範囲が、他の漢字政策の都合によって分離せざるを得なくなり、これにより不整合が起きてしまうというのが安岡氏の指摘の趣旨だ。これを安岡氏が例に挙げた「箸」で図にしてみた(図1)。


図1 常用漢字表に点なしの「箸」を追加した場合に発生する「漢字政策の玉突き現象」

 これが発生する条件は「常用漢字表に印刷標準字体と違う字体=略字体が追加された場合」であることも重要なポイントだ。2004年9月の人名用漢字追加も、JIS X 0213の2004年改正も、どちらも表外漢字字体表(2000年国語審議会答申)で規定した印刷標準字体に対応したものだ。つまり常用漢字表の改定で、過去の国語施策と矛盾した字体が採用された場合に不整合が発生する。


情報交換すると文字化けが発生することも

 ではどんな不整合か。まず安岡氏によれば、上記のように人名用漢字が追加された場合、JIS X 0213では以下のような2つの対応方法が考えられる(図2)。


(1)従来の面区点位置はそのままに、2004年改正以前の略字体を空き領域に新規追加する

(2)従来の面区点位置を2004年改正以前の略字体に戻し、印刷標準字体を空き領域に新規追加する


図2 漢字政策の玉突き現象が発生した場合のJIS X 0213の対処法。2種類が考えられるが、いずれも不整合が発生する

 それぞれの対応方法をとった場合、一体どんな事態が起こり得るのだろう。(1)の対応法ではJIS X 0213の元となったJIS X 0208との間で非互換になってしまう。ある規格と一対一対応の関係がとれることを「互換性がある」と言うが、この場合は2004年改正以前の字体を新しく追加することで、JIS X 0208の文字をJIS X 0213に変換しようとする際に変換候補(対応先)が2つできてしまい、一対一対応にならなくなる。これが非互換であり、一般的に規格の運用にあたって大きな問題とされる。

 では、どんな非互換なのだろう。改正JIS X 0213:20xxを実装した環境と、旧来のJIS X 0208:1997を実装した環境があったと仮定して、双方で同じ点なし「箸」を表示しているのに、一方のJIS X 0213:20xx環境では01-13-xx、他方のJIS X 0208:1997環境では区点40-04と違う符号位置であるということになる。つまりこのJIS X 0213:20xxでは、改正の前後で「同じ文字」に対して違う符号位置が割り当てられているという深刻な非互換が発生する。

 この非互換が明確な形をとるのは情報交換だ。JIS X 0208:1997からJIS X 0213:20xxへ情報交換をした場合には、字体の変化は包摂の範囲にとどまり往復の保全性(次回で詳述)も確保されるが、逆の場合では、送るJIS X 0213:20xxでは「箸」だが受けるJIS X 0208:1997では空白領域なので、「・」「□」等が表示されてしまう。つまり文字化けだ。

 ここではJIS X 0208:1997の実装環境を例にとったが、同じことはJIS X 0213:2000を実装した環境でも起こる。JIS X 0213:2000はJIS X 0208:1997をそっくり内包しているからだ。この改正を行った場合に影響を受ける環境として、例えばシフトJISを実装する多くの携帯電話、そしてマイクロソフトのWindows XP以前のOS、Mac OS Xバージョン10.4以前などが挙げられるだろう。

 シフトJISではJIS X 0208とJIS X 0201を主な文字セットにするし、Windows XPでは日本語文字セットとしてJIS X 0208:1990とJIS X 0212、同様にMac OS Xバージョン10.4以前ではJIS X 0213:2000を実装する。実際にここで検討している対処が行われるのは、2010年春に予定されている常用漢字表の改訂の数年後となるはずだ。その段階ではこれらの環境は現在より減ってはいるだろうが、無視できる台数とは思えない。これを考えれば、(1)の対処法の与える社会的な影響は大きい。


マイクソフトにとっては絶対に避けたいシナリオ

 続いて(2)の対応法だが、これは2004年改正で行った例示字体を2001年の制定当初に戻すことを意味する。これは一見するとかつて2004年改正での例示字体の変更に反対していた私のような者にとって歓迎すべき対応法にも思えるが[*1]、今となってはほとんどの人にとって迷惑にしかならない。

 例えばマイクロソフトはWindows Vistaの発売に先だって、2005年に〈「国語施策として示されている印刷標準字体」及び「法令に基づく施策である新人名用漢字」の双方に対応した最新のJIS規格、JIS2004に対応した日本語フォントを搭載〉[*2]することを発表した。具体的には新たに2004年改正に基づいたフォントを搭載したわけだが、製品発売の2年も前からこのような発表をした背景には、事前にユーザーへの周知を徹底することで混乱を回避しようとするマイクロソフトの配慮があったと考えられる。そんな同社(もちろんユーザーも)にとって(2)の対応法は悪夢以外の何者でもないだろう。具体的にはフォントの再改定、それもそのまま改定以前に戻すということになり、「あの騒ぎは一体なんだったのだ」という話になる。マクロソフトとしては絶対に避けたいシナリオだろう。


問題が発生する字は?

 では、具体的にどんな字が常用漢字表に追加されると問題になるのか。可能性があるのは、次の2条件を満たす文字となる。


・2004年9月に人名用漢字として大量追加されたうち、常用漢字の旧字体を除いた字(774字)

・JIS X 0213の2004年改正で、包摂範囲はそのままに例示字体だけを変更した符号位置(168面区点)


 上記の条件が重なるのは79字となるが、例示字体変更の違いがわずかで問題になりそうもない「楯」(線の傾斜の違い)を除けば78文字となる。これらのうち2004年改正で変更前に例示されていた字体(つまり略字体)が常用漢字表に追加されると問題になる(図3)。


図3 常用漢字表に追加され、人名用漢字もこれに対応することでJIS X 0213に不整合が発生する78文字。斜線の左が例示字体変更前の略字体、右が変更後の印刷標準字体

 安岡氏は25文字(前回の写真1参照)を示して、「他の字はだいたい大丈夫」としていたが、あらためて氏に聞いたところによると、上記79文字を母集合とするのは同様だが、そこから氏が人名用漢字に内在するであろうロジックをあてはめて削っていったとのことだった[*3]。この問題は常用漢字表の改定後、法務省がどのような対応に出るかがポイントになる。もちろん氏の推理が的中する可能性はあるが、この原稿では注意を喚起することを目的としているので、削るのは最小限度にとどめることにした。

 7月15日に第24回漢字小委員会が開催され、ここでほぼ最終的とされる字種候補案が発表された。さらに9月22日の第25回で、この字種候補案から「蒙」を削除し、「刹、椎、賭、遡」を追加する修正案が発表された。そこで上記78字から、この字種候補修正案にある字を抜き出してみよう(図4)。


図4 図3から9月22日に発表された字種候補案にあるものを抽出した13字。左の字体で追加されると問題が発生する。下線を引いた3字は、表外漢字字体表の「表外漢字における字体の違いとデザインの違い」でデザイン差とされたもの

 このうち「茨」や「牙」「煎」は、表外漢字字体表ではわずかな違いで区別しなくてよいとされたものだ[*4]。表外漢字字体表の規定は常用漢字表を踏襲しており、たとえ新常用漢字表でどちらの字体が追加されたとしても、同様に区別しないよう規定されると思われる。したがってこの3字は問題にはならないだろう。このような作業を経て、残った10字体を以下に示す(図5)。


図5 字種候補案にあるうち、問題になる10字体。不整合は略字体で追加した場合に発生するので、ここでは略字体で示している

 これら10字体は表外漢字字体表では明確な字体差を持つとされる。一点と二点のしんにょう(謎、遜、遡)、食偏(餅)の違いといった、かつて表外漢字字体表で問題となった三部首の違いがここで再度問題になっている。他に「ソ」形と「ハ」形の違い(哨、蔽)や、葛の「ヒ」と「人」の違いもある。いずれも字体の違いとしては軽微なため、文字コード規格では「同じ字」として通常は区別しないことが多い(包摂)。それゆえに不整合が起こってしまう。


「同じ字」をめぐる「情報化時代」の現実

 ここで、字種候補案のうち問題になるのは「常用漢字表に印刷標準字体と違う字体=略字体が追加された場合」に限られることに注意してほしい。こうして“常用漢字表の改定にあたっては、点のない略字体の「箸」を追加しないでほしい”という安岡氏の結論になる。しかし逆に、いわゆる康煕字典体を追加すれば、ひとまず混乱は起きない。ここから常用漢字表の改訂にあたっては略字体ではなく、今までの国語施策の流れ通り印刷標準字体が追加されるだろうという予測が成り立つ(これについては後で再び検討する)。

 これは何を意味するのか。もう一度、図4にある問題になる字の一覧を見てほしい。ここに挙げられている斜線の左右の字体、略字体といわゆる康煕字典体は、いずれも包摂の範囲内に収まる違いしかない。ということは、ここまで検討してきたことは、以下のように言い直すことがだろう。すなわち「包摂の範囲内にある字体を新たに追加しようとした場合、どんな混乱が起こるか」であると。

 文字コード規格では字体の違いがあっても「同じ字」として区別しないことにしている。これが包摂の範囲だ。では、何と何が「同じ字」とできるか、どこからどこまでが「同じ字」か、さらに「同じ字」としたものをどう処理するか。じつは視点を日本の外に転じると、コンピュータにおける国際標準の世界は、10年ほど前からこの問題をめぐってさまざまな議論が起き、さまざまな対処がされてきた。それは現在も続いている。

 日本はそうした状況における台風の眼の1つでもある。その理由として2000年の表外漢字字体表に始まり、2001年のJIS X 0213制定、そして2004年の改正と、文字をめぐる動きが続いたことも挙げられるが、日本では字体を細かく区別する傾向が少しずつ強くなってきており、それが漢字政策に対する推進圧になり、さらに国際規格にも影響を与えていると考えられる。そして今、再び常用漢字表の改訂により大きな動きが始まろうとしている。いったい、これからどうなるのだろう? これを考えるために、国際規格やインターネット標準における“情報化時代”の現実を見ていきたいと思う。

 まずはJIS X 0221(=ISO/IEC 10646≒Unicode。以下、ISO/IEC 10646の略称である「UCS」で統一[*5])だ。先にJIS X 0213に対して略字体を追加する2つの対処法を検討した。そこで同じように、それぞれの対処がされた場合にUCSはどうなるかを見てみよう。やはりここでもJIS X 0213と同様、どちらの対応を選択しても非互換になってしまう(図6)。


図6 常用漢字表に略字体が追加された場合にJIS X 0213とJIS X 0221との間で発生する不整合。一対一対応でなくなるために非互換となる

 といっても非互換になること自体はあまり問題視すべきではない[*6]。UCSは成長中の規格だ。国内の政策の変化により非互換が発生したのなら、問題を解消するよう日本もその一員であるUCSの国際審議機関「ISO/IEC JTC 1/SC 2/WG 2」(以下、WG2)に新しく文字の追加を提案すればよい。JIS X 0213制定の際にもそうだった。

 前述した人名用漢字許容字体を始め、JIS X 0213で包摂分離した文字の多くは、既収録の統合漢字の統合の範囲(包摂の範囲と同じ)に含まれていたが、そのままの字体としてはUCSには未収録だった。そこで「CJK互換漢字」(以下、互換漢字)として提案し、現在は符号位置U+FA30からU+FA6Aの59文字として収録されている(図7)。これによりJIS X 0213はUCSと一対一対応を確立することができた[*7]。今回も同じことをやればよいではないか?


図7 UCSのCJK互換漢字領域に収録されているJIS X 0213のレパートリ(赤線内)(『JIS X 0221:2007』日本規格協会、2007年、P.912、P.914)

 ところが、今はそう簡単にいかないのだ。常用漢字表のような国の基本的な文字の符号化を互換漢字に依存することは、今後大きな問題を引き起こすと考えられる。今回述べたかった最大の問題はこれなのだが、詳しく説明する前に紙面が尽きたようだ。どうか次回をお楽しみに。

[*1]……拙稿『文字の海、ビットの舟』特別編23 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(6) 改正の影響:MSフォントのデザイン変更とその波紋について、2004年5月2日(http://internet.watch.impress.co.jp/www/column/ogata/sp23.htm)を参照。
[*2]……『Windowsの次期バージョンWindows Vistaにおいて日本語フォント環境を一新』マイクロソフト、2005年7月29日(http://www.microsoft.com/japan/presspass/detail.aspx?newsid=2353)。
[*3]……安岡氏の方法は、第1回で紹介した日本語学会での発表で、「者」の漢字政策上の扱いから部分字体が一致する「箸」の扱いを予想していったように、1字ずつの漢字政策上の扱いの変遷を前例と捉え、これを部分字体が一致する字に適用するものだ。まず予備作業として、79文字から常用漢字表の「明朝体活字のデザインについて」を適用し「楯」「茨」「註」を削除、残った76字を検討する。例えば「産」という字は1946年の当用漢字表では上部が「立」ではなく「文」の形を示しており、1949年の当用漢字字体表で「産」の形に変更されたが、法務省はこの両方の字体を子供の名付けに使う字として認めていた。これを1981年5月の民事行政審議会答申によって、上部が「立」の「産」だけを認めることに変更された。これを前例と考えるならば、新常用漢字表に「諺」が追加されたとしても、同様に旁の「彦」の上部が「文」の字体を認めないだろうと推測する(同じ例として「薩」がある)。ただし同種の前例がない文字については残してゆく。このような作業を76字に対して行ったとのことだった。
[*4]……『表外漢字字体表』「表外漢字における字体の違いとデザインの違い」(2000年、P.35~P.39、国語審議会)
[*5]……ISO/IEC 10646はISO(International Organization for Standardization:国際標準化機構)とIEC(International Electrotechnical Commission:国際電気標準会議)の合同による国際的な公的規格(デジュール規格)。規格名を『Universal Multiple-Octet Coded Character Set』といい、UCSはその略称。これはWTO/TBT協定(貿易の技術的障害に関する協定)第2条第4項に基づき、JIS X 0221『国際符号化文字集合』として翻訳されている(http://www.meti.go.jp/policy/trade_policy/wto_agreements/marrakech/html/wto06m.html#02)。一方、Unicodeは国際的なIT企業や業界団体を会員とするUnicodeコンソーシアムによるデファクト規格。両者は文字セットを共有し、連携をとりながら規格開発を進めている。
[*6]……達観めいた言い方をすれば、改正に非互換はつきものだ。規格の改正において非互換にならないことの方が少ない。むしろ本当の問題はその影響の大きさではないか。
[*7]……同時にこれらの文字があるゆえに、JIS X 0213はJIS X 0208と非互換の関係にならざるを得ないのだが、実装の主流はこれらの規格で規定された符号化方法を採用せず、Windows VistaやMac OS X等に見られるようにUnicodeを採用、JIS X 0213は文字セットとしてだけ使うという方向に向かったため、結果としてこの非互換は大きな問題とはならず、現在に至っている。

修正・更新履歴

[訂正]……私は常用漢字表に略字体が追加された場合、JIS X 0213として考えられる対処は2つあるとして、その一方の「(1)従来の面区点位置はそのままに、2004年改正以前の略字体を空き領域に新規追加する」について、以下のように書いた。

 しかし、じつをいうとこれはあまり大きな問題にはならない。なぜならJIS X 0213は制定当初からJIS X 0208とは非互換だったからだ。例えばJIS X 0213の制定目的の1つに、JIS X 0208では表現できなかった政令文字をすべて収録するというものがあった。具体的には当時人名用漢字許容字体として運用されていた常用漢字の異体字を収録したのだが、これによりJIS X 0213は制定当初からJIS X 0208と非互換となっていた。

 確かに(1)のケースでは、例示字体同士で見ると一見大きな非互換のように思えるが、包摂の範囲同士を見るとJIS X 0208の範囲はJIS X 0213のものを包含している。83JISで大きな問題になった29区点のように、例示字体はもちろん包摂の範囲も変わってしまった非互換変更とは比較にならず、JIS X 0213制定時に発生した非互換と同種のものだ。つまり従来からの非互換を拡大はしても、新たに発生するような種類のものではない。おそらく規格票でJIS X 0208から包摂範囲が分離された面区点を明示する程度の改正になるはずだ(2001年の初版にも同様の記述がある)。それでも、この対応法が問題を引き起こさないのかというと決してそのようなことはない。これは後述する。

 ここにある「あまり大きな問題にはならない」という認識は間違いだった。仮にこの対処法をとった場合、JIS X 0208:1997およびJIS X 0213:2000との間に深刻な非互換問題が発生する。以下これについて詳しく説明するが、ここではわかりやすさのためにJIS X 0208:1997に代表させる。JIS X 0213:2000については、区点40-04とあるのを面区点01-40-04に置き換えて読んでいただきたい。

 現状でJIS X 0208:1997においては、区点40-04に点なし「箸」を割り当てている。一方でここで説明した対処法とは、現行の点つき「箸」の例示字体を割り当てられた01-40-04はそのままに、空き領域の01-13-xxに点なし「箸」を追加する改正を行うというものだった。

 この対処法に基づく改正JIS X 0213:20xxを実装した環境と、旧来のJIS X 0208を実装した環境との間で何が起こるだろう? それは同じ点なし「箸」を表示しているのに、一方のJIS X 0213:20xx環境では01-13-xx、他方のJIS X 0208:1997環境では区点40-04と違う符号位置であるという事態だ。つまりこのJIS X 0213:20xxでは、改正の前後で「同じ文字」に対して違う符号位置が割り当てられているという深刻な非互換が発生する。

 仮にこの改正を行った場合に影響を受ける環境として、例えばシフトJISを実装する多くの携帯電話、そしてマイクロソフトのWindows XP以前のOS、Mac OS Xバージョン10.4以前などが挙げられるだろう。シフトJISではJIS X 0208とJIS X 0201を主な文字セットにするし、Windows XPでは日本語文字セットとしてJIS X 0208:1990とJIS X 0212、Mac OS Xバージョン10.4以前では日本語文字セットとしてJIS X 0213:2000を実装する。これらの台数から社会的な影響は大きいと考えられる。しかし私の原稿はこれを見落としていた。読者の皆さんには深くお詫びするとともに、上記に引用にした部分を次のものに差し替える。

 では、どんな非互換なのだろう。改正JIS X 0213:20xxを実装した環境と、旧来のJIS X 0208:1997を実装した環境があったと仮定して、双方で同じ点なし「箸」を表示しているのに、一方のJIS X 0213:20xx環境では01-13-xx、他方のJIS X 0208:1997環境では区点40-04と違う符号位置であるということになる。つまりこのJIS X 0213:20xxでは、改正の前後で「同じ文字」に対して違う符号位置が割り当てられているという深刻な非互換が発生する。

 この非互換が明確な形をとるのは情報交換だ。JIS X 0208:1997からJIS X 0213:20xxへ情報交換をした場合には、字体の変化は包摂の範囲にとどまり往復の保全性(次回で詳述)も確保されるが、逆の場合では、送るJIS X 0213:20xxでは「箸」だが受けるJIS X 0208:1997では空白領域なので、「・」「□」等が表示されてしまう。つまり文字化けだ。

 ここではJIS X 0208:1997の実装環境を例にとったが、同じことはJIS X 0213:2000を実装した環境でも起こる。JIS X 0213:2000はJIS X 0208:1997をそっくり内包しているからだ。この改正を行った場合に影響を受ける環境として、例えばシフトJISを実装する多くの携帯電話、そしてマイクロソフトのWindows XP以前のOS、Mac OS Xバージョン10.4以前などが挙げられるだろう。

 シフトJISではJIS X 0208とJIS X 0201を主な文字セットにするし、Windows XPでは日本語文字セットとしてJIS X 0208:1990とJIS X 0212、同様にMac OS Xバージョン10.4以前ではJIS X 0213:2000を実装する。実際にここで検討している対処が行われるのは、2010年春に予定されている常用漢字表の改訂の数年後となるはずだ。その段階ではこれらの環境は現在より減ってはいるだろうが、無視できる台数とは思えない。これを考えれば、(1)の対処法の与える社会的な影響は大きい。

 また、関連して以下の部分を訂正する。

誤:
 このように多かれ少なかれ、どちらの対応をとっても不整合は起きる。それゆえに“常用漢字表の改定にあたっては、点のない略字体の「箸」を追加しないでほしい”という安岡氏の結論になるのだが、しかし本当に深刻な不整合は、時間もあったろうが氏の指摘しなかった点にある。それはどちらの対応を選択しても、JIS X 0221(=ISO/IEC 10646≒Unicode。以下、ISO/IEC 10646の略称である「UCS」で統一)と非互換になってしまうことだ(図6)。同じ非互換でも、規格で定められた符号化方法が現在ほとんど使われていないJIS X 0208との非互換より、今まさに実装の主流を占めつつあるUCSとの非互換の方がインパクトは上だろう。しかもJIS X 0208は国内規格であるのに対し、UCSは国際規格であり影響は他国にも及ぶ。

正:
 ここで、字種候補案のうち問題になるのは「常用漢字表に印刷標準字体と違う字体=略字体が追加された場合」に限られることに注意してほしい。こうして“常用漢字表の改定にあたっては、点のない略字体の「箸」を追加しないでほしい”という安岡氏の結論になる。しかし逆に、いわゆる康煕字典体を追加すれば、ひとまず混乱は起きない。ここから常用漢字表の改訂にあたっては略字体ではなく、今までの国語施策の流れ通り印刷標準字体が追加されるだろうという予測が成り立つ(これについては後で再び検討する)。

 これは何を意味するのか。もう一度、図4にある問題になる字の一覧を見てほしい。ここに挙げられている斜線の左右の字体、略字体といわゆる康煕字典体は、いずれも包摂の範囲内に収まる違いしかない。ということは、ここまで検討してきたことは、以下のように言い直すことがだろう。すなわち「包摂の範囲内にある字体を新たに追加しようとした場合、どんな混乱が起こるか」であると。

 文字コード規格では字体の違いがあっても「同じ字」として区別しないことにしている。これが包摂の範囲だ。では、何と何が「同じ字」とできるか、どこからどこまでが「同じ字」か、さらに「同じ字」としたものをどう処理するか。じつは視点を日本の外に転じると、コンピュータにおける国際標準の世界は、10年ほど前からこの問題をめぐってさまざまな議論が起き、さまざまな対処がされてきた。それは現在も続いている。

 日本はそうした状況における台風の眼の1つでもある。その理由として2000年の表外漢字字体表に始まり、2001年のJIS X 0213制定、そして2004年の改正と、文字をめぐる動きが続いたことも挙げられるが、日本では字体を細かく区別する傾向が少しずつ強くなってきており、それが漢字政策に対する推進圧になり、さらに国際規格にも影響を与えていると考えられる。そして今、再び常用漢字表の改訂により大きな動きが始まろうとしている。いったい、これからどうなるのだろう? これを考えるために、国際規格やインターネット標準における“情報化時代”の現実を見ていきたいと思う。

 まずはJIS X 0221(=ISO/IEC 10646≒Unicode。以下、ISO/IEC 10646の略称である「UCS」で統一[*5])だ。先にJIS X 0213に対して略字体を追加する2つの対処法を検討した。そこで同じように、それぞれの対処がされた場合にUCSはどうなるかを見てみよう。やはりここでもJIS X 0213と同様、どちらの対応を選択しても非互換になってしまう(図6)。

 また、図2を差し替えた。以下に以前のバージョンを掲げる。


 なお、上記の変更にともない小見出しの変更や追加を行ったが、これについては省略させていただく。(2008/8/28)

[変更]……9月22日開催の第25回漢字小委員会で発表された字種候補修正案に基づき、以下のように原稿を変更する。なお、会場の都合からこの回は一般に公開されず、文部科学記者クラブ所属の記者だけが傍聴を許された(http://www.bunka.go.jp/kokugo_nihongo/bunkasingi/kanji_25/annai.html)。字種候補案の修正自体については「追加字種候補・音訓一覧(案)」(http://www.bunka.go.jp/kokugo_nihongo/bunkasingi/kanji_25/pdf/shiryo_2.pdf)の5ページ末尾を参照のこと。

旧:
 7月15日に第24回漢字小委員会が開催され、ここでほぼ最終的とされる字種候補案が発表された。そこで上記78字から、この字種候補案にある字を抜き出してみよう(図4)。

 このうち「茨」や「牙」「煎」は、表外漢字字体表ではわずかな違いで区別しなくてよいとされたものだ[*4]。表外漢字字体表の規定は常用漢字表を踏襲しており、たとえ新常用漢字表でどちらの字体が追加されたとしても、同様に区別しないよう規定されると思われる。したがってこの3字は問題にはならないだろう。このような作業を経て、残った9字体を以下に示す(図5)。

 これら9字体は表外漢字字体表では明確な字体差を持つとされる。一点と二点のしんにょう(謎、遜)、食偏(餅)の違いといった、かつて表外漢字字体表で問題となった三部首の違いがここで再度問題になっている。他に「ソ」形と「ハ」形の違い(哨、蔽)や、葛の「ヒ」と「人」の違いもある。いずれも字体の違いとしては軽微なため、文字コード規格では「同じ字」として通常は区別しないことが多い(包摂)。それゆえに不整合が起こってしまう。

新:
 7月15日に第24回漢字小委員会が開催され、ここでほぼ最終的とされる字種候補案が発表された。さらに9月22日の第25回で、この字種候補案から「蒙」を削除し、「刹、椎、賭、遡」を追加する修正案が発表された。そこで上記78字から、この字種候補修正案にある字を抜き出してみよう(図4)。

 このうち「茨」や「牙」「煎」は、表外漢字字体表ではわずかな違いで区別しなくてよいとされたものだ[*4]。表外漢字字体表の規定は常用漢字表を踏襲しており、たとえ新常用漢字表でどちらの字体が追加されたとしても、同様に区別しないよう規定されると思われる。したがってこの3字は問題にはならないだろう。このような作業を経て、残った10字体を以下に示す(図5)。

 これら10字体は表外漢字字体表では明確な字体差を持つとされる。一点と二点のしんにょう(謎、遜、遡)、食偏(餅)の違いといった、かつて表外漢字字体表で問題となった三部首の違いがここで再度問題になっている。他に「ソ」形と「ハ」形の違い(哨、蔽)や、葛の「ヒ」と「人」の違いもある。いずれも字体の違いとしては軽微なため、文字コード規格では「同じ字」として通常は区別しないことが多い(包摂)。それゆえに不整合が起こってしまう。

 また、上記以外に図4、図5とそのキャプションを変更する。

旧:
図4 図3から7月15日に発表された字種候補案にあるものを抽出した12字。左の字体で追加されると問題が発生する。下線を引いた3字は、表外漢字字体表の「表外漢字における字体の違いとデザインの違い」でデザイン差とされたもの

図5 字種候補案にあるうち、問題になる9字体。不整合は略字体で追加した場合に発生するので、ここでは略字体で示している

新:
図4 図3から9月22日に発表された字種候補案にあるものを抽出した13字。左の字体で追加されると問題が発生する。下線を引いた3字は、表外漢字字体表の「表外漢字における字体の違いとデザインの違い」でデザイン差とされたもの

図5 字種候補案にあるうち、問題になる10字体。不整合は略字体で追加した場合に発生するので、ここでは略字体で示している

(2008/10/11)



2008/07/25 15:40
小形克宏(おがた かつひろ)
文字とコンピュータのフリーライター。本紙連載「文字の海、ビットの舟」で文字の世界に漕ぎ出してから早くも8年あまり。知るほどに「海」の広さ深さに打ちのめされています。文字ブログ「もじのなまえ」ときどき更新中。

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved.