Internet Watch logo
記事検索
バックナンバー
速報 マイクロソフト・プレスセミナー報告(下)
[2006/5/24]
速報 マイクロソフト・プレスセミナー報告(上)
[2006/5/23]
特別編31 JIS X 0213の改正を総括する(3)
[2006/2/14]
特別編30 JIS X 0213の改正を総括する(2)
[2006/1/12]
特別編29 JIS X 0213の改正を総括する(1)
[2005/12/26]
特別編28 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(11)
[2004/12/1]
特別編27 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(10)
[2004/11/30]
特別編26 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(9)
[2004/11/29]
特別編25 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(8)
[2004/9/16]
特別編24 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(7)
[2004/9/13]
特別編23 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(6)
[2004/6/2]
特別編22 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(5)
[2004/4/16]
特別編21 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(4)
[2004/4/12]
特別編20 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(3)
[2004/4/6]
特別編19 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(2)
[2004/4/2]
特別編18 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(1)
[2004/3/30]
バックナンバーINDEX[2000/1/19~]
Illustation:青木光恵
小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの


特別編31
JIS X 0213の改正を総括する(3)
JIS X 0213の改正と「漢字を救え!」キャンペーン

9年前から始まった、あるキャンペーン

 「漢字を救え!」キャンペーンとは、1997年頃から主に日本文藝家協会の会員が主導した一連の言論活動だ。そこでなされた主張は、主張した当人達も今ではほとんど触れることなく、もはや歴史的な出来事に属していると言えるだろう。ただし文芸家達が舞台から去った後も、JIS X 0213の改正に影を落とし、結果として2006年発売予定のWindows Vistaに搭載される新MSフォントと、既存の多くのフォントとの間で「字体化け」を起こすことになったという意味で、じつはまだ完全には収束していないとも言える。

 私自身、じつは本連載を始めた理由の1つが、このキャンペーンへの反発だったことを告白しておこう。特別編5で当事者の1人を批判したこともある。だからここで何かを語っても、本当に客観的な立場からのものと言えるかどうか疑問は残るだろう。とはいえ、あれからすでに10年に近い歳月が過ぎた。このキャンペーンについては、すでに棺のふたは覆われたと言ってよく、そろそろ歴史的な評価がされるべき時が来ているように思う。以下、これがJIS X 0213の改正にどう影響したのか、私なりに説明を試みてみよう。

 このキャンペーンの頂点とも言えるのが、1998年1月22日に日本文藝家協会が主催して行なわれた『漢字を救え! 文字コード問題を考えるシンポジウム』と考えられる。その概要は今も同協会のWebページで読むことができる[*1]。手元に同協会が頒布した筆記録があるので[*2]、これによりシンポジウムをたどろうと思う。


1990年代後半とは、どういう時代だったか?

 その前に、まずこのシンポジウムがあった1998年とはどういう年だったか、現在の2006年とどう違うのかを押さえておきたい。背景となる時代状況を踏まえずに発言だけを取り上げても、やせ細った分析しかできないからだ。

 1990年頃のバブル崩壊から始まる経済の低迷は出口が見えず、この頃は「空白の10年」のまっただ中だ。政府が住宅金融専門会社(住専)の経営実態資料を公表してそのほとんどが不良債権であることが判明したのが1996年1月、北海道拓殖銀行が経営破綻したのが1997年11月。一方、金融改革が本格化するのがこの1998年だ。同年6月に金融システム改革法が成立し金融ビッグバンが始動、2週間後に大蔵省から金融機能を分離させた金融監督庁が発足、11月に24兆円規模の緊急経済対策が決定されている。もっともこれらの効果が実感できるまで、国民はまだかなりの時間、我慢を続けなければならないのだが。

 1993年の自民党政権崩壊から続く政治の混乱も続いている。消費税が3%から5%になったのが1997年4月、これが一因となって参院選で自民党が大敗するのが1998年7月。これにより橋本内閣が退陣し、小渕内閣が発足するが「冷めたピザ」と揶揄される。もちろん1995年の阪神大震災、同年2月のオウム真理教による地下鉄サリン事件の記憶もまだ生々しい。1996年には薬害エイズ事件、1997年には東電OL殺人事件、そして神戸の酒鬼薔薇事件が起こり、1998年には毒入りカレー事件が起こる。

 こうした暗い世相の中で、唯一といってよいほど明るい材料を提供していたのがIT産業だ。1996年10月には携帯電話/PHSの加入台数が2,000万台を突破。1,000万台を超えたのが同年2月だったから、それからわずか8カ月で倍増したことになる[*3]。デジカメが初めて発売されるのが1995年で、その時はまだ3社のみだったのが、翌1996年にはじつに23社から発売され、以後デジカメは一大ブームを築くことになる[*4]

 このデジカメで撮影した素材により、「ホームページ」の自作に挑戦した思い出を持つ人も多いだろう。当初は研究者たちのネットワークとして始まったインターネットが、一般に広がっていったのも1990年代後半だ。1997年には利用者が571万8,000人だったのが、翌1998年には大台を超えて1,009万7,000人となっている。なお、2005年は約7倍の7,372万人[*5]。つまり現代から見れば、シンポジウムのあった1998年1月は、ネット時代の夜明けにあたるだろうか。

 従ってインターネットの利便性が実感できる商用サービスは、この頃はまだ本格化していない。例えばオンライン書店が身近な存在になったのがAmazonの日本におけるオープンだが、これは2000年11月であり、シンポジウムからなお3年近くも待たなければならない。同様にインターネットの大衆化を大いに助けたYahoo!オークションは1999年9月の開始。商用サービスではないが、大衆化といえば抜きに語れない2ちゃんねるも、同じ1999年の5月に始まっている。

 こうした現代と微妙にずれた事情が実感できるのが、パソコンとワープロ専用機の普及率だ。パソコンが1998年3月で25.2%であるのに対して、ワープロ専用機は42%。つまりこの当時は汎用的なパソコンより単機能のワープロ専用機の方が、まだずっと馴染みが深かった。ちなみに、ワープロ専用機の普及率はこの年をピークとして少しずつ下降していくが、パソコンが逆転するのは2000年まで待たねばならない(図1)。

■図1 パソコンとワープロ専用機の世帯普及率
 出典:内閣府消費動向調査[*6]

 この頃のインターネットを、別の数字から見てみよう。パソコン・携帯電話を問わずインターネット利用者が1人でもいる世帯の割合は、1997年はわずか6.4%に過ぎない。ちなみに2004年末は86.8%に上っている[*7]

 以上の調査結果は、互いにサンプル数も統計手法も違うから単純な比較はできない。しかし大まかな傾向としては、シンポジウムのあった1998年1月とは、急速にワープロ専用機やパソコンをはじめとする電子機器が、身の回りに目立ち始めた頃と言えるだろう。しかしインターネットとなるとまだ話でしか聞かない人が多い、そんなイメージだ。この点で、現代のようにワープロ専用機はすでに過去のものとなり、ごく普通の人が携帯電話やパソコンを使ってインターネットにアクセスしている時代とは、ものの見方も感じ方も異なっているはずだ。たった8年ほど前の出来事だが、この点を注意する必要がある。


それは、素朴な不満からはじまった

 ではシンポジウムの検討に入ろう。ただし、これは2時間半にもわたって行なわれた討論会であり、とてもすべてを再現する余裕はない。全体的な話の流れは日本文藝家協会のWebページを参照してもらうとして、ここではキャンペーンの特徴的な主張がうかがえる部分だけを抜き出していきたい。

 以下、失礼ながら敬称はすべて略させてもらう。また、私自身の文章は従来通りJIS X 0208の範囲で表記するが、引用に限っては原文になるべく忠実になるよう、JIS X 0208準拠のフォントが通常再現しない字体は[]で注記することとする[*8]

 まず、このシンポジウムの参加者を以下に引用しよう[*9]

 大島有史(文化庁文化部 国語課長)
 橋爪邦隆(通産省工業技術院 情報電気規格課長)
 田村毅(東京大学教授)
 坂村健(東京大学教授)
 中沢けい(日本文藝家協会)
 泰恒平(日本文藝家協会)
 林真理子(日本文藝家協会)
 [吉:土+口:U+20BB7]目木晴彦(日本文藝家協会)
 司会/福田和也(日本文藝家協会 電子メディア対応特別委員会副委員長)

 この種のイベントの場合、学識経験者は中間的な立場として招かれることが多いが、TRON[*10]の主唱者である坂村健、GT書体プロジェクト[*11]を主導する田村毅は日本文藝家協会と主張を同じくしていたか、協会の会員だった。つまりこのシンポジウムの構図は、国語施策を担当する文化庁とJISを担当する工業技術院(現在の経済産業省産業技術環境局)の課長の2人を呼び、それを大勢の文芸家達が取り囲んで不満をぶつけるというものだった。

 シンポジウムでの発言を読むと、ここに参加した作家達の不満はいずれもごく素朴な、日常ぶつかる疑問から出発しているように思える。シンポジウムの冒頭、当時の理事長、故・江藤淳の挨拶から引用しよう。

 漢字の問題については、戦後の日本の国語政策は漢字制限を主としてやってきました。最初は当用漢字というものを作って制限したわけです。あまりしすぎたというので、今度は常用漢字に修正し、これを目安としてやろうということに変わってきている間に、世の中の進展は恐ろしいもので、電子機器という聞いたことのないようなものが一方で発達し始めました。(中略)
 ところが、電子機器に搭載されている漢字の字体の問題ということになると、これは大変な問題が伏在しているわけです。よく言われるのは、森[鴎:區+鳥:1-94-69]外の「鴎」の字、「しなかもめ」と「ばつかもめ」と言いまして、品川駅の品というのがこの中に入っているのが正しい[鴎:區+鳥]外の雅号なのですが、しかし、ワープロで打つと「ばつかもめ」しか出てこない[*12]

 ここに参加した作家達の典型的な不満を見てとれる。上の図1を再度見ると、1998年におけるワープロ専用機の家庭への普及率は42%に達している(パソコンは25.2%)。これはあくまで一般世帯を対象にした調査であり、文章の専門家である文芸家なら、こうした機器の普及はずっと高いと考えてよいだろう。だからこの数字よりも高い割合の文芸家達が、この頃には執筆環境をワープロやパソコンに移行していたことが推測できる。

 移行は便利さを求めてのことだろう。執筆速度の向上、検索の容易さ、ファイル管理の簡便化等々。とはいえ環境の移行に苦労はつきものだ。ましてや文芸家は機械の専門家ではない。私自身もこの頃の電子機器のインターフェイスが未熟だったことを容易に思い出せる。したくもない苦労を乗り越え移行した末に、いざ使い始めたら出ない文字がある。どうなっているんだ! 私にはここが文芸家達の不満がシンクロし、増幅するポイントだったように思える。


「JIS X 0208では文字が足りない」という主張

 江藤発言でもう1つ注目すべきポイントがある。それは前段の部分で、「電子機器に搭載されている漢字の字体の問題」、つまり「しなかもめ」と「ばつかもめ」に代表されるような83JISでの改正による問題が、戦後すぐ『当用漢字表』施行によって行なわれた漢字制限に重ねられていることだ[*13]。こうした理解が後のJIS X 0213の改正に影響を与えてゆくだのが、この点は後で詳しく検討することにして、今は次に登壇した吉目木晴彦の発言を見ることにしよう。

(インターネットの台頭により電子図書館など電子テキストの必要性が高まっている状況を説明した後)
 このような状況を背景に、コンピューターの規格で表記できる文字に制限が加えられているという問題が浮かび上がってきました。制限の内容ですが、大きく分けて二つあります。まず一つは、全く表記できない文字がある、コンピューターではどうしても出てこない文字があるということです。もう一つは、文字表現に対する制約です。区別したい文字表現、字体の区別が不充分であるということです。さきほど江藤理事長が例として挙げられた、森[鴎:區+鳥]外の「[鴎:區+鳥]」という文字が、その代表的なものとして、よく知られております[*14]

(当時のJIS文字コード規格に未収録である[〓:木+多:2-14-56]、[〓:木+聖:1-86-19]、[〓:火+華:1-87-62]、[〓:登+おおざと:1-92-80]、[〓:土+川:1-15-37]を全く表記できない「欠字」の例として挙げた後[*15]
 さきほど、欠字のほかにもう一つ文字表現の制約という問題があると申し上げました。文字表現の区別が不充分であるということなのですが、これは字体包摂や類形異字の包摂という、コンピューター規格の方針によって生じています。たとえば、内田百[間:門+月:U+9592]の[間:門+月]という字について、今のJISの規格上は「間」と「[間:門+月]」にまとめて同じ文字番号をふっているので、どちらが表記されるかは、その機械に入っているフォント(書体)次第という扱いになり、コンピューターの文字処理の最小かつ公的単位である文字コード上、どちらが出てくるかということは保証されません。森[鴎:區+鳥]外の「[鴎:區+鳥]」も「[鴎:區+鳥]」と「鴎」のどちらが出てくるかわからない。本来、区別して使われている、複数の字体にまとめて一つの番号をふっているからです。これが字体包摂された文字例です[*16]

 ここで訴えられていることを短くまとめれば、「JIS X 0208では文字が足りない」ということだろう。「足りない」とは、1つは収録されていない文字があることであり、もう1つは包摂されることで使えない文字があることの2点に分けられる。確かにこれは、紛れもないこの頃の現実であり、利用者としてこれを批判するのも無理はないと思える。ただし批判される側のJISも、この問題をよく承知していた。そのために考えられた拡張規格がJIS X 0213だ。


JIS X 0213は文芸家からどのように評価されたか

 JIS X 0213は、このシンポジウム以前から開発意向表明が公にされており[*17]、そこでは収集予定の文字として〈教育用の漢字・記号類〉〈地名用の漢字〉〈人名用の漢字〉等と説明されている。だとしたら、吉目木のような文芸家にとって、このJIS X 0213こそは待望の文字コード規格ということにならないだろうか。それでは彼は、どのようにJIS X 0213を説明しているのだろう。

(現在あるJIS文字コードを順番に説明していって)
最後のJIS X 0213。これは作成中で約五千字を収録すると言われていますが、第三・第四水準というものを今作ろうとしています。ただし、第三・第四水準漢字はシフトJISという方式にも対応するということになっているので、あと五千字拡張したらおしまいです。それ以上は拡張できません[*18]

 つまり収録予定の文字数だけを判断材料に、「どうせ足りない」と切って捨ててしまっている。しかし現実には先の「JIS文字コードで出ない文字」は、注記の符号位置からもわかるように、表記できなかった8文字のうち6文字までがJIS X 0213に収録されている(さらに2001年制定のJIS X 0221-1〈≒Unicode ver.3.1〉を使えば、[吉:土+口:U+20BB7][*19]を除き、JIS文字コードによってすべて表記可能[*20])。

 つまり吉目木はあと2年待てば、すべてではないにせよ、かなりの程度まで「出ない文字」を解消できる規格を見ることができたはずだ。また、彼はシフトJISに対応するから文字数を拡張できないと非難したが、じつは開発意向表明では、シフトJISに対応した拡張をJIS X 0213は行なうと説明されていた。これを信じるなら、今使っているパソコンのまま、対応フォントをインストールするだけで使える文字を増やせることになる。[訂正]

 とはいえ、こうしたJIS X 0213による現実的な拡張案――シフトJISと互換性をとった上で「約五千字」を拡張すること――の利点を全く無視して、吉目木がJISを全面否定するのも、彼が持っていた主張からすれば当然なのかもしれない。なぜなら吉目木には、マイクロソフトやアップルコンピュータなど、アメリカ企業の製品が圧倒的にシェアを握っている日本の現状そのものが我慢のならないものだったからだ。その象徴こそがUnicodeだった。

[*1]……日本文藝家協会『漢字を救え! 文字コード問題を考えるシンポジウム』( http://www.bungeika.or.jp/text/information/100122.htm )。
[*2]……『「漢字を救え! 文字コード問題を考えるシンポジウム」全記録』(日本文藝家協会、1998年)なお、2005年12月14日に同協会に問い合わせたところ、わずかだがまだ残部があるとのことだった(以下、『全記録』と略記)。
[*3]……ここまでの歴史的な事実は『戦後史大辞典増補新版』(佐々木毅等編著、三省堂、2006年)による。
[*4]……『現代風俗史年表 昭和20年(1945)~平成12年(2000)』(世相風俗観察会編著、河出書房新社、2001年、p.493)
[*5]……『日本のブロードバンド人口は3,224万4,000人』( http://internet.watch.impress.co.jp/cda/news/2005/06/07/7916.html )のうち、「インターネット利用者数推移(1997~2005年)」を参照。
[*6]……内閣府経済社会総合研究所『統計のページ』( http://www.esri.cao.go.jp/jp/stat/menu.html#shohi-z )のうち、2005(平成17)年の消費動向調査普及率( http://www.esri.cao.go.jp/jp/stat/shouhi/0403fukyuritsu.xls 、XLSファイル)、および2000(平成12)年同調査( http://www5.cao.go.jp/2000/f/0421shouhi/0421shouhi.xls 、XLSファイル)による。なお、ワープロ専用機の調査は2001年が最後、パソコンは1998年から調査開始。
[*7]……1997年の結果については『平成12年通信利用動向調査報告書世帯編』p.41( http://www.johotsusintokei.soumu.go.jp/statistics/pdf/HR200000_005.pdf 、PDF)、2004年の結果については『平成16年同報告書』p.33( http://www.johotsusintokei.soumu.go.jp/statistics/pdf/HR200400_005.pdf 、PDF)
[*8]……注記に際しては「:」で区切り、以下の順で表記する。
1)JIS X 0208で包摂された字体(ない場合は「〓」)
2) 部分字体により解字
3)初出に限ってJIS X 0213収録文字は面-区-点位置、JIS X 0221-1及びISO/IEC 10646-2にのみ収録の文字は、その符号位置を「U+」を付ける記法で示す
[*9]……『全記録』p.1
[*10]……『TRON Project』( http://www.tron.org/
[*11]……『ゆたかな文字文化を創りあげるために』( http://www.l.u-tokyo.ac.jp/KanjiWEB/00_cover.html
[*12]……『全記録』p.1~p.2
[*13]……1946年に制定された『当用漢字表』は、1,850字を、旧来の明朝体活字で示したものだ。ここでは〈従来、わが国において用いられる漢字は、その数がはなはだ多く、その用いかたも複雑であるために、教育上また社会生活上、多くの不便があった。これを制限することは、国民の生活能率をあげ、文化水準を高める上に、資するところが少なくない。〉(『当用漢字表の実施に関する件』1946年、内閣訓令第7号)としていた。この漢字制限の是非をめぐって、以後まさに国論を二分するような大論争が繰り広げられることになった。この漢字制限を「目安」に転換させたのが1981年制定の常用漢字表で、そこでは〈一般の社会生活で用いる場合の、効率的で共通性の高い漢字を収め、分かりやすく通じやすい文章を書き表すための漢字使用の目安〉(答申前文)と位置づけられ、制限はなくなった。
[*14]……『全記録』p.3~p.4
[*15]……『全記録』p.5
[*16]……『全記録』p.5~P.6
[*17]……JIS X 0213の原案作成委員会は開発開始にあたり『7ビット及び8ビットの2バイト情報交換用符号化漢字集合――第3水準及び第4水準』(現在は存在しない)というWebページを開設し、その概要を公開している。そこでは足りない文字の例として、いわゆる“合成文字”、教科書で使われる漢字・記号類、地名用の漢字、人名用の漢字が挙げられていた(注図1)。

■注図1
『7ビット及び8ビットの2バイト情報交換用符号化漢字集合――第3水準及び第4水準』キャプチャ(※編集部注 これは歴史的資料として提示したものです。ここにある連絡先にコンタクトをとることはおやめください)
[*18]……『全記録』p.10。なお実際のJIS X 0213は、従来のシフトJISやEUCとの互換性に配慮し、第3、第4水準漢字合わせて3,693文字、非漢字も合わせて4,354文字に抑えられた。
[*19]……[吉:土+口:U+20BB7]はISO/IEC 10646-2(Unicode ver.3.2)に収録されている。
ISO/IEC 10646(UCS)の基本構造は、全体では256×256=65,536文字を1面、16面を1群とし、全部で127群を定義するというもの。JIS X 0221-1:2001はISO/IEC 10646-1:2000を翻訳したもので、ここには群00の面00(これを基本多言語面:BMPと呼ぶ)を収録している。一方、ISO/IEC 10646-2:2001は群00の面01以降を収録する。ここにはCJK統合漢字拡張B(Extension B)と呼ばれる領域が入っており、[吉:土+口:U+20BB7]はここに収録されている。2003年にISO/IEC 10646-1:2000とISO/IEC 10646-2:2001は合併され、新たにISO/IEC 10646:2003という規格名になった。JISでは現在、このISO/IEC 10646:2003の翻訳を計画中だ。そうなれば、この[吉:土+口:U+20BB7]もJIS文字コードに収録されることになる。なお、ISO/IEC 10646-1:2000とISO/IEC 10646-2:2001を合わせたものが、Unicode ver.3.2に相当する。
[*20]……私が見る限り『全記録』の全体でJIS X 0221-1及びISO/IEC 10646-2により表記できないのは3字のみ。1つはp.8にある「もげき」「えだなし」「もぎき」等と読まれる漢字。それから同じ箇所にある「柿」に包摂される「こけら」と読む漢字(注図2)。そしてp.6にある「骨」の中国語の字形だ。

■注図2
『全記録』の中で、JIS X 0221-1およびISO/IEC 10646-2により表記できないと思われる箇所の例(『全記録』p.8)

なお、「こけら」についてJIS X 0208:1997規格票は、過去・現在の実際の文字使用状況から字体区分が必ずしも明確でないと述べている(附属書7「区点位置詳説」p.272~p.274)。なおJIS X 0221-1では、U+67BEを収録している( http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=67BE )。

修正履歴

[訂正]……以下のように訂正した。

旧:だから今使っているパソコンのまま、対応フォントをインストールするだけで使える文字を増やせることになる。
新:これを信じるなら、今使っているパソコンのまま、対応フォントをイン ストールするだけで使える文字を増やせることになる。

 XMLと文字メーリングリスト( http://www2.xml.gr.jp/log.html?MLID=xmlmoji&TID=1670&F=0&L=10&R=0 )における、川俣晶さん、Akira Kawamataさん、きださんのご指摘による。(2006/2/23)

( 小形克宏 )
2006/02/14
INTERNET Watch ホームページ
 Copyright (c)2006 Impress Watch Corporation, an Impress Group company. All rights reserved.