バックナンバーへ
このほかの連載へ
【連載】

小形克宏の「文字の海、ビットの舟」
――文字コードが私たちに問いかけるもの  

第2部 これが0213の特徴とその問題点
第8回 0213の最終審査で、なにがおこったか? ~1.議事録から(下)

       
Illustation:青木光恵

●1カ月後、再審議のための情報部会

 '99年10月25日、午後3時、場所も前回と同じ通産省別館506会議室で第84回情報部会が開催された。まずこの日の出席者を列挙しよう。“▼”がついているのが、この日に発言をした人だ。


◆第84回情報部会議事録('99年10月25日)

◎部会長
▼棟上昭男 東京工科大学

◎委員
▼浅野正一郎 学術情報センター
石黒辰雄 日本電気(▼代理/藤崎正人 技術企画部標準化推進部シニアコンサルタント)
▼石崎俊一 慶應義塾大学
市川隆 日本情報処理開発協会
北城恪太郎 日本アイ・ビー・エム(▼代理/斎藤輝 アジア・パシフィック・テクニカル・オペレーションズスタッフ・オペレーションズ標準部長)
児玉皓雄 電子技術総合研究所(▼代理/戸村哲 情報アーキテクチャー部)
佐藤清俊 日本電子工業振興協会(代理/東條喜義 技術部参事)
庄山悦彦 日本電子機械工業会(代理/小岩忠夫 標準化センター)
高須昭輔 日立情報システムズ(代理/宮澤由壽 経営企画室部長)
瀧上信光 総務庁(代理/中原和郎 行政管理局行政情報システム企画課)
田中征治 郵政省 技術総括審議官(代理/古屋修司)
塚本倬三 富士ゼロックス(代理/篠岡誠 ODP事業本部)
平河喜美男 日本規格協会(▼代理/岡本秀樹 情報技術標準化研究センター所長
丸山武 富士通(▼代理/川村直道 企画本部企画部)
山田肇 日本電信電話(代理/末吉忠浩 第三部門 R&D推進担当課長)

◎関係者
▼芝野耕司 東京外語大学
渡辺清次 日本規格協会
▼八田勲 工業技術院 標準業務課長

◎事務局
稲橋一行 工業技術院 標準業務課 他5名


 前回と比べた異同は、NTTの委員が代理出席になり、電子技術総合研究所(以下、電総研)、日本電子機械工業会、富士通の委員代理が別の人物に交代し、前回は出席した総務庁の委員が今回は欠席している。

●その審議のようすは?

 前回の部会では、開会当初は何人かの委員がテクニカル・レポート化を求めていたが、審議のなかで附属書1~3を参考にする提案がだされ、芝野委員長みずから附属書1だけは参考でかまわないと妥協し、後半の議論は残りの附属書2~3を規定として残すか、それとも附属書1~3をまとめて参考にするかという方向に議論は収斂しつつあった。そんな流れをうけてか、この回のメーカー委員の発言は、最初から附属書1~3を参考にすることでまとまっているように読める。前回に引き続き芝野委員長が個々の発言に対して意見を述べるが、附属書1~3を参考にする案については、前回のように反対を表明してはいない。
 この回から新たに出席した電総研、戸村委員代理がさまざまな方向から議論を喚起したりするが、それは特段に活発なものに結びついたりはしない。つまり、この回の部会では、とくに大きな対立点は見いだせないのだ。
 むしろ何回にもわたって話題にのぼるのは、国際規格、ISO/IEC 10646(Unicode)に0213の新しい文字がどのように反映されるかということだ。もしこの私の読み方が正しいとすれば、反対派の委員達の心を占めていたのは、すでに0213が規格化した後の段階の話ということになる。


●この日も口火を切ったのは日本IBMだった

 まず事務局から前回議事録の確認があった後、前回の部会の論点を整理する資料の説明がある。そして、この資料にそった形で審議が始まる。最初に発言したのは前回と同様、日本アイ・ビー・エム(以下、日本IBM)の斎藤委員代理だ。議事録から引用しよう。前回同様、〈 〉は引用者注、【 】は引用者が工業技術院(以下、工技院)の了解のもとに読解のために補った言葉だ。

北城委員(代理斎藤)


外字について確認したい。97年のJISX0208【改正】で外字が原則禁止になるまで、これまで20年間、外字は許されてきた。最近の雑誌でも、ユーザにとって外字というのは一つの文化であるという捉え方をしている。外字は、通信だけでなく、印刷やデータベースも使っているわけで、通信では外字を使わないという暗黙の了解、常識になっている。したがって、外字を否定するというのは、非常に問題になると思います。


 前回ならばここから論争が生じるのだが、今回はそうではない。富士通の川村委員代理、日本電気(以下、NEC)の藤崎委員代理から、先の発言を受けたかたちで、であるからこそ附属書1~3を参考の扱いにするべきという意見が出される。つまり“外字を認めないから0213の規格化は反対”というような方向には、今回はならない。

 これらの発言に対して芝野委員長が説明する。

 

芝野原案作成委員長


96年からインタネット上で情報公開し、その進捗状況の中間報告でFAQとして外字【領域をつぶして文字を拡張すること】について紹介、更に公開レビューでも特別に外字問題を取り上げたが、ユーザから特に意見はなかったという経緯がある。
 また、外字【は】、ユーザ定義、メーカ定義等何百種類もあり、現在、ばらばらに使用されている現状にある。それでも、外字が必要であるという要求に対し、規格の中で第3,第4水準を切り離している。Windows標準文字セットであれば、そのユーザ定義領域を残し、第3水準【のみ】を使うという対応になる。
 また、98のDOSマシン〈NECのPC-9801〉でも、その点を配慮してきており、ユーザのオプションは、許されるべきであるという認識で検討を進めてきた。情報部会で頂いた今回のような意見は、残念ながらこれまで3年間の原案作成期間中はなかった。


 これに対して棟上部会長から、当面は従来の外字資産を尊重していく考えがしめされ、その意味でも附属書1~3の方法しか実質的な実装方法がないとすること(つまり1~3を規定にすること)は疑問だと発言する。

 そして、電総研の戸村委員代理が、“アーキテクチャの自然さ”という新たな視点から、0213に対する疑問を述べる。

児玉委員(戸村代理)


【0213の】コードポイントの与え方が、どう見ても拡張ShiftJISを使うことを前提に設計されているようだが、【0213を】ISO2022系のコード系【だ】というのは不自然ではないか。【むしろこの0213原案はシフトJIS系といえるのではないか】
外字関連では、ISO2022系では、どれを使っているかを明示する仕組みになっていることから、その仕組みを使えばISO2022系で混乱は【文字化けは】起きないが、ShiftJISの体系はバージョンが認識されないため、その仕組みがないShiftJISでは問題が【文字化けが】起きる。
【もしも0213が2022系のコードだというのなら】JISX0208はそのまま【第1面】にして【文字を追加せず】、X0213で規定された1万何千字を【新たに】第2面【だけ】とするといった考え方もあったのではないか。
前回も指摘したが、ShiftJIS系の制限から削除しなければならない文字もあったと聞いている。それにこだわらなければもっと良い形があったのではないか。
X0213のレパートリー〈文字集合〉がきちんとした形でオーソライズされれば、UNIX系でX0213のソフトを作るということもあり得る。そのためには、国際的にオーソライズしてほしいとの要望もある。オーソライズというのは、文字のレパートリーとその意味付けが国際的に認めらているということである。


 これに対して、芝野委員長は「規格仕様の美しさだけでなく、産業界で如何に使われるかが重要である」とする。

●むしろUnicodeとの関係の話で盛り上がる審議

 ここから話はUnicode(=ISO/IEC 10646=UCS)の実装動向と、0213の新しい文字の収録見込みに移ってゆく。
 ISO/IEC 10646の審議に対して日本代表として参加するナショナルボディの委員長でもある慶應義塾大学の石崎委員が、0213の新しい文字もやがてISO/IEC 10646に収録される方向であり、問題はその移行期間中にどうするかだという発言がされる。
 それにつづき、斎藤委員代理が日本IBMでもUnicode(=ISO/IEC 10646)[*1]に移行しつつある現状を説く。

[*1]……一般的なパーソナルコンピューターでは支配的な文字コードがUnicodeだ。アメリカの主要コンピューター・メーカーを中心に結成されたUnicodeコンソーシアムによって制定されたデファクト標準だが、その内容は国際機関による公的標準(デジュール標準)であるISO/IEC 10646(通称"UCS"――Universal Multiple-Octet Coded Character Set)とほぼ同一。つまりISO/IEC 10646とUnicodeはまるで自転車の前輪と後輪のように、連携をとって規格化と拡張が進められている。情報部会のように公的標準を扱う場ではISO/IEC 10646かUCSと呼ばれるが、メーカーが実装する場合はUnicodeと称する場合が多い。この原稿ではISO/IEC 10646とUnicodeは同じとして、“ISO/IEC 10646(Unicode)”と表記する。


 これをうけて、電総研の戸村委員代理の発言、そして石崎委員、芝野委員長の発言。

児玉委員(戸村代理)


国際審議で、ExtB〈Extension-B〉かBMP[*2]【かに収録】と言う話があったが、ExtBだと規格制定に時間がかかる、サポートされるかどうか決まっていないという状況では、誰しもBMP登録の方が良いと思っている[*3]
 この規格審議と関係ないかもしれないが、関係者がそれぞれのポジションでBMPに登録させる努力をすることが必要ではないか。

石崎委員

ExtBは、今度CD投票〈最終から3つ手前の投票段階〉にかかる予定であり、これまでの規格よりかなり早く規格制定される。
規格はボトムアップで作るもので、特に漢字はIRG[*4]といった日本、韓国、中国などが集まった機関で決めており、その場ではBMPにもう漢字を追加しないことが合意されている。そのため、今の段階でBMPに日本の漢字を入れることは不可能である。ただし、過去の韓国の前例[*5]もあるので、表玄関からは無理だが、非常事態というのはあり得る。日本が総力を挙げて、各国とネゴするといったことをしなければ、到底無理であるが。

芝野原案作成委員長

韓国のとった滅茶苦茶な行動と、今回、日本が足りない漢字を入れてほしいと言うことはまったく違うので、同列に扱わないでもらいたい。
JTC 1/SC2[*6]の場でも、御存知のとおり、ISO10646がDIS1のファイナルの段階でユニコード【コンソーシアム提案】のDIS2[*7]に変更されたこともある。技術的な審議はボトムアップでやるが、それだけではない。

[*2]……ISO/IEC 10646は、タテ256×ヨコ256の区点からなる“面”を256面あつめてひとつの“群”とし、全体を128群とする体系だ。256×256×256×128=2,147,483,648文字を符号化するものだ。一方でUnicodeはタテ256×ヨコ256の区点からなる“面”を、第16面までの全17面分を規定することをきめている。このうち、最初の面、第0面を特にBMP(Basic Multilingual Plane―基本多言語面)と称する。現在のところ、ISO/IEC 10646もUnicodeも、BMPに収録する文字までしか規定していない。第1面以降はただ今拡張の審議中で、このうち漢字の拡張はExtension Bとして第2面に収録するべく、現在審議の最終段階をむかえつつある。

[*3]…現在のところは、ISO/IEC 10646もUnicodeもBMPしか文字を規定していないということは前述した。BMPよりも後の第1面以降は、UTF-16という符号化方法による、すこしアクロバティックな方法によって使用することになる(UTF-16については第1部第4回を参照)。この情報部会が開かれた時点ではUTF-16がはたして普及するのかどうか不透明であり、一方でBMPの文字を使う限りにおいては新たな符号化方法であるUTF-16を使う必要がないから、BMPに文字が収録された方がより実装に有利という判断がはたらく。つまり、ごく簡単に言うと、BMPは田園調布や成城学園のような“一等地”であり、第1面以降は都心から電車で2時間の新興住宅地なのである。

[*4]…電気通信情報分野での標準を策定するのはISO(国際標準化機構)とIEC(国際電気標準会議)によるJTC 1(Joint Technical Committee-1―第1合同委員会)だ。そしてその中で文字コードを担当するのはSC 2(Sub Committee-2―第2専門委員会)。SC 2はいくつかのWG(Working Group―作業部会)に分かれるが、ISO/IEC 10646の開発作業を担当するのはWG 2(第2作業部会)だ。世界中のスクリプトを収録するISO/IEC 10646の開発の中で、特に漢字のレパートリーの収集・選択を委託された下部機関がIRG(Ideographic Rapporteur Group―定訳はないが“表意文字報告者団”とでも訳せるだろうか)だ。参加国・地域・団体は、中国、TCA(台湾)、香港特別行政区、韓国、シンガポール、ベトナム、アメリカ、UTC(Unicode技術委員会)で、委員長は中国から選出されている。台湾は政治的な理由で、TCAという団体名で参加する。また、原則として決議はおこなわずに、合意をもとに議事を進めている。 

[*5]…'92年に制定されたUnicode1.1ではハングルを6,656文字を収録していたが、'96年のUnicode2.0では、これを完全に廃棄し、新たな領域に新たな配列で11,172文字を収録し直した。この結果、Unicodeはバージョンによって非互換な関係が生じることになってしまった。これが悪名高い“ハングルの大移動”である。背後には韓国進出をもくろんでいたマイクロソフトの意志が取り沙汰されたりしたが、真相はまったくの藪の中である。

[*6]…注4を参照。

[*7]…DISはDraft International Standardの略。WG(Working Group)でCD(Committee Draft)投票にかけられた原案は、可決されるとDISとなって、上部のSC(Sub Committee)に送られ、SCで可決されると最後にISO/IEC JTC 1総会でFDIS(Final Draft International Standard)として審議され、正式な規格となる。これが国際規格の“ボトムアップ”だ。ここで言われているのは16ビット(2^16=65,536文字)以上の国際文字コードを作ろうと審議が行われていたなかで、JTC 1総会にかけられていた原案(DIS1)が、最終段階になって否決され、Unicodeコンソーシアム提案による修正原案DIS2が急きょ可決されたことを指す。このDIS2が現在のISO/IEC 10646=Unicodeだ。前述したとおり、一般にJTC 1総会ではFDISと呼ばれるが、このケースだけはDISの呼称を使うようだ。


 話が国際規格の方へ逸れかけたところで、棟上部会長が軌道修正する。附属書1~3を参考にしても規格全体の意義は変わらないこと、また一部が問題であったからといってテクニカル・レポート化という話はないと強調する。そして他に意見を求めると、ふたたび話はUnicode(ISO/IEC 10646)にうつってゆく。

浅野委員

〈前略〉
また、BMP登録は、どの程度、その可能性があるのか。

八田課長

我々は、現在、BMP登録に最大限、努力しているところである。

北城委員(斎藤代理)

弊社は、UTC〈Unicode技術委員会〉メンバーである[*8]。現在、ExtBであっても、UTCを通せば、少しは道が開かれるのではないかということで働きかけをしている。見込みはわからないが、【0213の新しい文字である】400字の文字をBMPに入れる努力は続けたい。

 

[*8]…UTC委員長はIBMアメリカ本社のリサ・ムーア。ちなみにUTCに対する芝野委員長の0213の新しい文字を収録する提案は、この回の情報部会の約1カ月後、'99年11月23日付けの彼女の手紙( http://www.cse.cuhk.edu.hk/~irg/irg/N690_Lisa_JIS.doc )によって、一部を互換漢字として収録を仮受諾されたが、大半の文字はIRGへ審議差し戻しか、却下されることになる。


 この後、部会の審議内容は公開されるのかといった質問に、工技院の八田課長が議事録は原則公開で、審議内容は規格票の解説に盛り込まれるといったような、いくつかの質疑と応答があった後、棟上部会長が附属書1~3を参考にすることでよいかと問い、全会一致でそのとおり可決された。

 部会の最後に八田課長が、以下のように言う。

八田課長


附属書が規定から参考になったということだが、規格の一部であることから、附属書を最大限尊重してもらいたい。
ShiftJISからUCS系〈ISO/IEC 10646=Unicode〉への転換について、対外的に表明していくことも是非お願いしたい。


 こうして、第84回情報部会の2時間の論議は、午後5時に幕を閉じた。原案はこの後『通産公報』『News from MITI』によって国内外に意見照会されたが、特段の修正はなく、最終審議での修正のままの形でJIS X 0213:2000の名前で2000年1月20日に制定された。

 さて、次回は工技院が、この2回にわたる最終審議をどのように総括しているのかをお伝えする。配信は8月2日の予定だ。

◎付記
情報部会での最終審議のようすをまとめるにあたって、前回と今回にわたり工技院から多くの助言をいただいた。記して感謝する。

(2000/7/20)

[Reported by 小形克宏]