【連載】
小形克宏の「文字の海、ビットの舟」
――文字コードが私たちに問いかけるもの
第2部 これが0213の特徴とその問題点
第5回 制定過程編(中)
|
|
●どんな人間がJIS X 0213:2000を作ったのか?
さて、実際にJIS X 0213:2000(以下0213)の原案作成をおこなったのは、JCS委員会のなかに設けられた第2分科会、WG2(Work Group-2)だ[*1]。ちなみに、JIS X 0208(以下0208)の第4次改訂、97JISもWG2の担当である。
こころみに97JISの規格票のWG2の名簿の人数と0213のWG2名簿[*2]のものを比べれば、97JISが23人[*3]であるのに対して、0213は36人と大幅に増強されている。また、このうち0208から引き続き0213の作成にあたったのは17人[*4]。つまり97JIS改訂のスタッフの7割が残留し、これが0213のスタッフの半分を占めた。
[*1]……G2の主査は、JCS委員会の芝野委員長が兼任。また、WG1の方はJIS X 0201:1997、つまりISO/IEC 646(いわゆるASCII)のJIS規格版の第3次改訂を担当した。ただし、WG1の主査は芝野とは別人。
[*2]……WG2のメンバー名簿は、現在でもウェブで公開されている(
http://jcs.aa.tufs.ac.jp/jcs/jcs-memb.htm )。しかし規格票末尾のリストとは若干の異動があるようだ。
[*3]……純粋な原案作成中の委員席数を数えるため事務局スタッフをのぞき、同じ母体出身者の任期途中の交代は、まとめて1人と数えた。
[*4]……同一の母体から出ていれば同じと見なした。
|
では、どんな人間が増えたのだろう? 97JISのスタッフと0213のそれを比べると、一目で気がつくのが印刷・出版・新聞社など、大ざっぱな括りでいう“活字業界”から多く人を得ていることだ。97JISの時点ではわずかに大日本印刷と読売新聞社からしか出ていなかったのが、0213では9人と4分の1を占めるに至っている[*5]。
[*5]……この中にはフォント・メーカーはふくんでいない。理由は本文で後述。以下、活字業界のメンバーの出身母体名のみを規格票から抜き書きする。講談社、新潮社、三省堂、東京電機大学出版局、印刷史研究会、日本新聞協会、朝日新聞社、大日本印刷、凸版印刷。
|
実は、これは画期的とも言えることなのだ。'90年の改訂のみならず、'83年の第2次改訂、そして'78年の制定時点までさかのぼって委員名簿を調べてみても、印刷会社、日本新聞協会から出る(しかも1社ずつ)ことはあっても、新聞社、出版社はまったく参加していなかった。
これらの会社は文字コードを製品に組み込む“メーカー”とは違う、実際に文字コードを使う“ユーザー”と言えるだろう。0213よりも前の原案作成委員会が、コンピューター業界出身者が半分を占め、ユーザーの代弁者といえばほとんど学識経験者しかいなかったことを考えると、これまでは委員の人選が片寄っていたといわれても仕方がない。しかし、0213スタッフの人選からは、明確に今までの方針からの転換が読みとれるのだ。
同じことは、委員とは別の“オブザーバ”という肩書きをもつ人々が多いことからも言える。オブザーバとは、ようするに無給スタッフである。委員が会合に出席すると、交通費と数千円の謝礼が出るのだが、オブザーバにはいずれも支給されない。ただし投票権などスタッフとしての処遇はまったく同一だ。
0213スタッフ全36人のうち、委員は24人、オブザーバが11人、そして工業技術院から1人。一方で、97JIS時点のスタッフは全23人で、うちオブザーバは2人だけ。しかもこの2人は工業技術院と文化庁、つまりすべて官庁からの出向者。ところが0213では、11人のうち5人が前述の“活字業界”からの人間だ。
これらを総合すると、以下のように言えるかもしれない。まず、0213のスタッフの半分は97JISの作業で気心の知れた人間で固めた。しかしこれだけではまだまだ足りない。そこで97JISの21人から、24人に増やしてもらった委員枠のプラス分をすべて活字業界に割り当て、それでも足りないので、旧来は官庁出向者の受け皿という意味しかなかったオブザーバー枠を拡大再解釈して、活字業界をはじめとして、これはと思う人材を登用することにした[*6]。
[*6]……さらにいうと、97JIS規格票の「解説」末尾には《原案の調整に当たっては、次に示すJCS調査研究委員会の平成8年度からの委員にも協力を仰いだ。》として、規格票に列記する97JISスタッフとは別の10人の名前をあげているが、このうち1人の事務局員をのぞけば全員が0213のスタッフに横滑りしている。平成8年度は'96年4月から始まる。その数カ月後には97JIS原案はJCS委員会の手をはなれ最終審査に持ち込まれるから、これは0213の作業開始を見込んで、前倒しでスタッフになってもらったと言えるだろう。だとすれば、0213の開発を急ごうとする強い意志を感じることができる。ちなみに、10人のうち事務局員は2人。残り8人のうち、すでに活字業界から3人入っている。
|
ここまで書いたことは、あくまでも規格票だけを見て推測したことだ。実際にはすべての委員が0213の作業開始から終了まで勤めたのではなく、途中で辞任したスタッフもいたようだ。また途中から何らかの理由で姿を見せなくなった人もいたと聞く。当然ながらこれらのことまで規格票は語ってくれない。だから上記の数字はあくまでも目安でしかない。しかし、大ざっぱな流れ、方向は言い当てているのではないか。
ところで、日本語の文字を収集するにあたっては、国語学者の体系的な専門知識がぜひとも必要となる。実は97JISの時点で、当初は2人だった国語学者が、途中から3人に増やされたことが、当時JCS/WG2委員だった池田証寿のサイトに掲載された文章から知ることができる。
この文章に登場する豊島正之は97JIS時点のWG2の幹事であり、規格票の編集責任者でもある。そして増やされたもう一人の国語学者が笹原宏之。3人とも0213のスタッフとして役職はそのままに留任している。
以上、ここまでの人事を直接発令したのは日本規格協会であり、それを陰に日向に指導する通産省の工業技術院なのだろう。しかしおおよその発案元は、はからずしも池田の文章に語られたように、JCS委員長にしてWG2主査を兼ね、文字コードに関する現行JIS規格のほとんどすべての改訂[*7]をおこなった芝野耕司であるはずだ[*8]。つまり、ここに優れた見識をもつオルガナイザーとしての芝野の一面を見ることができるというわけである。
[*7]……JIS X 0212(補助漢字)をのぞく。なお、本文中に登場する以外で芝野が委員長として関わった文字に関する規格は次の通り。JIS
X 0202:1998『情報技術――文字符号の構造及び拡張法』、JIS X 0211:1994『符号化文字集合用制御機能』、JIS X
0221:1995『国際符号化文字集合(UCS)―第1部 体系及び基本多言語面』、JIS X 4051:1995『日本語文書の行組版方法』、JIS
X 4062:1996『日本語文字照合順番』。また現在JIS X 4052『日本語文書の組版指定交換形式』となる規格の原案作成中だ。他にデータベース言語SQLの規格や、SGML、マルチメディア・データベースなどの規格も担当したようだが、こちらの方は未調査で、まだこれ以外にもあると思われる。以上はJIS規格に限った話で、以前書いたように文字コードの策定を統括する国際機関(ISO/IEC
JTC1/SC2)の議長にも就任している。いずれにしても、この人の仕事の全貌をつかむのは容易ではない。
[*8]……この点について工業技術院に聞いたところ、以下のような回答が寄せられた。
JCS委員会は、国(工業技術院)からの委託事業として、財団法人日本規格協会が、原案作成委員会を協会に設置し、JISX0208-1997の改正、JISX0213-2000の制定に向けた原案作成作業を実施。
そのため、JCS委員会の委員構成は、その委員選考、委員委嘱において、工技院が了解する形で決定したものであり、芝野先生が自由に決められるものではありません。
委託契約締結時に、委員名簿も添付することになっており、バランスを逸した委員構成であれば、追加・修正を行うケースもあります。
ただし、この質問じたいが締め切りぎりぎりに行われたため、たとえば“では芝野は人選にまったく関係なかったのか?”というような再質問には答えていただく余裕はなかった。これについては後日あらためて報告したい。
|
●どんな人間がJIS X 0213:2000を作ったのか?
さて、以上見てきたのはあくまでも肩書きだけの問題だ。本当に考えなければならないのは、むしろ“どんな仕事をしたか”ということだろう。それが端的にあらわれるのが、原案作成でおこなわれた“悉皆(しっかい)調査”だ。つまり、実体のある文字集合をたんに収集するだけでなく、その中のすべての文字につき、1字ずつ原典にさかのぼって同定してゆく調査だ。JCS/WG2は以下の7つの悉皆調査をおこなっている[*9]。
(1)法令の文字全部
(2)国宝・重要文化財の文字全部
(3)文部省学術用語集の文字全部
(4)『国書総目録』の文字全部
(5)NTT電話帳の文字全部
(6)行政地名の文字全部
(7)1997・98年の文部省検定済み教科書の文字全部
[*9]……1月18日、日本印刷技術協会でおこなわれた豊島正之の講演『新JIS漢字第3及び第4水準の開発について』より。
|
ここで簡単に“文字全部”と書いたが、これがどれだけべらぼうな労力を要するか、実のところ、書いている私には想像を絶するものがある。特に教科書調査では、127社、1,207種、177,967ページにも及ぶ大規模なものだ。文字コードの原案作成委員会がここまで大量の悉皆調査をおこなったのは、洋の東西を問わず空前だったし、ひょっとしたら絶後かもしれない。そして、ここでは紙幅の関係で詳しくは書かないが、JCS/WG2のおこなった調査は、これだけではないのだ。
ここに至って、私たちはようやく前節で述べてきた人選が実に真っ当だったことを納得できる。なるほど、たしかにこれは36人もの精鋭がいなくては到底成し遂げられなかったろうし、残念ながら予定は大幅にすぎてしまったが、それもまた当然といえるような大事業であった。
●公開レビューは誰のためのものか?
最後に公開レビューについて書こう。
法律に書かれた原理原則はともかくとして、JISに限らず工業規格というものは、規格によって直接利益を受けるものがリードして作られるのが現実だ。つまり、工業標準とは、受益者にあたる会社たちが知恵と人間を出し合って作られるもので、“誰のための標準化か?”と問われれば、“メーカーのためだ”と答えるのが正直なところだろう。すくなくとも私はそのように理解している。
文字コードの原案作成委員会と言えば、まず委員になるのはコンピューターのハードウェア/ソフトウェアのメーカーから派遣された社員だし、NTTといった通信会社も委員会に人を出す。そして、それを学識経験者が専門知識と中立的な立場からささえ、通産省の工業技術院が全体の舵取りをする――良いも悪いもない、工業規格とはこれら三者からなる三角構造の中で作られるというのが、この世界の“体質”ともいえるものなのだ。
これは国内に限ったことではない。たとえばISO/IEC JTC1[*10]などといった情報技術関連の公的な国際規格を決める委員会の参加者も、三角構造のいずれかに属する人間が代表として派遣されるようで、基本的には同じ構造と考えてよいだろう[*11]。
もちろん、原案を作成する委員達は本来の自分の業務をこなしながら、わずかの報酬で、つまりほとんど手弁当で作業をすることになる[*12]。すなわち、工業規格の原案作成は、ボランティア的な献身によっておこなわれている。このことじたいは決して忘れてはいけないことだ。しかし、原案作成委員会の構成が固定しがちなのは確かだし、文字コードという公共性がきわめて高い規格の場合(なにしろ“文字”は誰でも使うのだ)、それがネックになりうるのもまた一面の事実なのである。
0213の策定をしたJCS/WG2が、横断的な人事により、そんな従来の原案作成委員会の構成を打ち破ったのは、今まで見てきたとおりだ。そして、そんなJCS/WG2の気風がよくあらわれているのが、公開レビューという手法だ。
JCS/WG2では、積極的に作業途中の資料をインターネット上で公開し、最終案の前に公開レビューとしてその時点の原案を公開し、各界から意見をつのり最終案に反映させた。これがどれほど画期的で、どれほど強い風当たりが予想されることかは、今まで工業規格が、前述した三角構造の中で――我々エンド・ユーザーの目から見ればそれは“密室”[*13]でしかない――進められてきたことと対比すれば分かるだろう。
[*10]……ISO(国際標準化機構)とIEC(国際電気標準会議)によるJoint
Tchnical Committee-1(第1合同委員会)。情報技術分野ではISOとIECは合同で標準化作業をしており、JTC 1の“合同”(Joint)とは、このことを指す。文字コードを管轄するSC2をはじめ、17の専門委員会(Sub
Committee)を置く。( http://www.jtc1.org/
)
[*11]……本文で後述するISO/IEC
JTC1の日本代表である情報規格調査会の棟上昭男会長は、これについての私の問い合わせに、以下のように回答している。
少なくともJTC1では大分以前からずっと,ユーザの視点をどのようにして反映させるか,あるいはユーザの参加を促進するにはどうすればよいか等の課題が,懸案事項の一つとしてあがっています.しかし具体的には,これといった名案がないというのが実態です.
[*12]……前述の棟上会長によると、情報規格調査会から国際会議に出る委員(延べ1000人以上)に関しては交通費も含めて無報酬だとのことである。以下回答より。
もう少し正確に言うなら,企業委員の場合は,ほとんどの場合業務として出てきてもらっているので,給料はもちろん旅費等も会社持ちということになります.
この場合は国際会議等のための海外出張旅費も,すべて会社持ちということになります.つまり各企業からみれば,完全なボランティア活動になっていると言えます(情報規格調査会は,会員会社から,この他に決して安いとは言えない会費を払ってもらっています).
委員にはこの他に,大学,国研等からの中立委員,および会社をリタイアした独立の専門家等がいるわけですが,この人達にも委員手当や謝金の類は一切支払われていません.小生も含め,このような人達は完全無料奉仕ですが,遠距離委員には旅費が支払われることと,SCやWGの委員長,主査等の場合には,国際会議に出席する際には,(たいてい本人には赤字になりますが)海外出張旅費が出ることが少しだけ違います.
[*13]……本当に密室かどうかについては、工業技術院から以下のような回答があった。
工業技術院では、JIS作成過程における透明性確保のため、JISの原案作成から規格制定・改正に至るまで、各段階に応じて、委員会への参加や意見提出の機会を設けています。
(1)原案作成作業計画を標準化ジャーナル(財団法人日本規格協会発行)を通じて、意見照会を行います。
(2)JIS原案作成段階での審議開始に当たっては、通産省公報、「News from MITI」を通じて、国内外に、広く関係者に、委員会への参加や意見を求めています。
(3)情報部会の審議段階においても、通産省公報等を通じて、部会へ参加して、意見を述べる機会の公告を行っています。
(4)情報部会審議後に、JIS制定改正前には、通産省公報や標準化ジャーナル等を通じて、意見照会を行っています。
では、これらの工業技術院の意図が、本当に機能しているかどうかがここで問題になると思うが、今は時間がない。その検証は他日を期したいと思う。
|
私は芝野委員長が公開レビューをすることで、この三角構造に風穴を空けてくれたことを、あつく支持したい。本当に、よくぞやってくれたものだと思う。もっともある意味で、私のような、コンピューター・メーカーの会社員でなければ
学識経験者でもない、もちろん官僚でもない人間が公開レビューに好意的な立場を とるのは当然だ。とにかくこうした手法がなければ、私のような人間の声を規格に反映させることができないのだから。
そんなわけで私がここで公開レビューを褒めそやすことは、あまり意味がない。しかし、数年前の文字コード論争で広範な立場から声があがったことを考えると、すべての工業規格が、旧来の三角構造の内部だけで作成される時代は、もはや過ぎ去ったのだということは言えると思う。
さて、取材者としての私が興味を持つのは、はたしてこの公開レビューという手法が、芝野委員長以外の原案作成の場でも根付くのかどうか、ということだ。そこで、私は情報規格調査会の棟上昭男会長に、公開レビューについてどのように考えるか質問してみた。
情報規格調査会は情報処理学会の傘下にあって、さまざまな情報処理関連の国際規格に対し日本代表として人を派遣し、また対応するJIS規格の原案作成を担当する、いわば情報技術関連の工業標準の中枢のひとつともいえる機関だ。
棟上会長自身が前述したISO/IEC JTC1の日本代表だし、ISO/IEC JTC1/SC2の議長でもある芝野耕司の出身母体もこの情報規格調査会となる。そしてこの秋の改訂を目指して作業中のISO/IEC
10646のJIS規格版、JIS X 0221の第2次改訂の原案作成も、ここが行っている。なお、棟上会長はJIS規格原案を最終審議する、日本工業標準調査会・情報部会の部会長を兼任している。
以下、私の質問と、棟上会長の回答をそのまま掲載する。国際規格に対応する情報規格調査会の代表ということもあり、回答は国際規格に軸足をおいたものになっていることにご注意いただきたい。個人的な考えと断った上でだが、公開レビューを重要視していることを明確にしており、とても意義の深いものだと思う。
【質問】情報規格調査会は、この公開レビューをどのように位置づけていらっしゃるのでしょうか。好ましい手法か、それとも単なるパフォーマンスなのか、どのようにお考えでしょう。
【回答】個人的には非常に高く評価しています.国際標準の場合には,新規プロジェクト提案内容,あるいはCD[*14]や
DIS[*15]などの文書が,少なくとも専門家の間では世界中にかなり広く流布されるので,特別なケース以外は問題は比較的少ないと思いますが,日本独自の規格に関しては,従来は事前に内容を知る機会はあまり無かったと思います.しかし今後は公開レビュー方式は標準的な手続きになってくるのではないかと思います.また学会では,国際標準に提案する前段階のプレ標準的な技術を,学会独自の標準情報として出してゆくことを,現在検討しております.
|
[*14]……CDはCommittee
Draftの略で、ISO/IEC JTC1傘下では、専門委員会(Sub Committee)の下部機関(WG―Work Group)で可決された原案(Draft)。専門委員会で審議され、可決されるとDISと名称が変わり、上部機関、つまりJTC1へと送られる。
[*15]……DISはDraft
International Standardの略。ISO/IEC JTC1傘下では、専門委員会から送られたDISはJTC1総会で審議・評決される。
|
◎第2部第4回への追記
昨日公開した、第4回の原稿で、私は以下のように書いた。
つまり、最初から収録文字数に関してはシフトJISの範囲を考慮することが予定されていたわけだ。もっともまずシフトJISで符号化可能な文字数が11,280であり、これから0208の収録文字数6,879を引くと4,401文字になることを考えると、概数とはいえ、どうしてこれよりも600文字も多い約5,000文字という数字が出てきたのか、現在の私には分からない。
|
これに対して早速森山将之さんから以下のようなメールをいただいた。
約600文字も多いのは、シフトJISが2バイトコードとしての範囲として通常は FCFC までを使うようになっていたのに対して、JIS X 0213の計画当初は、シフトJIS符号化では FFFCまでを使う計画だったため(芝野氏に直接確認して FFFC まで使う予定である旨を聞きました)、564文字[@]多い、約 5000文字という数字が出てきています。
[@]……564文字 : 94 * 2 * (0xFF - 0xFC) = 564
94文字 * 120区 - 6879文字 = 4401文字
となりますが、
94文字 * 126区 - 6879文字 = 4965文字 (約5000文字)
となります。
|
つまり予定していた符号化可能な領域じたいが、従来のシフトJISよりも広かったというのだ。たしかに公開レビューで公開された資料『シフト符号化に関する追加情報』(
http://jcs.aa.tufs.ac.jp/jcs/pubrev/shift.pdf
)でも以下のような記述がある。
3) Windows での2バイト符号化領域は第一バイトが81 から9F までとE0 からFC まででしたが、新JIS でのシフト符号では第一バイトが81 から9F までとE0 からFE までと拡張されます。第一バイト領域をプログラム内でハードコードしている場合や、FD とFE を特殊用途に使っている場合は、アプリケーションの修正が必要となる場合があります。また、システムが、第一バイト領域をアプリケーションに返す機能を有する場合も、注意する必要があります。
|
では、なぜ領域を狭めることになったのか? 公開レビューのページで公開されている『符号化方法修正案』(
http://jcs.aa.tufs.ac.jp/jcs/pubrev/revcode.html )では以下のように述べている。
公開レビューにお寄せいただいた意見、および委員会での検討の結果、"EUC"及びシフト符号化の方法を修正することに致しました。
この修正は、旧来のソフトウェアに新しいJIS漢字がインプットされてしまった場合にハングアップや異常動作が発生するのを極力おさえる、という視点に立ってなされたものです。
修正の要点としては、シフト符号化でFDxxとFExxを使用しないこと、"EUC"での呼び出しをSS2からSS3に変更しJIS X 0212とバッティングしない区を用いること、の2点があげられます。
なおこの修正の結果、新しいJIS漢字で追加可能な文字数は、原案の最大1957+2820=4777字から、最大1957+2444=4401字に縮小されます。
|
つまり従来のシステムとの互換性維持のために符号化可能な領域を縮小したということだ。ちなみに、このページのは日付は'99年1月29日になっている。なお、これについてのより詳しい説明は、同じページで公開されている『シフト符号化表現における第1バイト互換性保持のための理由書(案)』(
http://jcs.aa.tufs.ac.jp/pubrev/new-sjis.pdf
)を参照されたい。
以上説明したように、前回の原稿で《現在の私には分からない。》と書いたことは、実はすべて公開ずみの資料に書かれていた。不明を恥じたいと思う。
それにしても現在のシフトJIS対応アプリケーションでは使用不可能な0xFD**、0xFE**の領域まで、どうして使わねばならないと考えたのだろう? もしも、この領域をふくんだ形で0213が制定されていたら、シフトJISアプリケーションは書き直さなければ、せっかくの0213の新しい文字を使うことは不可能になっていたのだ。それでは『開発意向表明』[訂正](
http://www.tiu.ac.jp/JCS/ )で述べている《現状の使用環境で直ちに実装可能であり,利用可能であることが前提》という方針が守れなかったのではないだろうか?
この問題では、川俣晶さんからも同様のご指摘をいただいた。森山さんとあわせて感謝したい。ただし、川俣さんは符号化領域の拡張だけではなく、いわゆる半角カナの領域をつぶすことも当初は意図していたとされている。そしてその論議のために原案作成が遅れたのではないかというニュアンスで語っておられる。以下、引用しよう。
0213初期アイデアの中には、
・ 半角カタカナ領域を廃止し、そこを2バイト文字の先頭バイトに割り当てる
・ 2バイト文字のコードレンジの最後の値を0xfcから0xfeに拡張する
という考え方があり、当初収録可能と考えられていた文字数は、最終段階で考
えられた文字数よりも、ずっと多かったと言えます。
公開されている資料の中には、半角カタカナ廃止を断念したことや、コードレ
ンジの変更を断念したことに関するコメントがあったように記憶します。
これは、最初の問題提起の中の
> -これらは符号化方法に対する反対だったが、すでに開発意向表明の時点で符号
> 化方法について述べている。なのになぜ最終段階になって反対するのか?
という部分と関連します。
半角カタカナの廃止や、コードレンジの拡張は、きわめて大きな互換性に対す
る問題であるために、強い反対意見がありました。
つまり、符号化方式に関して反対意見があり、審議の過程で、それを受け入れ
る形の妥協が行われた、と見て良いと思います。
最終段階で反対意見が出たことに関しては、(他の要因もありますが)、妥協が
十分か不十分かの判断が分かれたことが原因の一つでしょう。
つまり、長い時間の多くが、半角カタカナの廃止や、コードレンジの拡張の是
非の議論に費やされ、肝心のシフトJISの拡張が望まれているか否か、というポ
イントに関する議論には、あまり時間が取られていない、と言うことではないか
と思います。
|
しかし、現在はまだこれを裏付ける資料は見つけられていない。私としては川俣さんのこの部分の指摘については保留させていただきたいと思う。
◎修正
Masatoshi Kimuraさんより、池田証寿『「対応分析結果」のことなど』のリンクが切れているとの指摘があり修整した。ご指摘に感謝します。(2006/2/23)
(2000/6/15)
[Reported by 小形克宏]
| |