バックナンバーへ
このほかの連載へ
【連載】

小形克宏の「文字の海、ビットの舟」
――文字コードが私たちに問いかけるもの  

第3部 JIS X 0213は世界になにを発信したのか?
第6回 日本IBM代替案からうかがえる“メーカーの論理”(1)

       
Illustation:青木光恵

 インタビューが始まって、すでに2時間近くがすぎていた。ここは六本木の日本IBM本社ビルディング。これまでの話で、日本IBMがJIS X 0213(以下、0213)原案作成の過程をどのように見ているのかは、およそ聞けた。しかし、このテーマでもうひとつ私には確かめたいことがあった。それは彼等が提案したという代替案の中味だ。

 私はこの取材以前に日本規格協会へ0213の原案作成に関する議事録の複写を申請していたが、正式な議事録は未整理の状態で倉庫に保管してあり、すぐに出すことはできないということだった。その代わりにWG2幹事(親委員会の委員も兼任)で書記を務めた東京外語大学助教授、豊島正之による『JCS会議議事録』(以下、豊島文書)の提供を受けていた。

 ただしこれは正式な議事録の前段階の“議事録案”だった。通常、委員会の冒頭に前回の議事録案が提出され、出席者のチェックをうけ修整された後に正式な議事録となる。また、この豊島文書には、いくつかの会合の欠落がある。その反面、豊島が出席した親委員会のメモ(ここでは豊島は書記を担当しないので走り書き程度。しかしこの人は本当に筆まめな人のようだ)や、WG2の下の小委員会(後述)の議事録案も収録されている。

 この豊島文書を初めて読んだのは取材の直前のことだった。中でも一読してまず目についたのが、このIBM代替案だった。この“もうひとつの0213”だったかもしれない代替案の詳細を通して、実際にどのような議論の応酬を経て現在の0213が完成していったのか、そういったことがうかがえるのではないかと私は考えた。

 取材前、日本IBMの人々はこの代替案にあまり触れたがらないだろうと私は思っていた。常識的に考えれば、日本IBMがそうしたプロトタイプを喜んで出すとは思えない。もちろんJISの開発は国費でまかなわれている公共事業だ。そうした公の場で提出された案なのだから、個人情報に関わるような事情でもないかぎり、誰にでも公開されるのが筋だ。とはいえ豊島文書を見るかぎり、この案は圧倒的多数で否決されている。うんと一面的な言い方をすれば、日本IBMにとって“恥”とすら言える。

 でも、インタビューの冒頭で斎藤は「後で代替案を説明する」と言っていた(第3部第2回)。しかし、実際にどの程度話してくれるだろうか……。私は慎重に言葉を選びながら聞いた。

「WG2の議事録を読むと、1998年11月26日に日本IBMは代案を出してます。そこらへんのことをちょっと伺いたいんです」

 簡単なコメントでかわされるのが怖い私は、急いで言葉を続ける。

「僕の関心のポイントは、0213の原案作成の過程の中で、きちんと議論の応酬がされたのかどうか、そしてそれは投票をして決定するというような、ちゃんとした過程を踏まえて進められたかどうかってことなんですが……」

 つまり言外に、“代替案を見せてくれれば、あなた方がきちんと作業に参加した証明にもなる”と臭わせる、私なりの屁理屈だったのだが、そんな心配は完全な杞憂だったようだ。あっさりと斎藤が、こう答えた。

「分かりました。じゃあ、ちょっと準備したものがありますんで」

 準備? なにを準備しているというのだろう。斎藤が隣の榎本に目で合図をすると、榎本は小さく肯く。しかし、榎本は本題の前に、私に聞きたいことがあるようだった。私が手にしていた豊島文書のプリントアウトを見ながら尋ねる。

「今お持ちになっているそれ、議事録かなんかですか?」

 私は手の内を正直にさらすことにした。彼等がここまで誠実に答えてくれている以上、それが礼儀というものだ。

「ええ、規格協会からもらった、議事録のコピーです。ただこれ見ても、よく分からないんですよ」

 それは私の本心だった。少し前に文書を受けとったばかりの私には、まだ正式な議事録と議事録案の違いすらよく理解できていなかった。それに、読み慣れていない人間にとって、議事を凝縮した議事録のたぐいは非常に分かりづらい。宝の山であろう文書を前に、どう読んでよいか途方に暮れていたのが正直なところだった。榎本が手を差し出しながら言った。

「ちょっと見せていだけませんか。私の持ってるのと同じかどうか……」

 代替案に関連する部分だけを印刷してきた数枚の紙を渡す。それを検分して榎本は言った。

「議事録なんですか……。あ、これ、豊島先生の議事メモですね」

「これが出てきたんです、議事録を公開してくださいって言ったら」

 榎本は、そうなんですかと言って少し笑った。小田が代弁するように説明した。

「いや、榎本は自分が持っている文書は非公式だから、その話をしていいのか、豊島先生の許可を取らないといけないのかなんて、朝悩んでたんですよ」

 文字コードの委員会では配付資料が膨大なものになる。複写代の節約は予算の少ないJISの委員会では至上命題だ。そこで書記が採録した議事録案は、まずメンバーにメーリングリストを通じて配布され、その修正は各自が行ない、あらためて原本を配布することはしない。小田が言う“非公式”とは、おそらくその程度の意味ではないか(もちろん、これは現時点の私の推測だ)。榎本は小田の説明に苦笑いしながら言った。

「気にしてたんですけれど、もう小形さんが同じものをお持ちだったんで」

 ここで榎本は、機材の準備をしたいから、すこし休憩してもよいかと言った。機材の準備? いったい彼等は私になにを見せてくれるのだろう。

●代替案を日本IBMが提出するまで

 10分ばかりのコーヒーブレイクの間、榎本は応接セットのテーブルの上に置かれていたプロジェクターに、自分のThinkPadを接続し、プレゼンテーションソフトを起動していた。なんだか、すごいことになってきた。たかだか私のような者のために、彼等はかなり周到な用意をしてくれている様子だ。

「そろそろ、始めますか」

 斎藤が声をかけると、照明が落とされ、榎本がThinkPadのキーを打ってプロジェクターを操作し、資料をスクリーンに映し出しながら説明を始める[*1]]。

[*1]……日本IBMからこの資料をPDFファイルに変換したものを提供していただいた(http://internet.watch.impress.co.jp/www/column/ogata/part3_06/ibmplan.pdf)。読者の皆さんもこのファイルを見ながら、読み進んで欲しい。

「おっしゃるとおり平成10年、1998年の11月26日に代替案というのを委員会に持って発表しました。その経緯を説明いたします。実は私、1998年の4月に前任者と代わりました。そのあと5月にJCSの親委員会がありました。で、少なくとも5月の段階では、符号化方法に関してはまだ決まってませんということでした。その後、1998年10月27日にWG2委員会がありまして、そこで新JISの符号化方法案が発表された、これが私の理解でして、10月30日の親委員会の時、芝野委員長に確かめたところ、そのように返事されたと私のメモに載ってます」

 榎本らしい、非常に慎重な物言いだ。そういえば、同じような話し方をする人たちに会ったことがある。霞ヶ関の官僚だ。ひょっとしたら、榎本はエンジニアとしてもさることながら官吏の資質も強いのではないか。それともIBMという多国籍企業がそのような資質を要請するのだろうか。そう私は思いながら、彼の言葉を聞いていた。

「で、同年10月30日に親委員会があったんですが、――実はこれが私の出た2回目の親委員会なんですけども――ここで具体的に『新JIS符号化案』というのが出てきまして審議されました。ここでですね、弊社、日本IBMとNECさんが異議を申し立てたわけです。ただ、これは私見が入るとまずいと思いましたんで、議事録『JCS P16-01』という文書がありますので、以下そこからすべて引用してます」

 ここで、榎本は手元の書類に目を落とし、その内容を読みくだし始めた。

「伊藤委員ならびに榎本委員、まあ私ですね、この新JIS符号案では現行WindowsシステムでNEC拡張文字が割り当てられている領域や、ユーザー外字領域とオーバーラップするので、当然文字化けが起こるわけですけども、その取り扱いに関して、レビュー案として承認しかねるということを表明しています。で、いろいろ議論はありましたけれども……この議事録の文章はご存知じゃないですか?」

「読みました。確か、規格協会から出ているJCS委員会の平成10年度報告書の中に、その議事録が採録されてたと思います[*2]

[*2]……平成10年度報告書から該当部分を引用する。ちなみにこれは正式な議事録だ。

・新JIS符号化(JCS P-2-09)について
 伊藤委員並びに榎本委員よりこの新JIS符号化案では、現行のWindowsシステムでNEC拡張文字が割り当てられている第1面13区の符号位置の取扱い、及びユーザ外字エリア等として利用されているE0以降の符号位置の扱いについて、レビュー案として承認しかねる旨の指摘がなされた。
 芝野委員長より、ユーザはこの新JIS符号化への移行は強制ではないので、旧来の符号化のままで運用も選択できるので、問題はないはずであると説明されると共に、この件はWG2で以前から検討されてきたものであり、今更の否定的意見は理解しかねる旨の指摘があった。
 対して、具体的な資料が提出されたのは今回が始めてであり、今回の指摘自体の妥当性と共に、メーカの立場としてユーザの資産継承を保証する責務がある旨の主張がなされた。
 これを受けて豊島委員より、この問題の本質はサイズの問題であるが、そのこと自体は計画当初から理解できる事柄であり、この時期での主張の正当性は大いに疑問である旨の発言がなされた。
 榎本委員より関連する指摘として、現行のレビュー案のままでは、先に挙げた問題点自体を見落とす可能性があるので、その点の注意を促すような文章又は資料の追加要求がなされた。
 以上のような論議を経て芝野委員長より、以下の様な方針で臨むことが確認された。
 新JIS符号化案(JCS P-2-09)の文書に対して、中間案であることと共に、新JIS符号化に移行した際の影響を示す文章を追加すること。
 公開レビュー説明資料(JCS P-2-02)の文書に対して、新JIS符号化案は中間案である旨の文章を追加すること。
 伊藤委員並びに榎本委員は、今回のクレームを整理した資料を速やかに作成すること。
 WG2では、両委員の資料提示を受けて、速やかに成案作りの検討を行うこと。
 その成案については、公開レビューの説明資料として、速やかに公開していくこと。
(『符号化文字集合(JCS)調査研究委員会報告書』日本規格協会 1999年3月 p.17)

 榎本は、すでに私が知っているということを確認すると、くだくだしい説明は省略して先を急ぐことにしたようだ。

「結果的には、私はこの時に初めて符号化に関しての案が出てきたんじゃないかと思ってるんですけども」

●〈この時に初めて〉をめぐる私の考え

 榎本の話の途中だが、重要なことなので脇道に逸れさせてもらう。

 前述の通り榎本はみずからの理解として、1998年5月の段階では符号化方法はまだ決まっておらず、その後同年10月末のWG2で〈初めて〉新JISの符号化方法案が発表されたと言っている。

 しかし、前述の豊島文書を信じれば、榎本が言う10月末に先立つこと6カ月前、1998年4月23日のWG2で、『新JISにおける符号化表現案』(文書番号JCS2-25-06)が配布されている。もちろんWG2にも日本IBMは委員を出しており、この日の出席が確認できるが、一方で反対意見は記録されていない。そして、このJCS2-25-06は後述するWG2の下で実装を担当する小委員会『Div-M』(主査・安岡孝一)が手がけたのだが、日本IBMの社員はその一員だったのだ。

 念のため豊島文書のうち、JCS2-25-06を審議した部分を以下に引用しよう。

6.JCS2-25-06(安岡) 新JISにおける符号化表現案
第3・4水準を実装するとすれば、記号類886字、漢字(連続領域)字 3,848字の領域が出来る。第2面の33-64区を使わないのは、シフトJISエンコーディングで楽をする為。 現案では、第2バイトに0xfd、0xfeを含めていない。これを含めると、ISO-2022JP-3エンコードとの間のエンコード・デコードがものすごく大変になるので、止めた方がいいのではないか、式変換を考えないとすれば可能だが、遅くなる、との意見があった。

尚、第2バイトが0x40-となっているのを、0x20-から使う事は技術的には可能かという質問に対して、Microsoft社としてはシフトJISエンコーディングは変更して欲しくない、というのが、社のスタンスであるとの回答があった。 div-Mは、pro/con(引用者註:pro/conは賛否の意)を明記した提案を行なう様、主査から要請があった。 尚、策定に当たっては、ISO/IEC 2022への適合性よりも、実際に使われて来た ISO-2022-JPとの整合性の方を重視するとの意見があり、主査もこれを支持した。

7.外字
外字が使えなくなるという批判があるので、委員会として、外字に関する立場を明確にして置いた方がよい、という意見があった。 これに対し、既に公にしている立場で十分ではないかという意見があった。 私用外字エリアを確保すると、その分、必要な文字が減るので、そのトレードオフを考えて行なう必要があるとの意見があった。

(引用者註/引用中の“主査”とはWG2主査を兼任する親委員会の芝野耕司委員長を指す。煩雑なため便宜上拙稿では芝野の呼称は“委員長”で統一している)

 確かに榎本が芝野委員長に直接確かめた通り、同年5月には、符号化方法は〈まだ決まってません〉=未決定の段階だった。その意味では榎本の言葉は表面上矛盾がない。しかし、この段階で未決定だったのは符号化方法だけでなく、文字集合も同様だ。つまり0213自体がまだ未決定だったのだから、符号化方法が決まっていないのは当然と言える。

 榎本自身の言葉によって、彼も私と同じ豊島文書を持っていたことが分かる。私には、微細なことでも正確さにこだわり、かつ十分な準備をして取材にのぞんだはずの榎本が、このことになぜ一切触れなかったのか不思議に思える。

 また豊島文書からは、さらに2年前の1996年5月27日のWG2で、シフトJISで符号化可能な領域の広さを討論していることが確認できる。この時は日本IBMから他ならぬ小田が出席しているのだが、これまた反対意見は記録されていない。豊島文書を読むと、この1996年5月の時点では、0213の符号化方法のひとつとしてシフトJISを採用することは、まるで既定の事実のように扱われていて、どの領域まで拡張可能かは議論されても、シフトJIS自体の採否は議論されていない。

 先の註2で引用した、議事録に見られる芝野委員長の〈今更の否定的意見は理解しかねる〉という発言や、豊島幹事の〈この時期での主張の正当性は大いに疑問である〉という強い言葉も、こうした流れを踏まえると理解しやすいのかもしれない。

 これらを総合すると、こと親委員会に限っていえば正式な符号化案が提出されたのは、確かに榎本の慎重な言い回しのとおり〈この時に初めて=1998年10月末〉で矛盾はないが(豊島文書の話はすべてWG2でのこと)、組織としての日本IBMは、もっとずっと以前から符号化案の概略を承知していたはずであり、榎本以前にはまったく反対をしていなかったと私は理解せざるをえない。

 ところで余談にわたるが、日本IBMの社員がWG2/Div-Mに所属していた事実を考えあわせると、ことによれば榎本個人が符号化案を知ったのが〈この時に初めて〉ではなかったのかと私は思うのだ。実はWG2/Div-M委員だった社員と連携がとれていなかったのだと考えれば、後述するように榎本がたった1カ月で代替案を仕上げるという苦境に追い込まれた理由が理解できるのだが……さて、真相はどうだろう。

 脇道はこれくらいにして、榎本の話に戻ろう。[*3]

[*3]……日本IBMへ掲載前の原稿を送り、同時にコメントがあれば掲載する準備があることを伝えたところ、〈お送りいただきました原稿案中の弊社社員のコメントに関しましては、修正すべき点はございません。〉という回答だった。

●代替案に賛成したのは日本IBM、1社のみ

「で、その結果ですね、議事録の一番最後の方になりますが、伊藤委員、ならびに榎本委員は、今回のクレームを整理した資料をすみやかに作成すること、とあります。で、WG2では両委員の資料提示を受けて、すみやかに成案づくりの検討を行なうということで、いわば代替案を持ってきてくださいということだったんですね。それでこの10月30日から代替案を作る作業に入ったわけです。で、次のWG2委員会が11月26日にありまして、ここに代替案を持っていきました」

「それは親委員会ではなくWG2だったんですね?」

「あ、最初はですね、これはWG2の委員会だったんですが、10月30日の親委員会で、以降は親委員会とWG2と合同で開いてくださいということになったんです。ですからこの11月26日の委員会は、WG2と親委員会の合同委員会になってるはずです[*4]

[*4]……ただし、前掲の平成10年度報告書によれば、1998年11月26日に行なわわれた委員会は第8回WG2委員会であり、合同委員会としては記録されていない(p.10「委員会実施日一覧」より。同書にはWG2の議事録はない)。また豊島文書による出席者一覧によれば、この回の親委員会からの出席は榎本ひとりだけだ。もっとも親委員である榎本がWG2に出席している以上、WG2単独の会合としては不自然なのだが、これらの資料はその消息についてはなにも語っていない。なお、正式な議事録については現在日本規格協会に資料を申請中だ。同協会からは好意的な返事をいただいたので、きっと近いうちに読者の皆さんにその成果を報告できると思う。

 それならば、と私は聞いた。

「親委員会のメンバーは、どのくらい出てこられたんですか?」

 榎本は、いかにも残念そうに眉をひそめて言う。

「実際には、親委員会の委員はほとんど出席してないですね、この時は」

 私は続いて聞く。

「合同委員会にしましょうと言ったのは事務局の側なんですか」

 いや、と言って榎本が答える。

「何人か親委員の方です。というのは親委員会で、WindowsシステムのNEC拡張文字領域とか、ユーザー外字領域の扱いに関して議論するということ自体、本来おかしいのではないかと思っている委員がいたと思うんですね。それは規格の中身に立ち入った細かいことですから。そういうことは親委員会で議論するんではなくて、本来WGで議論することでしょうと。で、WGでの議論が不十分だから親委員会にまでこういう問題を持ち越してしまうんではないかというふうに考えた委員がいたんですね。そこで、以降の委員会はWG2と親委員会を、合同委員会にしてくださいっていう提案が出されたんです」

 言った後、榎本は急いで付け加えた。

「提案したのは私じゃないですよ」

 なるほど、私は確認するように聞いた。

「つまり、親委員会の委員も出られるようにと」

 榎本はうなずいて答える。

「ええ、出られるようにしてくださいと。で、以降の委員会はですね、基本的に親委員会とWG2の合同委員会となったはずです。もちろん、WG2だけの委員会とか、さらにディビジョンK、L、Mっていう小委員会[*5]がありますので、そういった委員会は合同ではありません。でも、WG2の委員会は基本的に合同委員会がほとんどなんです。ただし、その親委員会の委員は逆に出席する人が少なくなってしまったと」

[*5]……WG2の小委員会(ディビジョン:division)は、Div-K(漢字)、Div-L(非漢字)、Div-M(実装)に分かれていた。

「で、この11月26日の委員会で代替案を提示しました。結果的には一応議論はありまして、ボーティング(投票)の結果、賛成1、反対14、棄権7で否決されました。で、小形さんがお持ちのその豊島先生のメモには、棄権6と書いてあると思うんですけれども……あ、ここに書いてますね」

「ええ、そう書いてありますね」

「棄権6ですね。これは私がメモ書きした方を参考にしましたので、6か7かっていうのはちょっと定かではありません。私のメモによりますと7になってましたんで、一応私のメモのまま載せさせていただきました」

 賛成が1だけで反対が14あったということが一致している以上、棄権の数が1つ違っても大勢に影響がないような気がするが、それが気になるのが榎本の気質なのだろう。ちなみに豊島文書によれば、この時の出席者は芝野委員長をのぞいて25名。事務局である規格協会の人間をのぞいても24名。投票は委員長を除外して行われるのが普通だが、棄権の数が6でも7でも総数が合わない。

「後ほど、もう少し詳しくこの代替案の説明をいたしますけれども、主な反対理由としては、コード体系間の変換は文字コード変換表によるというのが代替案の骨子ですので、ここに反対があったということと、それから代替案では部分集合を認めてくださいと言ってますので、そういう部分集合は認められないということ。また、JIS X 0212(補助漢字)の使用を前提としていますので、それに対する反発もありました。主なその3つの理由で否決されたというのが私の理解です。もちろん、この賛成1というのは弊社だけですね[*6]

[*6]……豊島文書から、該当部分を以下に引用する。

7.JCS2-32-10(日本アイ・ビー・エム大和事業所による)新JIS漢字(案)に対する代替案

 現在 NEC拡張漢字・IBM拡張漢字(両者の duplicate encoding部分は両方とも避ける)・Windowsユーザ定義領域が使っている領域を避ける。今回の規格案にある文字で、その領域に合致する文字は、同じコードポイントを保存して、エンコーディングする事を提案する。
 親委員会での議事では、NEC拡張漢字・IBM拡張漢字・ユーザ定義領域の保存の提案であるが、その提案のためには、アーキテクチャに関わる提案が不可欠である、という事で、こうした提案を行なう。
 このため、追加文字集合を次の規模に制限する代替案。尚、具体的な文字集合の選定に就ては、現行代替案の範囲とはしないが、X0212 内の文字を優先する事を提案する。尚、今後、文字集合を提案するか否かは、更に検討する。

 具体的には、その規模は、
  Shift-JIS  空き 1,783字(X0212 内の文字を含む)
  ISO-2022-JP 空き 1,608字(一部IBM選定漢字に使うため)
  EUC     空き  664字(G3 補助漢字を含まず)

 尚、Shift-JIS、2022-JP、EUCは、それぞれ別のサイズの文字集合となり、相互間の変換は、全て UCS 経由の表引きで行なう。
 尚、ISO/EUC 2022 下での運用は、構わないが、規定しない。

提案のまとめ:
  1. Windows 標準領域をそのまま残す
  2. 補助漢字を優先する
  3. それに入らないものは捨てる
  4. 以上を満たすために、大幅なアーキテクチャ変更が不可欠である。

 votingに移り、PRO(1)、CON(14)、ABS(6)で、IBM 提案は、否決された。
(引用者註:votingは投票、PROは賛成、CONは反対、ABS:abstentionは棄権の意)

●では、その代替案の中身は?

 そうして榎本の説明は、代替案の最大の焦点である符号化の具体的内容に移っていくのだが、残念ながらここで紙幅がつきた。次回のお楽しみとさせていただく。ただし、ここで重ねて言いたいが、その実現性の可否やクォリティを問うのは、私も日本IBMも本意ではない。むしろ重要なのは、その代替案の裏側にあるメーカーの思考、あるいは論理であり、それが私たちエンド・ユーザーを幸せにするか否かなのだろう。

◎前回の訂正

 前回の原稿『註1』の中で、私は以下のように書いた。

ただし現実の図式はもっともっと煩雑だ。なぜならこのふたつのメンバーはかなり重複している。例えば斎藤が身を置く日本IBMはUnicodeコンソーシアムの一員だが、同時に彼自身は『ISO/IEC JTC 1』の日本代表の一人でもある。

 これについて、斎藤部長当人から「Unicodeコンソーシアムの一員なのは米国IBM社で、日本IBM社はメンバーではありません」という指摘をいただいた。そこで相談の結果、この部分を以下のように訂正したい。

ただし現実の図式はもっともっと煩雑だ。なぜならこのふたつのメンバーはかなり重複している。例えば斎藤が身を置くIBMはUnicodeコンソーシアムの一員だが、同時に彼自身は『ISO/IEC JTC 1』の日本代表の一人でもある。

(2001/3/7)

[Reported by 小形克宏]

INTERNET Watchホームページ

INTERNET Watch編集部internet-watch-info@impress.co.jp
Copyright (c) 2002 Impress Corporation All rights reserved.