Internet Watch logo
記事検索
バックナンバー
速報 マイクロソフト・プレスセミナー報告(下)
[2006/5/24]
速報 マイクロソフト・プレスセミナー報告(上)
[2006/5/23]
特別編31 JIS X 0213の改正を総括する(3)
[2006/2/14]
特別編30 JIS X 0213の改正を総括する(2)
[2006/1/12]
特別編29 JIS X 0213の改正を総括する(1)
[2005/12/26]
特別編28 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(11)
[2004/12/1]
特別編27 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(10)
[2004/11/30]
特別編26 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(9)
[2004/11/29]
特別編25 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(8)
[2004/9/16]
特別編24 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(7)
[2004/9/13]
特別編23 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(6)
[2004/6/2]
特別編22 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(5)
[2004/4/16]
特別編21 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(4)
[2004/4/12]
特別編20 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(3)
[2004/4/6]
特別編19 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(2)
[2004/4/2]
特別編18 JIS X 0213の改正は、文字コードにどんな未来をもたらすか(1)
[2004/3/30]
バックナンバーINDEX[2000/1/19~]
Illustation:青木光恵
小形克宏の「文字の海、ビットの舟」――文字コードが私たちに問いかけるもの


特別編28
JIS X 0213の改正は、文字コードにどんな未来をもたらすか(11)
改正の影響:フォントデザインを変更しないアップルコンピュータの真意(下)

ヒラギノフォントは、本当に改正JIS X 0213に対応しているのか?

 ここまで報告したように、アップルコンピュータの木田泰夫氏は「Mac OS Xは、改正されたJIS X 0213にはすでに対応済み」とした。そして、前回検証したように、確かにアップルのMac OS Xは、2001年に発売されたバージョン10.1の時点から、改正JIS X 0213で示された「例示字体と同じ字」を表示・印刷することができた。

 しかしこれらの文字は、そこで規定されている通りの符号位置を全部が与えられているわけではない。例えば改正JIS X 0213では168文字の例示字体を変更しているが、それと同じ字はヒラギノフォントにあるものの、規格にある通りの符号位置を割り当てられていない(図1)。

■図1
改正JIS X 0213において例示字体を変更された168文字について、できるだけ例示字体と同じ字を探して入力してみた。すべて入力できるが、これらは規格にある符号位置を与えられていない。青で示した文字だけがUnicode符号位置を持つ

 これで本当に改正JIS X 0213に対応していると言えるのだろうか? ……と、ここまでが前回の内容だった。ところがこの疑問、JIS X 0213という規格の立場からすると、大変な勘違いなのである。どういうことか?

 そもそもJIS X 0213に限らず文字コード規格においては、例示字体にだけ符号位置が割り当てられているわけではない。符号位置が対応づけられているのは、社会的に「同じ字」とされる範囲=包摂の範囲に対してだ(特別編1926を参照)。つまり、例示字体はいくつもある文字の形の1つを例示しているにすぎない。たとえ例示字体と形は違っていても、包摂の範囲にありさえすれば、「例示字体と同じ字」だ。例示字体とそっくりなものだけを取り出し、それを正統とするような考え方は、規格自身が否定している。JIS X 0213では「1. 適用範囲」として、以下のように書く。

 この漢字集合は、主として、データ処理システムと関連する装置及びデータ通信システム間での情報交換用とする。(中略)この漢字集合は、これらの用途にだけ適用するものであって、それ以外の一般の日本の表記などについて、何らの基準を与えるものでも、制限を与えるものでもない。

 この規格は、図形文字及びそのビット組合せを規定するもので、用途、個々の図形文字の具体的字形設計などは、この規格の適用範囲とはしない。
(JIS X 0213:2000、日本規格協会、2000年、p.1)

 大事なところなので、包摂について少し詳しく説明したい。図1の中から人名でもよく使われる「辻」という文字を例にとろう。この字はJIS X 0213では面区点1-36-52に収録されている。ここでの初版と改正版の例示字体の違いは、しんにょうの点の数だ。一点しんにょうがJIS X 0213初版、これが改正JIS X 0213では、印刷標準字体[*1]と同じ二点しんにょうに変更された。ただし、包摂の範囲は変更されていない。規格では一点と二点のしんにょうの違いは、「1点画の増減の違い」として包摂=同じ字とする(JIS X 0213:2000、日本規格協会、2000年、p.38)。したがって、面区点1-36-52を実装する時は、一点と二点のどちらを割り当てても初版・改正版両方のJIS X 0213に適合する。

■図2 JIS X 0213における包摂の範囲
包摂の範囲は網の目に喩えることができるだろう。中央の赤い四角が面区点1-36-52の網の目。一点しんにょうの「辻」も、二点しんにょうの「辻」も、両方ともこの網の目を通る。つまり両方とも規格の上からは「同じ字」だ。一方で「迂」という字は別の字であり、だからこの網の目を通ることができない

 規格としての改正JIS X 0213から見れば、面区点1-36-52には、規格で示された包摂の範囲内の形が対応づけられていれば適合となる。実際、ヒラギノフォントは一点しんにょうの形を面区点1-36-52に割り当てている。これとは別に二点しんにょうの形がどのように実装されていても(例えばJISにある符号位置を与えられていなくとも)、規格としての改正JIS X 0213には関わりがない。実際ヒラギノフォントは、JIS X 0213が示す包摂の範囲を、そこで規定された通りの符号位置に割り当てている。したがって、木田氏の「改正JIS X 0213には対応済み」との言葉は正しいと考えてよい。


変更された例示字体168文字のうち、7文字は他国の互換漢字として収録

 もっとも、1つ疑問がないでもない。図1の青で示した文字だ。これを取り出して以下に並べてみた(図3)。

■図3
改正JIS X 0213で例示字体を変更された168字のうち、図1の青で示した7文字(互換漢字)を取り出した。カッコ内はこれらに対応するCJK統合漢字と、そのUnicode符号位置とJIS X 0213の面区点位置。『文字パレット』では、Unicode符号位置を表示させている

 この青の7文字にUnicode符号位置を割り当てられていることで、ヒラギノフォントは改正JIS X 0213に対応していると言えないのだろうか? もちろん、そんなことはない。これも図2で説明したのと同じ理屈だ。すなわち、上の図3で言うと、青の文字も黒の小さい文字も、ともに改正JIS X 0213が示す包摂の範囲にある。そして、どちらか片方が改正JIS X 0213の規定する符号位置を与えられている以上、ヒラギノフォントは改正JIS X 0213に適合することになる。つまりこれら青い文字の存在も、木田氏の「対応済み」という言葉を裏切るものではない。

 もっとも、JISの立場からはこの7文字に問題はないとはいえ、実装の点から疑問が残らないではない。これら7文字のうち4文字が収録されているUnicode符号位置2F800~2FA1Dは、領域名を『Duplicate Characters from CNS 11643-1992』といい、台湾の文字コード規格CNS 11643と情報交換をする際、文字の形が化けないようにする互換用文字として収録されたものだ。これについて規格書『The Unicode Standard 4.0』は以下のように書く(この解説部分はUCSにはない)。

原文:
The CJK Compatibility Ideographs Supplement block consists of additional compatibility ideographs required for round-trip compatibility with CNS 11643-1992, plane 3, 4, 5, 6, 7, and 15. They should not be used for any other purpose and, in particular, may not be used in Ideographic Description Sequence.
http://www.unicode.org/versions/Unicode4.0.0/ch11.pdf、p.305)


筆者訳:
CJK互換漢字追加領域は、CNS 11643-1992の3、4、5、6、7、15面との往復の互換性を保証する互換漢字を追加する必要から策定された。これらは他の目的のために使用すべきではない。漢字構成記述文字列(IDS[*2])としては、これらの文字を使ってはならない。

 Mac OS Xは多言語OSであり、台湾で使われる文字コード規格もサポートされている。しかしここで取り上げているヒラギノフォントが、台湾で主たる使用を想定されているとは考えられない。だから、そこでのこれら7文字の実装は、台湾の文字コード規格とは無関係と言ってよいだろう。ということは、Unicodeの「使用すべきではない」とした条項を犯していないか。

 厄介なのは、この7文字が印刷標準字体と同じということだ。これらは使用頻度で言えば、常用漢字表や人名用漢字に次いで高いグループに属する。したがってこの7文字を使おうとする確率も、それにつれて高くなるはずだ。これらの文字を、Unicode符号位置が付いているから情報交換も可能だと誤解するユーザーが出たら? Mac OS X同士ではともかく、それ以外のシステムとの間では正常な情報交換は望めない。アップルには、ユーザーがそうした誤った操作をしないよう、なんらかの対処が求められるのではないか。


アップルのさらなる「対応策」とは?

 以上説明したように、アップルは何も変更しなくとも改正JIS X 0213への対応を果たすことになった。一方でここまで何回も書いたように、マイクロソフトはMS明朝などの純正フォントを、改正JIS X 0213の例示字体に合わせた文字デザインに変更することを表明している。となれば特別編23の最後でも書いたように、新旧Windowsのバージョン間は当然として、Mac OS Xとの間でも字体が化けることになる。この「字体の壁」について、アップルとして何か対策を考えているのだろうか? 7月9日、私はMac OS Xの次期バージョン『Tiger』の製品説明会に出席し、これについて質問した。同社プロダクトマーケティング課長の櫻場浩氏は、以下のように答えてくれた。

 私どもは、日本の国語施策としてこういう方向に行かなくてはいけないという大きな流れは理解しているつもりです。かつ、マイクロソフトさんがLonghornでどういう対応をするのかということも理解しています。その上で1つ言えるのは、アップルとして、そこで性急な対応をとることにより市場を混乱させるということは、ぜひとも避けたいということです。

 具体的に申し上げますと、Longhornがいつ出るか言うべき立場にはありませんけれども、一般的に2006~2007年と言われております[*3]。そのLonghornがリリースされた時に、マイクロソフトさんのOSの、どういうバージョンが市場に残っているのかというと、Windows 95から始まって、98があって、2000があって、XPがあって、そこでようやくLonghornだということになると思います。

 そうすると、小形さんの言われる問題が現実のものとして露呈してくるのは、Longhornのシェアが、マイクロソフトさんのOSのなかで大きくなってきた時に、はじめて大きくなってくる問題であると思います。

 私どもは、そこまでのロードマップを念頭におきながら、その時に応じた、ユーザーにとってベストな方式を提供していこうと考えています。

 ただ、具体的にどういう方法かというのは、残念ながら申し上げることはできません。しかし、まったく理解していないというわけではないということ、それに理解しているのに何もしていないというわけではない、そういう姿勢だけ、現在のところはご理解いただければと思います。

 また、私からのメールによる問い合わせに答えて、前出アップルのエンジニア、木田氏は「個人的な見解だが」と前置きした上で以下のように回答した。

 Mac OS Xでどうするかに関して具体的な予定をお話しすることは現時点ではできませんが、ユーザーが必要に応じて両方を簡単に使えるようにしていきたいと思っています[*4]

 プラットフォーム間の問題もありますが、やり方によっては同じプラットフォームの異なるバージョン間での問題の方が大きくなるように思います。例えば、ヒラギノをフォント名そのままに表外漢字字体表の形に変更すると大混乱が起きるでしょう。この点にも配慮しつつ、考えていきたいと思っています。

 つまり、ここまでの私の文章で取り上げた「対応済み」とする、イベント『PAGE2004』における木田氏の発言は、あくまでもヒラギノフォントについてのことであり、他の部分ではまだ対応策があるということだ。そしてそれは、Longhornの登場後、少し時間が経ってからになる。なるほど、同社の今後の動きを期待して見守ろう。

 以上、3回にわたってアップルの改正JIS X 0213対応策を検討した。次回は特別編23で説明したマイクロソフトの対応策とも比較しながら、両社の対応が問いかけるものを考えよう。

[*1]……表外漢字字体表に示された「明治以来、活字字体として最も普通に用いられてきた印刷文字字体であって、かつ、現在においても常用漢字の字体に準じた略字体以上に高い頻度で用いられている印刷文字字体」および「明治以来、活字字体として、康熙字典における正字体と同程度か、それ以上に用いられてきた俗字体や略字体などで、現在も康熙字典の正字体以上に使用頻度が高いと判断される印刷文字字体」(表外漢字字体表、p.2~3)。
[*2]……漢字構成記述文字列(Ideographic Description Sequence)とは複数の符号位置を持つ漢字を「部品」として、これらの合成により1文字の漢字を表現しようとするもの。和訳資料としてはJIS X 0221-1「附属書F 代替書式文字」の「F.3 漢字構成記述文字」(p.909~912)、英文資料ではUnicode 4.0「11-1 Han」の「Ideographic Description」(p.307-309)を参照。
[*3]……この『Tiger』製品説明会の後、8月27日にMicrosoftは、Longhornを一部機能縮小した上で、2006年中を目標に発売することを発表した(PC Watchの記事「次世代Windows『Longhorn』は2006年発売へ」、http://pc.watch.impress.co.jp/docs/2004/0828/ms.htm)。
[*4]……どうすれば「必要に応じて両方を簡単に使える」ようになるのだろう? 木田氏が何を念頭においているのかわからないが、私はOpenTypeフォントの仕様書にある、以下のようなものを思い浮かべた。

 http://www.microsoft.com/typography/otspec/features_fj.htm#jp04

これはすでに現行のヒラギノフォントに内蔵されており、アプリケーションが対応していれば、メニューから実行することで、全文か選択部分を符号位置はそのままで表外漢字字体表の文字に変更可能だ。ただし、現在対応しているアプリケーションは非常に限定されるのが現実。この機能を土台に、アプリケーションのインターフェイスを工夫するというシナリオは十分考えられるように思う。

( 小形克宏 )
2004/12/1

- ページの先頭へ-

Internet Watch ホームページ
 Copyright ©2004 Impress Corporation, an Impress Group company. All rights reserved.