|
昨年11月の“日本語.COM”の試験登録サービスに続いて、今年2月からは“汎用JPドメイン”における日本語ドメインの登録が開始された。これまではアルファベットや数字などのASCII文字しか使えなかったドメイン名に、日本語やその他の文字が使えるようになった反響は大きく、これまで汎用JPドメインに申請のあった約20万件のうち、半分近くは日本語ドメインの申請だった模様だ。
とはいえ、今のところ、登録された日本語ドメインがすぐに“使える”ということにはならない。ごく一部ではDNSの運用が開始されているものの、これはあくまでも試験的な段階。我々が普段利用しているウェブやメールなどのアプリケーションから利用できるようになったわけではない。登録すること自体は一般的になった日本語ドメインだが、エンドユーザーにとっては、また登録者自身にとっても、ネット体験に何か変化をもたらすまでには至っていない。
それでは、日本語ドメインが“使える”ようになるのは、いったいいつになるのか? 今回は、日本語ドメインの標準化を推進している日本ネットワークインフォメーションセンター(JPNIC)にお話をうかがった。
●多言語ドメインの標準化は12月に延期?日本語も含まれる“多言語ドメイン”の標準化へ向けた検討作業は、IETFに昨年2月に発足した「Internationalized Domain Names Working Group(IDN-WG)」によって進められている。IDN-WGには、JPNICの会員も積極的に参加しており、検討中の仕様に基づいた評価ソフト(後述)を開発するなどの活動を行なっている。
インターネットの新技術が“標準”として普及するには、IETFによりRFCとしてまとめられることが重要だが、多言語ドメインについては「6月にも標準化される見込み」と言われてきた。6月といえばもう間もなくであり、そうなれば日本語ドメインが“使える”環境へ大きく前進する。
ところが現在のところ、IDN-WGではインターネットドラフトを30件余り発行してはいるものの、RFCにはまだ至っていない。どうやらRFCは12月頃にずれ込む見通しとなっており、標準化が遅れているように見える。
これに対してJPNICインターネット基盤事業部技術研究課課長の米谷嘉朗氏は、「何か問題があって標準化が遅れているわけではない。コンセンサスは得られており、議論はきちんと進んでいる」と説明する。これまで言われていた「6月の標準化」というのは、IDN-WGが昨年10月にまとめた指針から予測されていたものだという。その中で「6月にRFCへ向けた最終提案を行なう」とされていたために、「希望的観測」もあって「6月の標準化」がささやかれるようになったわけだ。
しかしその後、IDN-WGで具体的に必要な作業をリストアップしていったところ、当初よりも時間がかかることが判明。順調に作業が進んだとして、IDN-WGが最終提案を出すのは8月に開かれるIETFのミーティングにおいて、そしてRFCに漕ぎ着けられるのは12月頃になるとの見通しが得られた。標準化が延びたように見えるが、実はこれまで不確定だったスケジュールが見直されたためだというわけだ。
■IETF idn working group Web site多言語ドメインは、冒頭でも述べたように、これまでアルファベットや数字などのASCII文字しか扱えなかったところを、日本語やその他の非ASCII文字も使えるようにするものである。ここでは、多言語ドメインを実現する仕組みとして、IDN-WGが提案している方法を簡単に紹介する。
米谷氏によると、IDN-WGの提案としては「ACE(ASCII Compatible Encoding)によって8ビット文字をASCII文字に変換、それをネットワーク上での表現方式にしようということでほぼ合意している」という。
ACEにはいくつものアルゴリズムがあるが、例えばRACE(Row-based ACE)、BRACE(Bi-mode Row-based ACE)、LACE(Length-based ACE)という3種類のアルゴリズムを使って「日本語ドメイン名試験.JP」を変換すると、それぞれ以下のようになる。ACE変換後の文字列には「BQ--」「-8Q9」「LQ--」などの識別子が付けられており、もともとASCII文字のドメイン名と区別できるようになっている。
RACE 「BQ--3BS6KZZMRKPDBSJQ4EYKIMHTKQGYUZU2CM.JP」
BRACE 「JIXKYDQGD94NYB7IKAWYP2FWCEVMABI-8Q9.JP」
LACE 「LQ--75S6KZZMRKPDBSJQ4EYKIMHTKQGYUZU2CM.JP」
つまり、エンドユーザーに対しては多言語ドメインとして見えるが、実際にネット上でやりとりされるドメイン名はASCII文字で表現されたものになるわけだ。したがって、DNSプロトコルそのものを見直すといった大がかりな変更が避けられる。また、DNSサーバーやウェブサーバー、メールサーバーなどでも、必要になる作業は、設定ファイル中に記述されるドメイン情報の部分だけだ(多言語ドメイン名についてはACE形式で記述する)。
なお、現在“日本語.COM”などで採用されているのは、「BQ--」で始まるRACEだが、これは試験用に仮に採用されたものであり、標準として正式に決定されたものではない(それどころか、標準ではほぼ採用されない見込みだ)。今後、IDN-WG内の特別作業チームにより、「簡易なアルゴリズムであること」「現実的なドメイン名に対して効果的な圧縮が効くこと」「1対1のマッピングのアルゴリズムが保証されること」の3項目を基準に、最適なアルゴリズムを検討するとしている。
ところで面白いのは、2番目の「効果的な圧縮」について、「特別作業チームは英語がネイティブな人ばかりなので、実は他の言語のいいサンプルを持っておらず、困っている状況」だということだ。そこでJPNICでは、すでに「現実的なドメイン名」として多数登録されている汎用JPドメインをサンプルとして、それぞれのアルゴリズムでどのくらいの変換効率が得られるかを評価しているという。そして、日本語ドメインについての評価結果をインターネットドラフトなどの形でまとめる考えだ。
まだ実用化もされていない日本語ドメインの登録を、数多くのレジストラを通じて行なっている汎用JPドメインだが、「実サンプルを持っていなければ、技術の評価ができない。いろいろ悪評もあるが、その意味では、テストベッドでいろいろな日本語ドメインを登録していただいていることは非常に役に立っている」という。
なお、IDN-WGが提案する多言語ドメインを実現する方法については、JPNICのウェブサイトでも情報がまとめられている。日本レジストリサービス(JPRS)が管理している汎用JPの日本語ドメインも、IDN-WGの仕様に沿ったものとなる。
■多言語ドメイン名に関する技術解説(JPNIC)次に、ACEの変換処理をどこで行なうかということになるが、IDN-WGでは「IDNA(Internationalizing Host Names In Applications)」を提案している。その名称からも分かるように、アプリケーションソフト内で変換してしまおうという考え方だ。
具体的には、入力された多言語ドメインの文字に対して、1)ローカルエンコーディングからUnicodeへ変換、2)正規化、3)ACE変換──という処理がなされる。アプリケーションが、ドメイン名をリゾルバーやAPIに手渡す手前ですでにACE変換された状態に持っていくわけだ。なお、2)の「正規化」というのは、文字種(大文字と小文字)、互換文字(半角カナと全角カナ、ASCII英数字と全角英数字)、合成文字(濁点や半濁点の合成)など、意味的/表示的に同じ文字の表現形式を統一する処理である。
したがって、この環境を実現するには当然のことながら、ブラウザーやメールソフトなどのアプリケーションに変換処理機能が組み込まれなければならない。ところが、「正規化は非常に大きくて重い処理」だということで、「アプリケーションベンダーがこれをいちいち作っていたのではたいへん」なのだという。
そこでJPNICでは、正規化やACE変換のインターフェイスをAPIとして提供するソフトウェア「mDNkit」を開発し、公開している。mDNkitはオープンソースで製品への組み込みも可能なため、「現時点ではインターネットドラフトのレベル」ではあるが、「アプリケーションベンダーは、mDNkitを使えば、IDN-WGの仕様に対応したアプリケーションを作ることが可能だ」としている。
mDNkitとしてはこのほか、クライアントパソコンのリゾルバーやDLLを対応させることで多言語ドメインの名前解決が行なえるようにするバイナリーファイルも用意されている。これをインストールすれば、例えばすでに試験用にDNSに設定されている「日本語ドメイン名試験.JP」「ジェーピーアールエス.JP」などの日本語ドメインについて、pingコマンドなどを使って、名前解決が実際に動作すること確認できる。
なお、JPNICでは、6月6日から千葉県の幕張メッセで開催されるイベント「NETWORLD+INTEROP 2001 TOKYO」会場において、mDNkitの技術解説や同ソフトを使った名前解決のデモンストレーションなどを行なう予定だ。また、同イベントにはJPRSも出展するとしており、日本語ドメインでアクセスできるURLのリストを用意、実際に来場者がブラウザーのURLフィールドに日本語ドメインを入力してページを閲覧できる展示を予定しているという。
■mDNkit download多言語ドメインは、このように技術的にはほぼまとまりかけているわけだが、一般に日本語ドメインが“使える”ようになるのは、いつごろになるのだろうか? それには今後、解決しなければならない課題が残されている。
まず、IDN-WGの中で問題となっているのが、IDNAに関する特許問題だ。「アプリケーションの中に実際にAPIを組み込んで、多言語ドメインをACEに変換して送り出す」という仕組みが、米国のある企業が所有している特許に抵触するのではないかとされている。
今のところ、この企業から明確な見解が出ていないため、IDN-WGでも結論を出しあぐねている状況であり、最近の議論では、とりあえず特許については置いておいて検討作業を進めていくという流れに傾いているという。とはいえ、IDNAは、IDN-WGが提案する多言語ドメインの根幹をなすものである。「もし本当に、今IDN-WGでやろうとしている方式に特許がひっかかってきて、かつその特許の技術を使うことに何らかのお金がかかるようになってしまうと、IETFではその方式を標準として採用することはない」(米谷氏)。
それならば、IDNAを使わないまったく別の方法が検討されるのだろうか? しかし、IDNAは「既存のDNSやウェブサーバーになるべく影響を及ぼさず、比較的短時間で実現できる」として考えられた方法だ。これをあきらめなければならないとなると、「プロトコルそのものを変更しましょうというような別の方式ということになってしまい、時間がかかるやり方になってしまう」。さらに、「多言度ドメインそのものが、もしそんなに時間がかかる方法を採用するのなら、もっと違う方法、例えばディレクトリそのものをDNSと同様に使えるようにしたほうがいいのではないか」ということになる」。すなわち、IDNAをあきらめるということは、「大きな方向転換をして再出発を切らなければならなくなる」ことを意味する。どこかで後戻りしてしまう可能性があるということで、IDN-WGでは「ちょっと消極的になっている状況だ」。
さて、特許問題が決着して標準化に漕ぎ着けたとしても、IDNAには、アプリケーション側の対応という大きなハードルがある。
米谷氏は、「標準化されれば、多言語ドメインが使えるようになるんですか?」ということをよく質問されるというが、「DNS的には」使えるようになっている。したがって、「標準化されて、DNSの設定変換ツールなどが出てくれば使えるようになる」とは言えるわけだ。
しかし、「使えるようになる」というのは、「DNSが使える」ということではなく、通常は「ウェブのURLで使えるとか、メールアドレスで使える」ということを指すことが多い。そういう観点で言うと、「標準化が済んで、次のステップでブラウザーやメールソフトが対応して、やっとユーザーから見て今までのドメイン名と同じように普通に使える」ことになる。「標準化、すなわちRFCが出るということは、アプリケーションの対応が始まるスタートポイント」に過ぎないわけだ。
予定通り12月にRFCが出て、JPNICやJPRSが正式にDNSをスタートさせたとして、「来年の春頃には、使えるアプリケーションがぼちぼちと出るのではないか」としている。
なお、JPNICでは、IDN-WGが最終提案を出す8月頃をめどに、多言語ドメイン対応のアプリケーション開発を推進・普及するためのベンダーとの連絡組織を立ち上げる考えだ。そこで下準備を進めながら、12月にRFCとして標準化された時点で少しでも早い対応を実現できるように努力したいとしている。
また、多言語ドメインに関して理解しておかなければならないのは、これが実用化されたからといって、「メールアドレスのユーザー名の部分に漢字を使えるようにするには、多言語ドメインの技術でというわけにはいかない」ことだ。
URLについても、ドメイン名の部分だけではなく、パスの部分にも多言語を使うという動きは出てくる。米谷氏は、「ドメイン名に非ASCII文字が使えるようになったということが、次に、アプリケーションプロトコルの中で多言語をどのように扱っていくのかということに結びついて検討されていかなければいけない」という。IDN-WGが検討する範囲はドメイン名の部分についてと絞られているが、インターネットの多言語化にはさらにその先の問題が残されている。
●多言語ドメインは“徐々に”使えるようになる標準化作業が順調に進み、アプリケーションの対応も素早く行なわれたとして、それでも日本語ドメインが“使える”ようになるのは、来年の春頃になる。そうなると、今年2月に汎用JPとして登録された日本語ドメインがそれから1年間、お金を払っているのに“使えない”状態が続くことになる。
この状況について米谷氏は、「(mDNkitを導入するなど)ユーザー側でいろいろと対応していただかなければならないこともあるが、実際にウェブのURLとして使える場合もある。条件が折り合えば、少なくとも現状でもウェブをブラウズできる」とした上で、「かつてメールのMIMEという規格が出てきた頃、日本語でサブジェクトを書いても、ある人には日本語で見えるが、ある人には『=?ISO-2022-JP~』と文字化けして見えていた時代があった」ことを例に挙げた。多言語ドメインも「ちょうどそんな感じ」だと指摘する。「ACEでやりとりするということは、『=?ISO-2022-JP~』を使うということと同じ。そういうふうに見える人と、ちゃんと日本語に見える人が混在しながら、だんだん日本語に見える人が増えていく。それができるだけ短い期間に移行するように推進していきたい」としている。
登録開始と同時に一気に認知されるようになった日本語ドメインだが、“使える”環境については、どうやら急激に訪れるものではないようだ。
(2001/5/28)
[Reported by nagasawa@impress.co.jp]