イベントレポート

Internet Week 2019

今後もルートサーバーを健全に維持できるのか、信用していいのか――運用の課題と、検討されている新たなガバナンスモデル

TLDの国際化とラベル生成ルール

 続く話題は、TLDの国際化である。みなさんもご存知の通り、ドメイン名の文字列(ラベル)は国際化に対応済みであり、TLDごとにさまざまな言語による国際化ドメイン名(IDN)が使われている。

 しかしながら、TLDそのもののIDN対応については、ラベルごとにさまざまな言語、かつ書き文字(script:スクリプト)を含むため、そのままではルートゾーンにさまざまな言語・スクリプトのラベルが無秩序に混在することになってしまう(図8、図9)。

 このような状況が生まれるのは、利用者の混乱を避ける上で好ましくない。そのため、ルートゾーンにおいてさまざまな言語・スクリプトのラベルを統一的に取り扱うためのルールである「RootLGR」を決める作業が進められている。

図8:TLDプログラム
図9:ルートゾーンのラベル生成ルール(RootLGR)

 米谷氏は、RootLGRを決めていく過程で問題となったのは、同一言語のスクリプト内にある視覚的類似文字、すなわち見た目で違いが分かりにくい文字の存在であることを紹介した。

 我々が普段文字を見ているとき、視覚的類似文字があってもあまり問題にはならない。なぜなら、人間は周囲の状況や内容により、都合良く解釈してしまうからだ。米谷氏は、例えば中華料理屋のメニューで「うーメン」と書かれていても多くの人は「ラーメン」と解釈するだろうし、「ビーノレ」と書かれていても「ビール」と解釈するだろうという例を出して説明した。

 視覚的類似文字が問題になるのは、それが「識別子(identifier)」に用いられた場合である。

 識別子は、1文字でも違えば異なるものを指すことになる。そのため、この問題はASCII文字の範囲のみでも起こり得る(例:MICROSOFT←→MICR0S0FT)が、国際化ドメイン名の導入によってそのバリエーションが豊かになってしまったことが問題となっている(図10)。その例として、米谷氏からカタカナの「ハニー」と漢数字の「八二一」は書体によっては区別が付きにくくなることが挙げられた。

図10:視覚的類似文字の問題~概念~

 視覚類似文字については、IDNのプロトコル仕様ではラベルを文字コードで取り扱っているため対応が不可能であること、そのことから、RootLGRを用いた登録ルールの整備によって対応を図ろうとしているとのことである。一方で、ウェブブラウザーにおけるIDN表示については各ベンダーが独自の取り組みをしており、場合によってはそうした対応が混乱の元になるかもしれないということも述べられている。そうした状況に対応するため、米谷氏はW3CやIETF、ICANNなどの場で改めて議論を提起することを検討しているということであった(図11)。

図11:視覚的類似文字への対策