第252回:フィルタリング選別の最終判断はやはり「人間の手」で
専門のURLリサーチセンターを持つネットスターの強み



 PC向けサービスだけではなく、最近はゲーム機などでの搭載も進むURLフィルタリングサービスだが、実際にはどのような仕組みでURLを判断しているのだろうか? フィルタリング関連の技術やサービスの提供で知られる「ネットスター」の心臓部ともいえるURLリサーチセンターを訪問し、フィルタリングの仕組みを伺った。





より身近になってきた「URLフィルタリング」

 先日、テレビのバラエティ番組で「学校裏サイト」が話題に取り上げられていた。「学校裏サイト」とは、もともとは内部的なコミュニケーションのために利用されていた学校をテーマとした掲示板サービスで、最近では学校の噂や生徒、教師への実名での誹謗中傷の場にしまったサイトの総称。現在、非常に大きな問題となっているそうだ。

 しかしながら残念だったのは、番組で主に取り上げられていたのはその被害状況だけで、その解決策としては「フィルタリングという仕組みが存在する」という簡単な紹介で終わってしまったことだ。もちろん、番組の全体的なテーマから若干離れていたこともあるのだが、個人的にはもっとフィルタリングについて詳しく取り上げてもよさそうなものだと感じた。

 これまでフィルタリングのような技術やサービスは、大きな話題になるような少年事件が発生したときに注目を集める程度だったが、最近では前述のように学校などを舞台にした身近なトラブルが増えてきた影響からか、幅広いユーザーの注目を集めている。

 そこで今回は、フィルタリングの裏舞台とも言えるURLの収集がどのように行なわれているのか、ネットスターのURLリサーチセンターを見学させていただいた。対応していただいたのは、同社営業マーケティング本部 マーケティング部 部長の高橋大洋氏、マーケティング部 コーポレートコミュニケーション課 広報担当の吉井まちこ氏、そして技術開発本部 開発部 データテクノロジー課の佐藤幸氏だ。





ネットスターとは

「インターネット悪質サイトブロックサービス for BBルータ」に対応したNECアクセステクニカの「Aterm WR8200N」

 本題に入る前に、まずはネットスターという会社について簡単に説明しておこう。ネットスターは、2001年にアルプスシステムインテグレーションとトレンドマイクロが共同で設立した企業だ。フィルタリング用URLリストの収集や分類、フィルタリング製品の研究開発を中心に行なっており、高品質のURLデータベースで主に法人向けの国内市場で高い評価を受けている。

 これまでは、言わばバックエンドのデータベース提供が主だったため、一般にはあまり知られていなかった企業だが、携帯電話向けのフィルタリングサービスのデータベースを提供するなど、その技術は身近なところに存在している。また、本コラムでも過去に取り上げたが、NECアクセステクニカやコレガ製のルータ向けに「インターネット悪質サイトブロックサービス for BBルータ」というフィルタリングサービスも提供している。

 ルータ向けのフィルタリングサービスはまだ登場したばかりということもあり、認知度も低く、現状では利用者も少ない。しかし、パソコンだけでなく、ネット接続に対応したゲーム機やテレビなどの家電製品でもフィルタリング機能が利用できるなど、今後の普及が期待されているサービスだ。


「インターネット悪質サイトブロック for BBルータ」設定例フィルタリングの対象となるURLにアクセスした場合、閲覧が制限される




機械的な収集だけではないフィルタリングの世界

「フィルタリングの世界は実に奥が深い……」。今回、ネットスター株式会社を訪れて、お話を伺ったが、率直にそう感心した。特に、そのサイトへのアクセス可否を判断をするためのカテゴリ分けにはかなりの工夫がなされている。

 ここでフィルタリングの仕組みを簡単に説明しておこう。ユーザーがブラウザを使ってサイトにアクセスする際、フィルタリングサービスではそのURLのカテゴリをデータベースに問い合わせる。URLが該当するカテゴリが、あらかじめ設定したルールに適合している場合はアクセスを許可、そうでない場合(保護者などが見せたくないと設定した場合)はアクセスを拒否するという流れだ。

 たとえば、アクセス先のURLのカテゴリがアダルトであり、そのカテゴリの閲覧を許可しないルールに設定している場合は該当のURLが閲覧できない。逆にカテゴリ設定が許可になっていればアダルトサイトであっても閲覧が可能だ。このため、URLがどのようなカテゴリに分類されているかが、フィルタリングサービスにとって非常に重要となる。

 一般的なイメージからすると、検索エンジンのようなロボットがサイトを巡回し、一定のアルゴリズムによってカテゴリ分けするのかと思いがちだが、これは必ずしも正しくない。

 同社の高橋氏によると「もちろんクローラによる巡回も行なっていますが、迷惑メール、ブログのスパムコメント、スパムトラックバックなどからのURL収集、さらにサイトのアクセスランキングなどで急激にランクを上げてきたサイトなども調査の対象としています」という。メールやブログなど、サイトの運営者がどのような方法でサイトの存在を告知しているのかを分析し、その立場からURLを収集しているというわけだ。

 また、カテゴリ分けするのは必ずしも危険なサイトのみではない。「たとえばファイル転送サービスなどは、これは企業のセキュリティという面から考えると、情報漏洩の可能性があるサービスとも言えます。このため、必ずしも危険なサイトではありませんが、ストレージサービスというカテゴリに分類し、企業ユーザーが必要に応じてアクセスを遮断し、リスクを回避できるようにしています」(高橋氏)。





サイトの本質を見極め正確な判断を下す

URLリサーチセンター

 このように収集したURLはいったん仮の状態でカテゴリ分類されるが、そのままデータベースに登録されるわけではない。ここで登場するのが、同社が仙台に設置しているURLリサーチセンターだ。冒頭で紹介した佐藤幸氏を筆頭に、35名の人員が365日無休でURLの確認とカテゴリ分けを行なっている。

 実際の作業を見せてもらったが、それはかなり地道な作業だ。未分類のURLリストを1つずつアクセスし、その内容を確認して、カテゴリ分けとコメントを記入していく。インターネット上に毎日何千、何万と生まれるサイトを次々に分類していくのだから、かなりの作業量だ。

 驚いたのは、その作業の緻密さだ。たとえば、一見、水着のグラビア写真が掲載されたブログのように見えるが、そのリンクをたどるとアダルトサイトに誘導されるという例がある。佐藤氏によると「一見するとブログですが、サイトの本当の目的はアダルトサイトへの誘導です。このため、アダルトサイトの入り口と判断して、アダルトのカテゴリに分類します」という。

 同様に、掲示板でもその書き込みの内容が犯罪にかかわるようなものの場合、そのサイトは掲示板のカテゴリではなく「違法と思われる行為」のカテゴリに、アダルトサイトを装ったワンクリック詐欺のサイトなどもアダルトではなく「違法と思われる行為」のカテゴリに分類される。

 要するに、サイトの内容を人の目で確認するのはもちろんのこと、そのサイトのリンク先などもきちんと調査し、サイトの本質を見抜いてからカテゴリ分けしていることになる。非常に正確な作業だ。

 また、URLリサーチセンターには携帯電話向けサイトを分類するチームも存在しており、同様に携帯電話向けのサイトも1つずつURLにアクセスして確認している。最近の携帯電話向けのサイトは、ブラウザのエージェントやIPアドレスなどをチェックして、PCからのアクセスを拒否する場合が多い。このため、手間はかかるものの、携帯電話を利用して実際にサイトにアクセスして確認作業を行なっている。

 フィルタリングサービスを使った経験がある人の中には、思わぬサイトへのアクセスが拒否されたり、逆に本来拒否されるべきサイトへのアクセスが許可されるなど、データベースの正確性に疑問を持ったことがある人も少なくないことだろう。

 筆者もその1人だったが、今回の作業工程を見て、このような整合性の低さはそのサービスのデータベースが人の目によってきちんと確認されていなかったからだということにはじめて気がついた。もちろん、ネットスターのデータベースも完全とは言えないが、少なくとも、現在、カテゴリ分けされているサイトは非常に緻密な確認作業によって分類された正確性の高いものと考えて差し支えないだろう。





非常に高い現場力

技術開発本部 開発部 データテクノロジー課の佐藤幸氏

 個人的に感心したのは、このURLリサーチセンターの現場力の高さだ。センターを率いる佐藤氏によると、「単純にリストからサイトを確認するだけでなく、夏なら旅行のサイトを中心に調査したり、12月にはクリスマスなどのキーワードでサイトを調査します」という。つまり、ユーザーや市場の動向をきちんと把握し、それをベースに効率的な調査をしていることになる。

 また、サイトによっては、その一部のコンテンツだけがアダルトに分類される場合などもある。たとえば、スポーツ新聞のサイトなどがこれに相当する。このように、リスト化されたURLは、実際にアクセスして、その細部まで調査してみないと、URLのどのレベルまでをニュースに、どのディレクトリ以下をアダルトに分類すれば良いかが判断できない。このような判断もリサーチセンターの各担当が自らのスキルによって判断している。

 リストのカテゴリ分けは、ともすれば機械的な作業になりがちだ。しかし、それを単なる機械作業として終わらせることなく、きちんと現場レベルで工夫しながらより高いレベルで作業していることに感心した。しかも、このような現場で蓄積されたノウハウは、定期的に本社の開発チームとの会合によってフィードバックされ、システムの開発にも活かされているという。

 世間では「見える化」などと言って、現場に何となく存在している暗黙知を、誰もが理解し活用できる形式知化することの重要性が説かれているが、まさにこれが実践されていると言える。おそらく、このURLリサーチセンターがネットスターという会社のコアを支えているひとつの大きな柱と言っても過言ではないだろう。





重要なのは「何が“できない”か」を知ること

 このように、ネットスターでは非常に高いレベルでサイトのカテゴリ分けを実施し、正確なフィルタリングを実現しているが、それでもその精度は完全ではない。

 前述したように人の目によってカテゴリを分類している以上、作業量には限界がある。このため、同社では「基本的にアクセス数の多いサイトを中心に分類作業を行なっている」(高橋氏)と言う。

 たとえば冒頭で紹介した学校裏サイトなどのように、数十人、せいぜい数百人程度の利用者しか集まらないような小さなサイトは、いかにその被害が大きく、抱える問題が根深くとも、適切なカテゴリ分類をすることが難しい。高橋氏によると、「学校裏サイトなどはレンタル掲示板を利用する場合が多いため、掲示板というカテゴリでフィルタリングしています」というように、現状は大きな分類でアクセスを遮断するしか方法がないことになる。

 ただし、カテゴリでアクセスを遮断されているからといって、すべてのサイトが閲覧できなくなるわけではない。PC向けのフィルタリングサービスなどでは、アクセス拒否設定のカテゴリに含まれるサイトであっても、ユーザーが問題ないと判断すれば閲覧を可能にするという設定も対応している。前述の例で言えば掲示板全体のアクセスを遮断しておきつつ、町内会などで使われている安全な掲示板サイトだと判断したら、親がアクセス拒否設定を個別に解除する、ということも可能というわけだ。

 この点は実は非常に重要な意味を持っている。現状、教育関係やメディアでは子どもを有害な情報から守るために単純にフィルタリングを勧めることが多いが、そこで訴求されるのは主に何が“できる”かだ。しかし、本当に大切なのは、システムとして“できない”ことを我々がきちんと知ることではないだろうか?

 フィルタリングはあくまでも手段であって、最終的な目的ではない。最終的な目的が、子どもを有害な情報から守ったり、詐欺などの被害から守ることだとすれば、その手段となるフィルタリングの欠点を知り、その欠点を人の行動によって補う必要がある。それが本当の教育であったり、何より親としての努めなのではないだろうか。自らも子を持つ親として、今回は切実にそう感じた。


関連情報

2007/7/10 13:20


清水 理史
製品レビューなど幅広く執筆しているが、実際に大手企業でネットワーク管理者をしていたこともあり、Windowsのネットワーク全般が得意ジャンル。最新刊「できるWindows 8.1/7 XPパソコンからの乗り換え&データ移行」ほか多数の著書がある。