背景色などの外形的特徴から有害サイトを高速検出、KDDI研究所が技術開発


 株式会社KDDI研究所は13日、出会い系サイトや犯罪予告サイトなどの有害サイトを、ウェブサイトの外形的特徴のみで検出する技術を開発したと発表した。文書解析方式によるフィルタリングシステムと比べ、3倍以上の速度処理を実現するという。

 HTMLタグ内の記述に着目し、ウェブサイトの背景色が例えばピンクであることや、画像リンクが多用されていること、フレームが多用されていること、ポップアップなどブラウザーに特定の動作をさせるスクリプトが用いられているといった外形的特徴を捉えることで有害サイトを検出する。


外形的特徴で有害サイトを検出する仕組み

 KDDI研究所によると、ウェブサイトに含まれる単語を解析する従来の文書解析方式では、検出にあたって1万個の特徴が必要だったという。これに対して今回開発した技術では、26個の外形的特徴を用いるだけで、有害サイト1万件・無害サイト1万件で実験した結果、90.3%の検出精度を達成した。有害サイトの外形的特徴は類似性が高いため、少ない特徴で高速・高精度の判定が可能だとしている。

 この技術は、独立行政法人情報通信研究機構からの委託研究の一部として開発したもの。今後、フィルタリングシステムやブラウザー、ウェブサイトの監視業務などへの導入に向けて実用化を目指す。


関連情報

(永沢 茂)

2010/9/14 15:52