| |
|
|
|
|
|
|
第26回:メール編(15)迷惑メールを無視する(上)
|
|
|
|
|
|
|
|
|
今回説明する「迷惑メールを無視する」というのは、「迷惑メールが来なかったことにする」という意味で、具体的には迷惑メールをフィルタリングすることを指している。
● 迷惑メールフィルタリングの方法
迷惑メールのフィルタリング、つまり見分ける方法だが、複数の方法が組み合わされている。もっとも使われるのは、タイトルや本文の「内容で判断」するタイプだ。
中でも、キーワードで判断するものが古典的だが、古典的ゆえに迷惑メール送信業者もこうした方法へのノウハウをすでに持っている。たとえば「バイアグラ大特売!」というタイトルのメールに悩まされている場合、「バイアグラ」をキーワードにして排除することを考えるだろう。しかし、キーワードによるフィルタは柔軟度に欠けるため、「バイ○グラ」「ばいあぐら」のように人間の目で理解できるような置き換えに弱い。
内容で判断する場合は、固定的なキーワード判定よりもベイジアンフィルタが有用だ。ベイジアンフィルタは、数学者トーマス・ベイズが提唱した確率論の一種「ベイズの定理」を迷惑メールに応用したもので、過去に受信したメール全体に含まれる単語と、その出現比率によってメールの「スパム度」をスコアリングしている。
かんたんに言えば、過去の迷惑メールで頻繁に使われているキーワードを多く含むメールを受信した場合は「迷惑メールである可能性が高い」と判断し、問題ないと思われるキーワードが多ければ「迷惑メールでない可能性が高い」と判断する、という仕組みで、「経験則の数値化」と思えばよい。経験則をもとにしているため誤判定が出ることもあるが、ユーザーが判定し直すことで判定の精度が向上する。
このようにベイジアンフィルタは、単語単位で「スパム度」を計算するため、対象となる文章を単語単位に分類している。日本語の場合、英語と異なり単語がスペースで区切られていないので、日本語の文章を「単語らしきもの」に分割してから解析しているが、その方法によっても単語評価が変わってしまうことがある。また、市販製品で事前学習が行われている場合、ユーザーの学習が反映されにくい製品もある。誤指摘で間違った学習を行っても精度が落ちてしまう。
ベイジアンフィルタ以外の内容判断手法としては、メールに記載されたURLのリンク先を評価する方法もある。金儲けを目的とする迷惑メールは販売サイトに誘導するため、リンクのURLで評価するのは有用な手法だ。
しかし、「悪質なサイト」の評価データベースを構築することは大規模な調査が必要なだけでなく、刻々と変わるデータベースを個人ユーザーに配信するのは配信サイズと費用の面で難しい。このため、この手のURLフィルタ機能はメールサーバーで一括対処するケースが多い。たとえば、迷惑メールが利用料金に響く携帯メールでは、問題のあるURLのフィルタ機能を携帯メールサーバーが備えている。
実際のフィルタ方法は、上記の手法の一つだけを使うのではなく、複数の手法の組み合わせが多い。
● 迷惑メールの判断をどこで行うか
「フィルタリングをどこで行うか」というのもポイントになる。これは以下の3種類に分けられるだろう。
・メールソフトが行う
・メールサーバーからメールソフトまでの中間で行う
・メールサーバーで行う
まず、メールソフトで行う場合、迷惑メール対策機能付きのメールソフトに入れ替えるだけでよい。たとえばWindows標準のOutlook Expressを使用しているユーザーは多いが、これには単純なキーワードのフィルタ機能しかない。
しかし、Windows Vistaから標準メールはWindows Mailとなり、毎月の定例アップデートでフィルタ情報が配布されている。また、Microsoft Officeのメーラー&スケジューラーのOutlookにも同様にフィルタ機能がある。とはいえ、フィルタ情報が最新のものに更新されるまでにはタイムラグがあるので、フィルタ情報の配布直後に作成された新種の迷惑メールの対処が難しい。
次に、メールサーバーからメールソフトまでの中間で行う場合、統合セキュリティソフトのウイルスの常駐チェック同様、メールソフトがサーバーから受信するデータをフィルタソフトが一種のプロキシとして動作してフィルタリングする。筆者が普段利用しているのもこのタイプのものだ。
このタイプの場合、PCにソフトを組み込むだけでなくSaaSタイプもある。SaaSタイプは、フィルタソフトをインストールせず、メールを受信する際にスパムフィルタ機能を備えたメールサーバーを経由することで迷惑メールを判定するというものだ。メールソフトの受信設定をフィルタサービスのサーバーに変えるだけでよい。(中小)企業向けが多かったが、最近では個人向けサービスも発表されている。
最後に、メールサーバー等で行う場合、大手ISPやフリーメールサービスで多いのが、メールサーバーやその手前で迷惑メールを止めるサービスだ。特にフリーメールでは、半ば当たり前の機能になっている。
メールサーバーで対処を行うタイプの場合、ユーザーが迷惑メール振り分けに関与できないため、万人向けのやや緩めの判定になり、迷惑メールが通常メールとして判断されやすい。それでも、9割以上の迷惑メールは、容易に排除できると思ってよいだろう。
一例だが、筆者は10年以上前から「@nifty」のメールを使用している。古いnifty serve形式のメールIDをそのまま利用しているため迷惑メールの数も多い(月に1000通以上)が、無償の標準フィルタでもフィルタリングを通すことで、受信箱に届く迷惑メールは(正確に記録していないが)月30通未満にまで減る。
また、迷惑メールの収集用として3年以上前からYahoo!メールを使っているが、こちらも7月は2300通以上の迷惑メールがあったが、フィルタをすり抜けて受信箱に入った迷惑メールは20通そこそこで、残りは迷惑メールフォルダに振り分けられている(過去半年のワーストデータでも約2100通に対して120通がすり抜けた程度)。大量の迷惑メールがあっても、サーバーで振り分けてあれば受信しなくてもよいというメリットは大きい。
サーバーがフィルタリングするタイプは、受信する迷惑メールの数そのものを大きく減らすメリットがあるので、利用中のメールサービスが迷惑メールフィルタを追加費用なしで提供している場合は積極的に利用したい。
場合によっては、さらに有償サービスやユーザー側のフィルタリングソフトを併用することで、迷惑メールで悩む時間を大幅に減らすことができる。
2008/08/27 11:37
|
小林哲雄 中学合格で気を許して「マイコン」にのめりこんだのが人生の転機となり早ン十年のパソコン専業ライター。主にハードウェア全般が守備範囲だが、インターネットもWindows 3.1と黎明期から使っており、最近は「身近なセキュリティ」をテーマのひとつとしている。 |
- ページの先頭へ-
|
|
|
|
|