水曜日, 11月 29, 2006

偽陽性率

 S25R方式の偽陽性率をどう評価しようかと考えた末に、正当な受信メールの送信元ホストを拾い上げてみた。2006年1月以降、11月28日までに受信したメールの送信元は142個。そのうち、S25Rの一般規則に引っかかるホストは19個だった。ここから計算した、ホワイトリストがないものと仮定した偽陽性率は13.4%である。意外な高さに今さらながら驚いた。
 とはいえ、偽陽性率の高さに手を焼いているわけではまったくない。1サイトのメールマガジンを受信し損ねたことがある(8月30日「リトライを短時間でやめるサーバ」)のを除いて、以前から登録してあったホワイトリスト、新たに登録したホワイトリスト、および協力者から報告されたホワイトリストのおかげで、苦もなく受信に成功している(もちろん、メールトラフィックが少ない個人サイトだから苦労がないのだが)。正規表現によるホワイトリスト登録1件で複数のホストを救済するケースもあり、19個のホストを救済したホワイトリスト項目は14件であった。
 一方、9月15日「宛先の正しいスパムの阻止率」で報告したとおり、2006年7月の統計では、宛先の正しいスパムの阻止率はトータルで97.4%であった。すなわち、偽陰性率(見逃し率)は2.6%である。
 スパム判定においては、偽陰性判定よりも偽陽性判定の方が有害である。スパムの阻止に失敗するよりも、正当なメールを受けられないことの方が困る。では、偽陰性率よりも偽陽性率の方が高いS25R方式は有害な方式か。決してそんなことはない。
 S25R方式では、偽陽性判定は致命的なものではなく、リトライアクセスを発見してホワイトリスト登録すればメールを受信することができる。そして、そのホストからのメールを阻止することは二度となくなる。ホワイトリスト登録が進むにつれて、偽陽性率はゼロに近付いていく。
 偽陰性率は初めから十分に低い。メールの90%以上はスパムだと言われる現在、偽陰性率の低さはやはり重要である。そして、偽陽性率は、ホワイトリスト登録によって(素のS25R方式ではそのために労力はかかるものの)どんどん下がっていく。偽陽性を減らすために偽陰性率の低さを犠牲にする必要がない。つまり、スパム対策方式としての実用性が高いのである。このことこそ、S25R方式が多くの人々に支持されている理由に違いない。

0 件のコメント: