木曜日, 5月 03, 2007

正規表現の間違い

 「ドットでない文字」の正規表現を今まで「[^\.]」と書いていたが、ある人に指摘されて、間違いだったことがわかった。「[ ]」の内側ではメタ文字をエスケープする必要はなく、「[^.]」が正しい。「[^\.]」は、「\」でも「.」でもない文字という意味になってしまう。ただし、FQDNに「\」が現れることはないので、間違った正規表現のままでも支障はない。
 ということで、論文を書き直した。ついでに、次の修正を加えた。

●ボットについて言及。エンドユーザーコンピュータからのスパムが多いのは、ボットに感染させたエンドユーザーコンピュータをスパマーが操るからだということは、論文を公開した当初はよく知らなかった。

●ホワイトリスト作成前の偽陽性判定率が約13%と推定されることを付記。

●ホワイトリスト登録の自動化技術(Rgrey、Starpit、taRgreyのこと)が提供されていることを付記。

 それと、微妙に言い回しを変えたのは、動的IPアドレスを使ったメールサーバのホワイトリスト登録の問題である。今まで「許可は困難である」と書いていたが、「許可にはリスクが伴う」という書き方にした。S25R方式がOP25BやIP25Bと同じように動的IPアドレスのメールサーバを排除するものだという誤解を避けるためである。

0 件のコメント: