メールのフィルタリングについて

前にもちょっと書いたがOperaは単にWebブラウザであるだけではなくメーラーでもある*1。おまけ程度の代物ではなく十分使える。もちろんIMAPにも対応している。

受信したメールはフォルダではなくフィルタで分別する*2流儀で、フィルタルールの記述法は From: だの Subject: だのが○○を含んでいたらマッチする、式のよくあるやつ。

このフィルタ、ルールの記述とは別に、個々のメールに対してユーザが「フィルタ○○に含める」とか「フィルタ○○から除く」とかの操作を行うごとに 判定条件を学習することができるようになっている(学習はOn/Off可)。ホームディレクトリの下の Application Data\Opera\Opera\mail\autofilter\ というサブディレクトリ内に filter_####.ini というの((#### の部分はフィルタごとに固有の数字。))がいっぱい出来ていて、学習結果らしきものが書かれていた。うちの某 .ini ファイル中の [Include] というセクションから一部を抜粋すると

a6m5さ=2
ん=2
の=2
■=2
本=2
格=2
始=2
動=2
(=2
Google=2
Blog=10
Search=2
こ=2
ひ=2
ど=2
い=2
)=2
http=2
d=2

どうやら単語ごとに「マッチし易さ」のコスト値を割り振っているらしいのだけれど、日本語部分については単語区切りが分からないらしく1文字ごとに細切れにされていた。あまり賢くなさそうだなぁ。これもひょっとしたら私の使っているのが英語版だからかも知れない。何か[これはひどい]とか学習してたらしい形跡が見えるぞw

[Exclude] セクションについても学習は同じ要領。

*1:その他にRSSリーダでもありネットニュース(NNTPのあれ)リーダでもありIRCクライアントでもある。これについても多分そのうち書く。これだけあれこれ詰め込んだにしては、コントロールパネルの「プログラムの追加と削除」で見たときディスク容量を5MBかそこらしか食ってないらしいのが不思議。

*2:フォルダらしきものもあるにはあるが、それらは "Inbox" とか "Spam" とか "Trash" とかであって受信したメールをユーザが内容や日時ごとに自由に分別する為のものではない。