迷惑メールに効果てきめん!使うほどに賢くなる!「Shuriken」が搭載する「学習型迷惑メールフィルター」とは?
ジャストシステムの高度な日本語形態素解析(*)エンジンを組み込んだメールフィルターです。
めんどうな条件設定は不要。 ドラッグ&ドロップなどで「迷惑メールフォルダ」に振り分けたメールの特徴を学習し、次回以降は自動的に排除します。
単純に文字列で比較するフィルターとは異なり、類似する特徴を持つ迷惑メールも賢く判別します。見出しなどのヘッダ情報だけでなく、メール本文や添付ファイルの内容も合わせて総合的に判断するので、「お久しぶりです」などの一般的な見出しを付けた巧妙な迷惑メールにもだまされません。

*形態素解析について詳しく知りたい方はこちら
学習型迷惑メールフィルターの設定画面
学習型迷惑メールフィルターの特長
学習を重ねるごとに判定精度がアップ
学習&排除の操作はかんたん。
メールを選んで、迷惑メールフォルダへドラッグ&ドロップするだけでOKです。
*従来のShurikenユーザーの方が、ツールバーのカスタマイズを行っている場合は、「→迷惑」「→非迷惑」ボタンは表示されません。[設定 - ツールボックス設定]で、これらをツールバーに表示させることができます。
2つのフィルターが迷惑メールを逃さない
新機能「迷惑メールフィルター ダブルディフェンス」を搭載。
学習初期でも、一般的な迷惑メールなら事前に学習済みのマスターフィルターが除去。マスターフィルターが取りこぼした新種の迷惑メールや判断の難しいメールも、ユーザーフィルターに学習させることで、どんどん精度が上がっていきます。
マスターフィルターに使う外部学習データは「Shuriken 2008」に搭載しますが、管理者やユーザーが作成することもできます。
迷惑メール専用フォルダが便利
「ゴミ箱」に捨てたメールと自動排除されたメールとを区別できて、安心です。
パソコンに負荷をかけず、受信も高速
メモリに常駐するタイプのフィルターとは異なり、必要なときだけ動作するので、パソコンに負荷をかけず、受信も高速です。
ホワイトリスト(許可リスト)で、非迷惑メールの誤判定を防止
アドレス帳のデータを、ホワイトリストに利用することもできます。
ブラックリスト(禁止リスト)で、確実に迷惑メールを排除
特徴が少なく、迷惑メールとして判定されにくい迷惑メールも、ブラックリストを使えば、確実に排除できます。
また、従来の「Shuriken Pro4」に搭載されていた基本フィルターは、学習型迷惑メールフィルターのブラックリストとして、そのままご利用いただけます。

*差出人や見出しとの文字列比較により迷惑メールを判定する「基本フィルター」も搭載しています。ご利用の目的に合わせて、使用する迷惑メールフィルターを選択できます。
迷惑メールは新着報告しない設定でさらに快適
着信報告設定で、「迷惑メールと判定されたメールは着信報告を行わない」設定が可能です。
「Shuriken 2008」の迷惑メール対策機能 強化点
学習データを複数PCでも利用。インポート/エクスポート機能を追加
基本フィルターも強化!空メールや外国語のメールを迷惑メールに指定可能に
迷惑メールを学習させる操作も、ドラッグ&ドロップでよりシンプルに
迷惑メールフォルダ内の自動削除機能を追加
「Kaspersky Internet Security」のアンチウイルス機能と連携
【形態素解析とは?】
形態素解析とは、文章を意味のある最小単位に分割し、文章に使われている語句の識別や品詞などを解析する技術です。
今回の「学習型迷惑メールフィルター」では、弊社独自の高度な形態素解析エンジンを組み込んで、迷惑メール判定や学習を行っており、以下のような特長を持ちます。
 
微妙に表記が異なる単語も、同一と見なすことができます。
例えば「バイオリン」と「ヴァイオリン」。
この2つが指しているものの意味は同じで、人はこの2つを同一視します。
しかし、表記が異なるためプログラムでは異なるものと扱われます。
今回の「学習型迷惑メールフィルター」では、単語の統制を掛けることにより、この2つをどちらも「バイオリン」としてプログラム内で扱うことができます。

この他にも名詞であれば、
 ・「ユーザー」 「ユーザ」 →「ユーザー」
 ・「慶応」 「慶應」    →「慶応」

動詞であれば語幹を見て、
  ・「動く」 「動かない」  →「動」

という風に同一視し、同じ表記に統制して使用するものがいくつもあります。

この処理により、表記を微妙に変化させた単語でも、統制後の単語がすでに迷惑メールとして学習されていれば、同じ単語として処理し、迷惑メールとして判定されます。
 
判定に用いる単語の品詞を限定することで、特徴を捉えやすくなります。
 ・「は」 「に」 「を」 「へ」等の助詞
 ・「ある」 「この」等の連体詞
 ・「さらには」 「かつ」等の接続詞
 ・サ変本体(「さ」 「し」 「す」 「する」 「すれ」 「せよ」)

これらのように、迷惑メール/非迷惑メールにかかわらず、日本語の文章ならどちらにも入っているような品詞は、迷惑メールの特徴としてとらえることはできません。

そこで、このように特徴として捉えることができない品詞は、今回の「学習型迷惑メールフィルター」では対象にしないようになっています。

たとえば、「本日は晴天なり。」ですと、
 
本日 晴天 なり
[名詞] [助詞] [名詞] [助動詞] [記号]
  となって、Shurikenでは「本日」「晴天」のみが判定に使用されます。
閉じる