Когда мои настройки почты обнаруживают, что письмо является спамом, он помещает *SPAM*
в теме. Теперь я хочу улучшить свой байесовский фильтр, обучив его работе со спамом.
Если я скармливаю эти тысячи писем sa-learn
, это сработает, даже если у них еще есть *SPAM*
в теме? Или он скажет фильтру «что-то является спамом, только если оно *SPAM*
в заголовке », что было бы контрпродуктивным?
В соответствии с страница руководства для sa-learn
, это будет хорошо.
Если сообщения, которые вы изучаете, уже были отфильтрованы с помощью SpamAssassin, учащийся компенсирует это. Фактически, он узнает, как выглядело бы каждое сообщение, если бы вы заранее пропустили spamassassin -d.