Я наткнулся на лучшие практики с сайта BarracudasNetwork https://www.barracudanetworks.com/docs/other/barracuda_spam_&_virus_firewall_bayesian.pdf
Эти рекомендации предлагают хранить образцы байесовского обучения хорошего качества на статическом уровне из нескольких сотен электронных писем каждого типа (действительные электронные письма и известный спам).
Вот мой вопрос - как такая конфигурация справляется с «сезонными периодами спама»? Я имею в виду спам-письма, связанные с мировыми событиями, например. электронные письма, связанные с Бараком Обамой и президентскими выборами или беспорядками в Египте. Мы заметили, что во время этих событий заметная часть спама, захваченного с помощью наших ограниченных настроек, содержала ссылки на эти события.
Теперь, если бы мы продолжали добавлять эти сезонные примеры спама, мы бы в конечном итоге получили тысячи писем в образцах спама.
Я должен добавить, что наши почтовые серверы получают десятки тысяч писем каждый день.
Как лучше всего справиться с упомянутыми ситуациями?
Вот что мы использовали (на случай, если это имеет значение):
Большое спасибо, Люк
Юниты Barracuda основаны на SpamAssassin (не то же самое, но на основе ...). Я никогда не находил особой ценности в хранении старых образцов спама для байесовского фильтра в SA. Несомненно, спамеры «учатся», спам уже не выглядит так, как год назад.
Хорошая идея - иметь при себе ветчину, особенно если вы работаете в финансовой, фармацевтической, медицинской или аналогичной сфере, где ваша ветчина очень похожа на спам. Байесовский фильтр будет работать намного лучше в этих случаях, если у вас есть несколько примеров того и другого (опять же, с использованием текущих примеров) ... работает для меня.
ПОЖАЛУЙСТА, обновите прошивку и версию ОС вашего спам-фильтра Barracuda !! (при условии, что у вас есть активная подписка)
Вы упускаете возможности. Там были ОГРОМНЫЕ ошибки которые были решены после 2009 года прошивка у вас сейчас есть. Текущий уровень редакции версия 5.1.x.
Сезонные тенденции СПАМА также будут отражены в BarracudaCentral база данных, который должен быть первой линией защиты в вашем блоке спам-фильтра. Вы не нужно настраивать или изменять ваши пороговые значения, чтобы приспособиться к мировым событиям.
Я бы не стал изучать каждую входящую почту. Я сохраняю свои байесовские базы данных для больших клиентских установок маленькими ... может быть, 300-400 примеров СПАМА и ВЕТЧИНА. Это все, что вам действительно нужно. В противном случае вы можете отравить базу данных. Примечание: вам нужно больше СПАМА, чем радиолюбителя, как в примере ниже: