На Linux-сервере с postfix + amavis + spamassassin мы думаем о реализации байесовской фильтрации. Эта система на данный момент уже выполняет фильтрацию спама (без байесов) для нескольких клиентских доменов.
Вопрос в том, как проводить обучение в этом сценарии? Придется ли нам собирать спам и радиолюбители от каждого клиента или нужно только одному и иметь глобальную базу данных?
Спасибо.
База данных Байеса является глобальной для каждой конфигурации SA. Вы можете настроить его местоположение через bayes_path
вариант в local.cf
Файл конфигурации. Подробнее читайте здесь: https://wiki.apache.org/spamassassin/SiteWideBayesSetup
Вы можете выполнить начальное обучение базы данных с вашими наборами любительских и спам-сообщений или подождать, пока SA узнает о сообщениях, полученных от postfix.
Вы можете захотеть установить разные файлы конфигурации SA для разных доменов, если среднее содержание сообщений для этих доменов слишком разное и слишком много входящих сообщений с пограничным содержанием, которые должны быть помечены как спам для пользователей одного домена и как любительские для пользователей другого домен.