Если я дам sa-learn
Maildir отправляет письма, чтобы обучить их как спам, он принимает их без проблем, но при попытке использовать файл mbox, содержащий спам-письма из моей личной учетной записи Gmail (с использованием https://takeout.google.com/settings/takeout/custom/gmail), это не нравится:
$ grep -c '^From ' spam.mbox
390
$ sa-learn --progress --no-sync --spam --mbox spam.mbox
Learned tokens from 0 message(s) (0 message(s) examined)
Итак, ясно, что spam.mbox
содержит электронные письма (на самом деле 390), но по какой-то причине sa-learn
решает игнорировать их.
Что здесь могло происходить?
Возможно, это не идеально, но мне удалось заставить sa-learn работать, экспортировав папку со спамом Gmail с помощью Thunderbird, а не утилиты Google Takeout. Кажется, есть что-то странное с форматом mbox в GTakeout, которое доставляет проблемы SA.
Чтобы использовать Thunderbird для экспорта папки спама Gmail, выполните следующие действия:
Экспортированный файл mbox должен хорошо работать с sa-learn.