В моей установке exim4 я продолжаю получать главный журнал как в кодировке UTF-8, так и в расширенном кодировке ANSI, содержащий строки типа «tämä» (правильно в UTF-8) и «t \ xe4 \ m \ xe4» (ANSI). Последние экранированные маркировки представляют собой однобайтовые коды, экранирование сделано для ясности («tämä» закодировано как 74 EC 6D EC в байтах). Сегодняшнее значение по умолчанию, конечно, UTF-8, и большинство строк в порядке.
Проблема в том, что это сбивает с толку fail2ban, потому что он ожидает, что файл журнала будет закодирован согласованным образом. Однако я не могу выбрать ни ANSI, ни UTF-8, потому что обе кодировки существуют в файле журнала.
Интересно, есть ли способ отфильтровать символы ANSI перед записью строк в / var / log / exim / mainlog?
Что касается виновника, то это может быть старая программа для рассылки спама на машине с Windows или какое-то старое приложение для массовой рассылки. Как бы то ни было, примерно 35-45% строк журнала ежедневно заражаются ANSI.