У меня есть производственная служба 8.4 и служба разработки 8.4. Они работали без сбоев, но в последние два уик-энда производственная служба случайным образом прекращала работу, на этой неделе в воскресенье, на прошлой неделе в субботу, а не во время какого-либо конкретного события или запланированного задания. Однако служба разработки была в порядке.
Кажется, это не в порядке, но, согласно журналам событий, сначала отключается pgAgent («Не удалось запросить таблицу заданий!»), А затем через 8 секунд postgres завершает работу. Оба выходных все происходило именно в таком порядке. Во всяком случае, я ожидал, что завершение работы postgres приведет к закрытию pgAgent. Я предполагаю, что если он застрял на чем-то, что потребовало> 8 секунд, чтобы его убить, может быть, в какой-то момент это приведет к тому, что pgAgent перестанет работать, прежде чем postgres полностью умрет.
В самих журналах postgres есть такая ошибка:
FATAL: pre-existing shared memory block is still in use
... который согласно эта почта может быть связано с антивирусным программным обеспечением. Мы запускаем Symantec, и это может быть слишком много ресурсов, я, конечно, не собираюсь оставлять систему незащищенной, как предлагается в сообщении. Есть другие предложения?
Я не уверен, что случилось с самим postgre, но вы всегда можете использовать что-то вроде Сервисный ястреб для мониторинга службы, чтобы она работала.