я использую percona-clustercheck (который поставляется с пакетами Percona XtraDB Cluster) с xinetd, и я получаю сообщение об ошибке при попытке свернуть службу clustercheck.
/usr/bin/clustercheck
:
#!/bin/bash
#
# Script to make a proxy (ie HAProxy) capable of monitoring Percona XtraDB Cluster nodes properly
#
# Author: Olaf van Zandwijk <olaf.vanzandwijk@nedap.com>
# Documentation and download: https://github.com/olafz/percona-clustercheck
#
# Based on the original script from Unai Rodriguez
#
MYSQL_USERNAME="clustercheckuser"
MYSQL_PASSWORD="clustercheckpassword!"
ERR_FILE="/dev/null"
AVAILABLE_WHEN_DONOR=0
#
# Perform the query to check the wsrep_local_state
#
WSREP_STATUS=`mysql --user=${MYSQL_USERNAME} --password=${MYSQL_PASSWORD} -e "SHOW STATUS LIKE 'wsrep_local_state';" 2>${ERR_FILE} | awk '{if (NR!=1){print $2}}' 2>${ERR_FILE}`
if [[ "${WSREP_STATUS}" == "4" ]] || [[ "${WSREP_STATUS}" == "2" && ${AVAILABLE_WHEN_DONOR} == 1 ]]
then
# Percona XtraDB Cluster node local state is 'Synced' => return HTTP 200
/bin/echo -en "HTTP/1.1 200 OK\r\n"
/bin/echo -en "Content-Type: text/plain\r\n"
/bin/echo -en "\r\n"
/bin/echo -en "Percona XtraDB Cluster Node is synced.\r\n"
/bin/echo -en "\r\n"
exit 0
else
# Percona XtraDB Cluster node local state is not 'Synced' => return HTTP 503
/bin/echo -en "HTTP/1.1 503 Service Unavailable\r\n"
/bin/echo -en "Content-Type: text/plain\r\n"
/bin/echo -en "\r\n"
/bin/echo -en "Percona XtraDB Cluster Node is not synced.\r\n"
/bin/echo -en "\r\n"
exit 1
fi
/etc/xinetd.mysqlchk
:
# default: on
# description: mysqlchk
service mysqlchk
{
# this is a config for xinetd, place it in /etc/xinetd.d/
disable = no
flags = REUSE
socket_type = stream
port = 9200
wait = no
user = nobody
server = /usr/bin/clustercheck
log_on_failure += USERID
only_from = 10.0.0.0/8 127.0.0.1
# recommended to put the IPs that need
# to connect exclusively (security purposes)
per_source = UNLIMITED
}
При попытке скрутить службу я получаю действительный ответ (HTTP 200, текст), но в конце появляется уведомление «сброс соединения одноранговым узлом»:
HTTP/1.1 200 OK
Content-Type: text/plain
Percona XtraDB Cluster Node is synced.
curl: (56) Recv failure: Connection reset by peer
К сожалению, Amazon ELB, похоже, расценивает это как неудачную проверку, а не как успешную.
Как я могу заставить clustercheck корректно завершиться, чтобы curl не видел сбоев подключения?
Добавление Content-Length: 0
заставляет клиента игнорировать содержимое, даже если оно есть, как в этом случае. Так что это может сломать другое программное обеспечение для проверки. В вашем случае длина содержимого составляет 42 байта (поэтому добавьте Content-Length: 42
) в случае синхронизированного узла и 46 байтов в случае несинхронизированного узла.
# curl localhost:9200
Percona XtraDB Cluster Node is synced.
Я отправлю обновленный скрипт, чтобы он также был исправлен в новой версии пакета Percona XtraDB Cluster.
Я добавил Content-Length: 0
заголовок ответа clustercheck, который, похоже, помогает проверить работоспособность Amazon. Если у кого-то есть лучшая практика, дайте мне знать
Подобную проблему я решил с помощью
echo -en "HTTP/1.1 200 OK\r\n" | cat
вместо
echo -en "HTTP/1.1 200 OK\r\n"
Я также заметил, что вы используете сценарий на локальном хосте. Вы также можете выполнить clustercheck в командной строке и проверить возвращаемое значение.
В случае синхронизированного узла:
# /usr/bin/clustercheck > /dev/null
# echo $?
0
В случае несинхронизированного узла:
# /usr/bin/clustercheck > /dev/null
# echo $?
1