Назад | Перейти на главную страницу

Инстанс Amazon RDS перестал отвечать

Мы эксплуатируем большой инстанс RDS в производстве уже более года без единого простоя. Недавно, имея больший бюджет и более высокие ставки, мы решили преобразовать его в инстанс с несколькими зонами доступности, чтобы повысить надежность и избыточность наших данных.

С тех пор (около двух недель назад) у нас было два серьезных отказа нашего экземпляра, которые потребовали перезагрузки. В «последних событиях БД» ничего нет. В Cloudwatch было зарегистрировано два всплеска соединения с БД, которые произошли одновременно с сбоями.

В чем дело?

Похоже, что проблемы были связаны с AWS, а не с экземпляром. Когда это было опубликовано, это оказалось одним из самых серьезных сбоев в работе AWS europe.

Существует ряд проблем с RDS Multi-AZ, которые означают, что автоматическое переключение при отказе может не произойти, оставив вас без сервера. Разработчики должны быть осведомлены и встраивать в свои приложения достаточную избыточность, которая может смягчить проблемы в нескольких зонах доступности.