Назад | Перейти на главную страницу

elasticsearch: как увидеть, что предупреждения в журналах / прерыватели срабатывают

ES 1.7.x на CentOS

Наш производственный кластер ES сильно пострадал. Мы потеряли весь указатель. Оказывается, это было в журналах уже день или больше:

New used memory from field ### would be larger than configured breaker

ХОРОШО.

Какой URL на ES я могу нажать, чтобы увидеть, что возникают проблемы? (Мониторинг журналов не является частью нашего режима мониторинга, но нам легко попасть по URL-адресу ES.)

Сейчас мы используем URL-адреса состояния кластера, поэтому мы видим, что кластер становится желто-красным, но (пока) мы не видели, как извне видеть приближение проблем (так что мы теряемся).

ОК, нашел ответ.

Честно говоря, это действительно слабый ответ, который ложится на нас тяжелым бременем.

Как здесь сделано:

https://www.elastic.co/guide/en/elasticsearch/reference/1.4/cluster-nodes-stats.html

Использовать это:

curl -XGET 'http://localhost:9200/_nodes/stats?pretty=true'

И тогда вы можете увидеть выключатель | сработавший элемент.

Это просто счетчик, а не скорость. Итак, вам необходимо:

  • Напишите свой собственный код, чтобы прочитать значение
  • Подождите N раз
  • Прочти снова
  • Заниматься математикой
  • Сработало поверхностных выключателей / мин
  • Выясните, какой для вас порог проблемы
  • Монитор против этого

Было бы очень хорошо, если бы ES мог вычислить скорость, чтобы мы могли просто сосредоточиться на последних двух моментах.

Но это лучшее из того, что я пока вижу.