Назад | Перейти на главную страницу

Как вы отслеживаете Citrix XenApp с помощью Nagios?

Мне никогда не удавалось найти в Интернете ничего хорошего для мониторинга клиентских компьютеров Citrix XenApp.

Обычно проблемы, которые останавливают показ, появляются у пользователей только после того, как они войдут в систему и попытаются запустить приложение.

Это редко помогает контролировать работу служб Windows, иногда даже те, которые заблокированы и отображаются как запущенные, но по-прежнему требуют перезапуска.

Итак, как сообщество решает проблему мониторинга клиентских компьютеров Citrix XenApp? Как убедиться, что конечные пользователи могут входить в систему и запускать свои приложения?

Я нашел кое-что о Citrix EdgeSight здесь, на serverfault, я не был бы против решения за пределами Nagios, если оно может предупреждать нас о сбое пользовательских сеансов.

В дополнение к хорошим предложениям Natxo, не забывайте отслеживать TCP 2598, который используется вместо 1494 для приложений обеспечения надежности сеансов.

Также отслеживайте количество активных сеансов на всех серверах фермы. Если один сервер перестает принимать новые входы в систему, вы увидите, что его количество упадет ниже обычного и / или того, что есть у других серверов в настоящее время.

Я не так хорошо знаком с Nagios; быстрый поиск не показывает искусственную транзакцию для фактического входа в систему. Однако, если вы можете найти или написать его, это будет золотом - вход в приложение - это самый правильный способ проверить, правильно ли работает XenApp.

Самая очевидная проверка - check_tcp на порт 1494 (стандартный порт ica), если это не сработает, пользователи не смогут войти в систему.

Также полезно отслеживать порт 8080 (ica xml) для веб-интерфейса.

Да, и еще одно: следите за веб-интерфейсом магазина, если это не удастся, пользователи также не смогут войти в систему.

По моему опыту, просто "живые" проверки сервера, сервисов и т. Д. Мало полезны.

Плохо работающий сервер XenApp может быть почти таким же плохим, как и тот, который полностью вышел из строя - в любом случае пользователи не работают, а ваша служба поддержки заваливается звонками.

У своего работодателя я использую EdgeSight, который предназначен для мониторинга XenApp, но он показывает свой возраст и не видел никаких обновлений, не говоря уже о значительных обновлениях (разработка была остановлена ​​давно, и EdgeSight теперь объединен с XenDesktop).

Несколько альтернативных вариантов, которые я планирую изучить в себе (кстати, не связанных ни с одним из них):

Что касается мониторинга с помощью Nagios, я полагаю, он может получать метрики производительности с узлов Windows? Я бы уделил особое внимание этим показателям производительности (не исчерпывающий список):

  • Использование процессора (короткие пики обычно допустимы, более нескольких секунд при ~ 95 +% или 30 секунд при ~ 80 +% обычно указывает на проблемы)
  • Время прерывания процессора (проблемы с драйверами могут привести к тому, что мощность процессора будет потребляться прерываниями, что будет недоступно для приложений)
  • Переключений контекста / сек (высокий уровень переключения контекста указывает на слишком мало логических ядер ЦП для обработки рабочей нагрузки)
  • Доступная RAM (нехватка памяти вызывает чрезмерную подкачку страниц, что, в свою очередь, снижает производительность пользователя)
  • % Занятого времени диска (постоянно занятые диски указывают на узкое место на диске)
  • Чтение / запись диска задержка (высокая задержка диска сразу ухудшает взаимодействие с пользователем. Могут ли диски / RAID-контроллер / SAN обеспечить достаточное количество операций ввода-вывода?)
  • Свободное место на диске (нет места на диске, нет места для работы, нет производительности)
  • Активные сеансы XenApp (часто вы можете определить практическое правило максимального количества сеансов, которое можно удобно разместить на сервере. Рассмотрите возможность включения «количества пользователей» в свой оценщик нагрузки, чтобы серверы, приближающиеся к этому пределу, с меньшей вероятностью получили новые пользовательские сеансы)

Получите некоторую историю производительности для этих показателей из вашей реальной среды, определите свои значения «красный / желтый / зеленый», а затем настройте предупреждения.