У меня запущен экземпляр OpsCenter 5.0 и подключено 10 агентов. Агенты находятся в 2 регионах AWS, поэтому для связи все используют внешние адреса. Все необходимые порты открыты, и фактически на панели инструментов OpsCenter указано «Все агенты подключены». Я также могу щелкнуть любой из узлов для получения подробностей, и вся статистика, похоже, обновляется нормально.
Моя единственная проблема в том, что все графики показывают «Нет данных». Странно то, что они, казалось, работали несколько минут после того, как я впервые установил их, но потом перестали записывать какие-либо данные.
Я перезапустил сервер и все процессы агента, но это не помогло. Заранее благодарим за любые предложения или идеи!
Догадаться! В журналах агента обнаружил кучу следующего:
WARN [Thread-1] 2014-08-08 15:07:06,527 Thrift operation queue is full, discarding thrift operation
WARN [Thread-1] 2014-08-08 15:07:06,527 239710 operations dropped so far.
ERROR [thrift-processor-1] 2014-08-08 15:07:07,832 Error when proccessing thrift callme.prettyprint.hector.api.exceptions.HInvalidRequestException: InvalidRequestException(why:You have not logged in)
Это немного странно, поскольку все остальное общение было в порядке, и графики изначально работали. Чтобы исправить это, я просто добавил следующее в файл address.yaml на всех агентах и перезапустил службу агента:
thrift_user: <username>
thrift_pass: <password>