У меня есть сервер мониторинга, на котором работает icinga / collectd / graphite, примерно с 50 хостами. Я заметил высокую производительность при загрузке / задержке на коробке. Если вы посмотрите наверх, вы увидите:
ЦП: 0,6% us, 0,2% sy, 0,0% ni, 7,6% id, 23,4% wa, 0,0% hi, 0,2% si, 0,0% st
Обратите внимание на значение HUGE% wa, которое, насколько мне известно, означает узкое место в сети или на диске. ifconfig не показывает отбрасываемых пакетов, и нет большой пропускной способности, так что возникают проблемы с диском, верно? На диск тоже не так много записи ... iotop сообщает, что мы пишем чуть более 1 МБ в секунду, а инструмент RAID сообщает, что все в порядке и кэширование записи включено.
Как мне попытаться выяснить, как это исправить?
ОБНОВЛЕНИЕ: вывод iostat -x:
avg-cpu: %user %nice %system %iowait %steal %idle
0.62 0.10 0.31 9.65 0.00 89.31
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util
sda 0.21 33.34 83.55 16.54 1599.94 399.07 19.97 43.21 416.98 3.71 37.13
Ожидание ввода-вывода также генерируется NFS, SMB и другими удаленными файловыми системами.
Использовать vmstat 2
чтобы получить детальное представление о производительности системы, включая io wait.
Высокое значение wa обычно означает, что ОС ожидает либо сеть, либо диск. Есть неплохая программа под названием iotop. Это расскажет вам, чем занимается диск, может быть полезно.