Назад | Перейти на главную страницу

Очень плохо работает многолучевость RHEL / HSV200

Я использую RHEL 5.5 с системой хранения multipath @ HSV200.

Производительность диска для записи ОЧЕНЬ низкая по сравнению с аналогами системы Windows (которые используют то же хранилище и многопутевость).

Вот результаты:

mpath17 (3600508b400105f9d0002100000780000) dm-12 HP,HSV200
[size=850G][features=0][hwhandler=0][rw]
\_ round-robin 0 [prio=100][active]
 \_ 2:0:1:30  sdaw       67:0   [active][ready]
 \_ 1:0:1:30  sdc        8:32   [active][ready]
\_ round-robin 0 [prio=20][enabled]
 \_ 2:0:0:30  sdau       66:224 [active][ready]
 \_ 1:0:0:30  sda        8:0    [active][ready]

`atop` result:

LVM |      mpath17  | busy     99% |  read    3077 | write      6  | KiB/r     90 |               | KiB/w      4 |  MBr/s  27.11 | MBw/s   0.00  | avq     2.41 |  avio 3.21 ms 

Обратите внимание на то, что «занято» составляет 99% - и это происходит в большинстве случаев.

В multipath.conf используются рекомендованные HP лучшие практики для этого хранилища:

device {
                vendor                                   "HP"
                product                                  "HSV2[01]0|HSV3[046]0|HSV4[05]0"
                path_grouping_policy        group_by_prio
                getuid_callout                      "/sbin/scsi_id -g -u -s /block/%n"
                prio_callout                           "/sbin/mpath_prio_alua /dev/%n"
                path_selector                       "round-robin 0"
                path_checker                       tur
                hardware_handler              "0"
                failback                  immediate
                rr_weight                               uniform
                rr_min_io                              100
                no_path_retry                       18
}

Есть ли способ диагностировать это событие? Я хочу понять, где узкое место в этом сценарии ... Есть предложения, с чего начать?

(Это мой первый пост, большое спасибо)

Вся проблема заключалась в контроллере диска; у него не было контроллера кеша, поэтому он работал плохо во многих отношениях - например, при записи огромных файлов или одновременной записи множества файлов.

Спасибо за диагностику.

Это могло быть признаком проблемы с производительностью. Как настроено хранилище за этим LUN? Какой тип диска, сколько дисков и какой тип рейда? Кэш настроен на обратную запись?

Вы упомянули в комментарии, что количественно оцениваете использование диска по МБ / с, однако в большинстве случаев ограничение для дисков без SSD не МБ / с, а операций ввода-вывода / с, поскольку им приходится много искать для случайное чтение.