Я тестирую контроллер LSI 9207-8i с 8 подключенными твердотельными накопителями Samsung 850 Pro емкостью 256 ГБ. На твердотельных накопителях установлена последняя версия прошивки EXM02B6Q, контроллер работает под управлением P17 и обнаружил те же проблемы с P19. ОЗУ сервера - это ECC и тестировалась в зеркальном режиме.
Я тестировал ZFS-On-Linux и FreeBSD и пробовал драйвер LSI в обеих операционных системах.
Диски ведут себя должным образом, но во время интенсивного ввода-вывода они, кажется, записывают плохие блоки. При запуске очистки дисков появляются ошибки контрольной суммы. Чтобы имитировать тяжелый ввод-вывод, я использую размер записи 16k с primarycache = metadata и secondarycache = none. Я генерирую случайный файл размером 4 ГБ и помещаю его в другой файл в 4 потока. Повторить это несколько раз достаточно, чтобы очистка показала ошибки контрольной суммы.
Еще предстоит подтвердить, проблема ли это в контроллере, твердотельных накопителях или кабелях. Я подозреваю твердотельные накопители, но при следующей возможности буду тестировать их с 9211-8i.
Кто-нибудь сталкивался с подобной проблемой или у кого-нибудь есть предложения о том, что делать дальше, помимо замены контроллера / SSD?
Обновление: протестировали еще один Samsung 850 Pro 256 ГБ с прошивкой EXM01B6Q на совершенно другом сервере, используя встроенный контроллер SATA. Та же проблема возникает с контрольными суммами.
У меня раньше была эта проблема с Samsung 850 Evo. В OmniOS / OpenSol диски отображаются как 512K, выровненные, что из-за отсутствия параметра ashift вы получаете эту проблему. Кажется, это какая-то проблема со сборкой мусора на самих дисках, я бы написал тонну данных, очистил - и увидел ошибки.
В итоге мы заставили диски отображаться как 4K, выровненные в sd.conf, и ZFS затем начала вести себя правильно.
Я думал, что подниму этот вопрос, если кто-то другой столкнется с той же проблемой.
Мне удалось решить проблему, установив ashift = 12 (выравнивание 4k) при создании пула.
Я бы подозревал, что это ориентированные на потребителя твердотельные накопители Samsung 850 или объединительная плата дисков, если они есть в этой конфигурации.
Это в основном потому, что вы испытываете ошибки в двух разных операционных системах. Можете ли вы предоставить какие-либо другие подробности о конфигурации оборудования?