В последнее время мы получили больше сбоев и ошибок ввода-вывода из файловой системы XFS. Причина того, что мы думаем об этом из-за высокого дискового ввода-вывода. Мы загружаем и удаляем несколько ГБ данных в неделю для больших данных. Итак, при чтении документов XFS я обнаружил опцию «XFS в реальном времени», и они конкретно упомянули, что она предназначена для потоковой передачи в реальном времени. Для этого я перекомпилировал свою машину CentOS с помощью CONFIG_XFS_RT и создал 3 раздела для журнала, данных и реального времени. Тем не менее меня смущает XFS в реальном времени.
Может ли кто-нибудь помочь мне понять, что такое XFS в реальном времени и действительно ли это помогает тяжелым серверам ввода-вывода?
Итак, насколько я понимаю, если вы используете XFS для hadoop, вы должны отключить все дополнительные параметры файловой системы, потому что это не стоит того, и увеличивать накладные расходы для hadoop, например, atime, noatime, а также это зависит от рабочей нагрузки, такой как большие файлы без небольших кластеров inode или небольшой файл и большой индексный дескриптор. Надеюсь, это поможет.