Я разрабатываю головной узел, основная функция которого - отправлять задания в планировщик Torque / Maui, а вторичная функция - запускать тестовые задания. К сожалению, большинство руководств по выбору оборудования для кластеров было написано в 2000–2004 годах и в настоящее время в основном не актуально. Мне удалось легко выбрать большинство частей конфигурации оборудования (например, сетевые адаптеры на основе межсоединения), но я не понимаю, как выбрать жесткий диск / память / процессоры.
Жесткие диски: поскольку я использую сетевое хранилище, правильно ли я считаю, что размер / тип (твердотельный накопитель или шпиндель) жесткого диска вряд ли имеет значение, поскольку они должны соответствовать только требованиям типичного загрузочного диска?
Память: предполагая, что тестовые задания не требуют интенсивного использования памяти, есть ли какое-либо преимущество в производительности от наличия большого объема памяти на головном узле? Планирование заданий не требует больших затрат памяти. Если нет, то какое практическое правило использовать, чтобы решить, сколько памяти мне нужно?
Процессор: если исключить тестовые задания, есть ли какие-то преимущества в наличии большего количества ядер или более высоких тактовых частот на процессоре? Я полагаю, что такое планирование заданий не требует больших вычислительных ресурсов и вряд ли выигрывает от более быстрого процессора или параллелизма.
Избыточность: как избежать того, чтобы головные узлы были SPOF? Имея 2 или более головных узла? Могу ли я оставить резервные головные узлы полностью пассивными (неиспользуемыми) - иначе я полагаю, что будет очень беспорядочно пытаться восстановить после мертвого головного узла? Допустима ли неоднородность (разные спецификации оборудования) между головными узлами? Есть ли необходимость в RAID-зеркалировании загрузочных дисков на головных узлах?