В нашем кластере Isilon у нас есть файловая система на 124 ТБ. В настоящее время он заполнен на 38 процентов и содержит 31 миллион файлов. Около половины данных составляют файлы изображений, а средний размер файла составляет 1,5 МБ. Мы используем моментальные снимки для защиты от случайного удаления, но нам нужно что-то другое для защиты от полного отказа (например, ошибка системного администратора, ошибка программного обеспечения или повреждение водой, теплом или огнем). А поскольку у нас плохая исследовательская лаборатория, это не должно быть слишком дорого.
В настоящее время мы пытаемся выполнить резервное копирование на ленту, но здесь возникают две проблемы. Во-первых, простой обход дерева каталогов и определение каждого файла занимает более пяти дней, поэтому даже инкрементное резервное копирование занимает больше недели. Во-вторых, что наиболее важно, восстановление займет много недель, даже месяцев.
В идеале мы хотели бы снова получить доступ к большей части данных в течение недели после аварии. (Можно вернуть данные постепенно в течение нескольких недель, если мы можем выбрать, какие каталоги восстанавливать в первую очередь, но поиск нового оборудования для хранения и восстановление, вероятно, займет гораздо больше времени.) Единственный способ, которым я могу думать о восстановлении в неделя - на сохранение реплики на диске в отдельном месте. Можно потерять хотя бы несколько дней работы, поэтому репликация может немного задержаться или покрыть файловую систему в течение нескольких дней. Также нормально, если реплика будет иметь гораздо более низкую производительность, чем оригинал.
Решение Isilon заключалось бы в использовании SyncIQ для репликации файловой системы в другой кластер. Поскольку это работает на уровне блоков, это позволяет избежать проблем с просмотром файловой системы и статистикой каждого файла. Как и следовало ожидать, стоимость немного высока: лицензия на программное обеспечение SyncIQ составляет 55 тысяч долларов, а кроме того, есть стоимость дорогостоящего хранилища Isilon для синхронизации (хотя использование их более дешевого хранилища NL немного помогает). Я ожидаю, что решение Isilon будет стоить где-то от 500 до 1000 долларов за ТБ, что намного лучше, чем 1300–1900 долларов за ТБ, которые мы заплатили за основное хранилище, но все же это большие деньги для нас.
Учитывая, что в наши дни необработанные жесткие диски можно купить по цене 60 долларов за ТБ, я надеюсь, что 124 ТБ медленного хранилища можно собрать вместе по гораздо более низкой цене, чем Isilon, и что есть способ воспроизвести изменения менее чем за неделю. Вы можете придумать способ?
Я работаю в магазине, в котором также есть кластер Isilon; Я особо не касался этого, поэтому не могу сказать слишком много о каких-либо конкретных деталях.
Но при такой настройке мы действительно делаем резервную копию на ленту; у нас есть ленточный робот, поэтому нам не нужно постоянно переключать картриджи (что, я полагаю, делает долгое резервное копирование более приемлемым). Мы также выбрали более дорогие узлы Isilon серии X и только что получили их ; да, меньше места для хранения на узел, но также позволяет немного больше терпимости к сбоям.