Наша компания с капиталом в 3 миллиарда долларов и командой из 6 специалистов по инфраструктуре. Я администратор базы данных, а не часть команды Infra.
Наша установка - это все VMware ESX 5.1, EMC SAN для хранения и ExaGrid для резервного копирования. Производственные и непродовольственные серверы размещены в отдельных DC в 2 разных городах. Ресурс резервной копии Prod реплицируется на общий ресурс, не являющийся продуктом, задержка обычно составляет 4-8 часов. Восстановление моей непроизводственной базы данных теперь занимает около 5 часов, что стоит нам ночных работ и простоев. Если я сначала скопирую резервные копии на локальные диски, то восстановление завершится через 1-2 часа. Я запросил дополнительный локальный диск на 500 ГБ на каждом из 4 непроизводственных серверов, и команда разработчиков инфраструктуры отклонила его, заявив, что это стоит около 5 тысяч долларов за 2 ТБ. Справедливо.
В этом случае мне не нужна отказоустойчивость, отказоустойчивость, обнаружение ошибок, зеркалирование, репликация, резервное копирование, восстанавливаемость; ничего подобного. Данные не важны, все, что мне нужно, - это разумная скорость на несколько часов два раза в неделю. Задача - восстановить базы данных за 1-2 часа. Я посмотрел на использование ОЗУ и ЦП, и они не были узкими местами.
Мой вопрос: есть ли способ использовать эти SSD как дешевое дополнительное хранилище как альтернатива дорогому SAN?
Если да, то какие еще расходы, помимо стоимости приводов?
Есть ли другой способ снизить стоимость до 2 тысяч долларов или даже 1 тысячи долларов?
Да, есть. Вы сталкиваетесь с типичным корпоративным идиотизмом, когда все передаете в SAN - что-то, что может убить вас в среднесрочной перспективе. Например, есть причина. MS SQL Server допускает использование ЛОКАЛЬНЫХ SSD для tempdb с 2012 года .... скорость против стоимости. Черт возьми, есть много случаев, когда даже производственные данные могут благополучно храниться на локальных дисках без устойчивости SAN, потому что у вас есть репликация на уровне приложения (например, группы доступности SQL Server Always On).
В основном: ваша команда Infra пытается решить все, стандартизируя технологию, которая делает все, и ожидает, что вы заплатите. Это извращение их работы - стандартизация действительных подходов ко всему, и да, наличие локального временного пространства очень важно, особенно для баз данных. И нет, для этого не нужна стойкость.
Ваш конкретный твердотельный накопитель будет работать, но, скорее всего, он быстро сгорит. Тем не менее концепция верна. Скорее всего куплю пару Samsung 843T;)
Если все, что вам нужно, это быстрое восстановление / откат, вам нужно локальное хранилище на хостах, а не дополнительный LUN в SAN. Обычно это называется DAS (хранилище с прямым подключением) и может иметь форму внешнего хранилища, заполненного дисками, или внутреннего диска, или десяти.
Самым дешевым решением является внешний USB-накопитель, который может обеспечить восстановление ~ 500 ГБ за ~ 5 часов в хороших условиях, при этом скорость USB ~ 25 Мбит / с является узким местом.
Внутренний SSD или даже 15k SAS (потенциально RAID-массив, для большего количества операций ввода-вывода в секунду), конечно, будет намного быстрее восстановить. Для внешнего доступа вам понадобится SAS HBA и устройство DAS.
Имейте в виду, что это не отменяет требования к правильной схеме резервного копирования / восстановления / аварийного восстановления. Стоимость этих решений может сильно различаться, возможно, даже до такой степени, что LUN EMC становятся дешевле.
Если ваш магазин чем-то похож на мой, вот что вы делаете:
Чтобы найти быстрое решение, я бы порекомендовал вам просто попросить DAS (хранилище с прямым подключением)! Часто проблема с производительностью возникала из-за того, что сеть SAN подключена через локальную сеть объемом 1 ГБ или диски слишком медленные для слишком большого количества приложений БД. DAS решит эту проблему, потому что вы единственный в этом хранилище, и вам не нужно использовать что-либо из этого: отказоустойчивость, обнаружение ошибок, зеркальное отображение, репликация, резервное копирование, возможность восстановления.