Назад | Перейти на главную страницу

Как определить потребности в IOPS после получения данных Transfers / sec?

Допустим, я собрал данные о передаче данных с диска в секунду за период 2x24 часа, то есть мгновенная выборка данных каждые 15 секунд. Какой статистический анализ я могу / должен применить к образцам, если я хочу использовать данные, например, для предоставления хранилища?

Должен ли я просто использовать пиковое значение (которое бывает менее 1% времени)? Должен ли я использовать среднее / среднее значение? Или формула, включающая среднее значение и отклонение?

storage iops

Вы всегда рассчитываете на пики, если только это не та рабочая нагрузка, которая может позволить себе иметь высокую задержку при большом количестве операций ввода-вывода. Это одна из причин, почему широкое чередование так популярно - вы можете собрать кучу рабочих нагрузок и размера для пика их совокупного использования - разные части будут пиковыми в разное время, поэтому вы можете использовать более дешевые диски для обеспечения того же вместимость.

Широкое чередование предполагает, что это какое-то централизованное хранилище. Если он локальный, конечно, вы не сможете таким образом агрегировать рабочую нагрузку.

К сожалению, на этот вопрос нет простого ответа. Во-первых, рассмотрите свои потребности. Сколько денег вы готовы / можете потратить? Какая избыточность вам нужна? Какой общий объем памяти вам нужен? Какую задержку вы можете выдержать? Насколько сильно вы увеличитесь за то время, в течение которого система прослужит (как в размере, так и в операциях ввода-вывода в секунду)? У вас есть время, чтобы поддерживать и сокращать данные, чтобы уменьшить их размер?

Ближе всего к ответу на ваш вопрос я могу отметить, что если вы не можете обрабатывать мгновенные операции ввода-вывода в любой момент времени, вы просто увеличиваете задержку. Если задержка не важна, то покупка хранилища на основе вашего прогнозируемого роста среднего числа операций ввода-вывода в секунду - неплохое место для начала.

ПРИМЕЧАНИЕ. Избыточность не является решением для резервного копирования, поэтому также планируйте резервное копирование. Резервные копии могут (должны) быть изолированы от ваших живых данных по времени и пространству.