Как измеряется скорость диска? Чтение - Мбит или Мбайт в секунду? Что сегодня является средним, а что быстро и что очень быстро в отрасли?
Предположим, кто-то говорит, что создание копии файла размером 1500 ГБ (например, файла базы данных) занимает много времени, сколько времени это займет в профессиональной системе и как это можно рассчитать, принимая во внимание скорость жесткого диска. ?
Скорость диска обычно измеряется в;
Как видите, реального среднего нет, если вы хотите порекомендовать, что покупать, не стесняйтесь возвращаться к нам с как можно больше информации - это должно включать бюджет, тип приложения, размер набора данных, базу пользователей, оборудование / ОС и все остальное, что вы считаете полезным.
Что касается вашей копии на 1,5 ТБ, что ж, если вы делали это с USB 2-подключенным 7200 об / мин SATA-диском, вы должны получить как минимум 30-40 Мбит / с или около того, на полные 1,5 ТБ может потребоваться более 10 часов или около того. Если бы это была типичная профессиональная система DAS / SAN, я бы ожидал около 100 Мбит / с, то есть это заняло бы около 3 часов.
Надеюсь, это поможет, да и просто чтобы уточнить, МБ = мегабайты, МБ - мегабиты.
В таких расчетах задействовано множество переменных. Дисковые системы реального мира имеют много взаимозависимостей. Всего на одном компьютере:
Как видите, скорость самого диска - лишь один из многих факторов. Это большой фактор, но все же один из многих. Если вся эта копия объемом 1,5 ТБ находится на одном диске, то диск (с вероятностью 95%) будет выполнять 100% произвольное чтение / запись, что обычно приводит к худшим показателям производительности. Если копия выполняется с одного диска на другой, и данные являются 100% последовательными, а целевой диск полностью пуст, это должно обеспечить максимально возможную производительность с этой дисковой подсистемой. Производительность в реальном мире будет где-то между этими двумя крайностями.
Если вы копируете между двумя отдельными серверами, существует еще больше факторов.
У меня есть массив хранения, который может загружать каналы SAS 3 Гбит (гигабит) при выполнении в основном последовательных операций. Если бы у меня был SAS 6 Гбит, он, вероятно, был бы очень близок к насыщению и их. Для случайного ввода-вывода эта конкретная система работает по-разному в зависимости от операционной системы (OpenSolaris, например, имел худший случайный ввод-вывод, а Linux XFS - лучший в 3 раза).
Слишком много переменных, чтобы дать окончательный ответ на этот вопрос.
Сколько времени потребуется для копирования 1,5 ТБ данных, во многом зависит от типа данных. Если у вас есть несколько 1500 файлов размером 1 ГБ, это, вероятно, займет всего несколько часов, но если у вас есть полтора миллиарда файлов размером 1 КБ, это, вероятно, займет несколько дней.
Это связано с двумя конкурирующими характеристиками дисков: пропускной способностью и средним временем доступа. Обычный диск с пропускной способностью 100 МБ / с и временем доступа 10 мс довольно распространен. Если вы можете передавать данные последовательно, вы можете получить 100 МБ / с. Однако, если вам нужно перейти в другое место, это займет 10 мс. Если бы вы вели потоковую передачу, вы могли бы записать 1 МБ данных за время, необходимое для перехода в другое место.
Создание файла может потребовать нескольких поисков, поэтому создание файла размером 1 КБ может «стоить» столько же, сколько потоковая передача нескольких МБ данных.
Итак, в некоторых случаях лучше сделать необработанную копию блочного устройства на диске, чем копировать в файловую систему через что-то вроде rsync. Если у вас много файлов в файловой системе, которая, скажем, заполнена на 50% или более, вам часто лучше просто скопировать полное блочное устройство через «dd», насколько это займет время. Конечно, вы не можете сделать это, пока файловая система смонтирована, так что это тоже имеет недостатки.
SSD-накопители могут помочь смягчить это, потому что их время доступа примерно в 100 раз быстрее, но у MLC SSD есть сложные проблемы с доступом в зависимости от доступности пула предварительно удаленных блоков. В этом могут помочь твердотельные накопители SLC.
Контроллеры RAID со встроенным кешем могут помочь с поисками, как и что-то вроде модуля ядра flashcache, который позволяет кэшировать блочное устройство через SSD.
Системы RAID позволяют выполнять несколько параллельных поисков, эффективно сокращая среднее время доступа, а также распараллеливание для увеличения пропускной способности. Но ваша общая производительность часто будет зависеть от того, сколько файлов задействовано.