Назад | Перейти на главную страницу

Насколько плохо сетевое хранилище для определенных облачных приложений?

Я слышал, что рекомендуется держаться подальше от хостинга AWS для определенных приложений "больших данных" (например, Hadoop, Cassandra, Solr), потому что экземпляры EC2 обычно используют сетевое хранилище (хотя в последнее время есть несколько экземпляров с высоким уровнем ввода-вывода, но они видимо довольно дорого).

Мне кажется логичным, что NAS повлечет за собой довольно приличное снижение производительности, но насколько? Поскольку AWS существует, можно предположить, что существует множество примеров приложений, которые имеют смысл в среде этого типа, но каково хорошее практическое правило для определения того, конкретный приложение является хорошим кандидатом для AWS и NAS? (Помимо того, что приклеил его на AWS и попробовал.)

Задержка хранилища будет вашим показателем.

Если ваше приложение очень чувствительно к задержкам в хранилище, вы захотите отказаться от AWS и перейти на физический уровень или отказаться от денег, чтобы получить инстансы, оптимизированные для хранилища. Они специально заявляют, что это типы для таких вещей, как Hadoop и Cassandra.

Особенность более высоких уровней типов инстансов AWS заключается в том, что это не NAS, а физическая поддержка NAS. Детали не ясны, но вы намного ближе к оборудованию, когда управляете экземпляром, оптимизированным для хранения, для оптимизированного для кластера экземпляра.

Я использую Cassandra Cluster на AWS, и я согласен с тем, что вы читали о том, чтобы держаться подальше от NAS (EBS), я недавно перешел на коробки hi1.4xlarge (они поставляются с 2 твердотельными накопителями емкостью 1 ТБ), и я RAID0 их, чтобы получить максимум из этого. С этой настройкой я легко могу обрабатывать 15 тыс. Чтений / сек, мое приложение не очень ориентировано на запись, поэтому я не могу вам помочь. Надеюсь это поможет.