Назад | Перейти на главную страницу

Каков побочный эффект наличия таблиц Cassandra с размерами разделов более 100 МБ?

Я запускаю Apache Cassandra 3.11.1 и имею 6 размеров таблиц в состоянии сбоя.

Max partition is larger than 100MB.

Для этих 6 таблиц размер разделов в среднем составляет от 200 МБ до 5 ГБ. Эти 6 таблиц разделены на 3 ключевых пространства и относятся к Акка Постоянство eventsByTag (например, eventsByTag1, eventsByTag2).

Большая часть данных в этих таблицах не используется, они все еще должны быть доступны.

Я собираюсь изменить модель данных, но в то же время пытаюсь лучше понять, какое влияние оказывает большой размер разделов.

Кроме нехватки памяти или ударов Ограничения Кассандры каковы другие негативные последствия наличия больших размеров разделов, если доступ к большей части данных отсутствует?

Конкретный случай, который может быть связан (не подтвержден), заключается в том, что в настоящее время я использую Cassandra с материализованными представлениями и elasticsearch. Иногда прогнозы, используемые для обновления elasticsearch данными из Cassandra, терпят неудачу, и я еще не уверен, связано ли это.

В этом случае я получаю следующее сообщение об ошибке:

Caused by: com.datastax.driver.core.exceptions.ReadTimeoutException: 
Cassandra timeout during read query at consistency LOCAL_QUORUM (2 
responses were required but only 1 replica responded)

В этой версии Cassandra она должна быть лучше, чем раньше, хотя все еще могут быть проблемы с производительностью, связанные с доступом ко многим SSTables, выбором только ключа раздела и т. Д.

Эта презентация дает хороший обзор работы, проделанной для поддержки «широких разделов», хотя по-прежнему рекомендуется повторно моделировать данные.