Я запускаю Apache Cassandra 3.11.1 и имею 6 размеров таблиц в состоянии сбоя.
Max partition is larger than 100MB.
Для этих 6 таблиц размер разделов в среднем составляет от 200 МБ до 5 ГБ. Эти 6 таблиц разделены на 3 ключевых пространства и относятся к Акка Постоянство eventsByTag (например, eventsByTag1, eventsByTag2).
Большая часть данных в этих таблицах не используется, они все еще должны быть доступны.
Я собираюсь изменить модель данных, но в то же время пытаюсь лучше понять, какое влияние оказывает большой размер разделов.
Кроме нехватки памяти или ударов Ограничения Кассандры каковы другие негативные последствия наличия больших размеров разделов, если доступ к большей части данных отсутствует?
Конкретный случай, который может быть связан (не подтвержден), заключается в том, что в настоящее время я использую Cassandra с материализованными представлениями и elasticsearch. Иногда прогнозы, используемые для обновления elasticsearch данными из Cassandra, терпят неудачу, и я еще не уверен, связано ли это.
В этом случае я получаю следующее сообщение об ошибке:
Caused by: com.datastax.driver.core.exceptions.ReadTimeoutException:
Cassandra timeout during read query at consistency LOCAL_QUORUM (2
responses were required but only 1 replica responded)
В этой версии Cassandra она должна быть лучше, чем раньше, хотя все еще могут быть проблемы с производительностью, связанные с доступом ко многим SSTables, выбором только ключа раздела и т. Д.
Эта презентация дает хороший обзор работы, проделанной для поддержки «широких разделов», хотя по-прежнему рекомендуется повторно моделировать данные.