Назад | Перейти на главную страницу

Если версия реплики соответствует репликам одного и того же шарда в SolrCloud

У меня есть облако solr (5.2.1) с 5 осколками и 2 узлами.

В этом кластере у меня 163.463.543 элемента. Я проиндексировал еще 200000 элементов, и теперь версии / sizeInBytes между двумя узлами кластера больше не согласованы.

shard1   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica1 | 71325055021 |           14 | 11877844 |
replica2 | 71330161457 |            8 | 11877874 |

shard2   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica2 | 71658372259 |            9 | 11965329 |
replica1 | 71660446852 |           17 | 11965305 |

shard3   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica1 | 72328398189 |           24 | 11978919 |
replica2 | 72329934372 |           20 | 11978971 |

shard4   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica1 | 71398290694 |           10 | 11882893 |
replica2 | 71398972036 |           16 | 11883065 |

shard5   | sizeInBytes | segmentCount |  version |
--------------------------------------------------
replica2 | 71635961292 |           16 | 11920521 |
replica1 | 71636668652 |            9 | 11920667 |

Когда я смотрю на страницу состояния облака веб-интерфейса, все кажется прекрасным. Есть идеи, что случилось / как это исправить?

Я провел много исследований по этому поводу, и единственная ссылка, которую я могу найти, - это письмо в списке рассылки Solr: Ссылка на сайт

SolrCloud работает совсем иначе, чем старая репликация главный-подчиненный. Индекс НЕ копируется с ведущей реплики на другие реплики, за исключением крайних случаев восстановления.

Каждая реплика строит свою собственную копию индекса независимо от других. Из-за незначительных различий во времени операций индексирования и возможных действий, связанных с воспроизведением журнала транзакций при перезапуске узла, каждая реплика может иметь разный макет индекса. Также могут быть различия в количестве удаленных документов. Если что-то не пойдет не так, все реплики должны содержать одни и те же живые документы.

Спасибо, Шон

Я видел то же самое на собственном опыте. Я недавно создал 10 новых коллекций Solr с 2 репликами, загрузил несколько сотен тысяч документов в каждую из коллекций, и версии больше не совпадают. Похоже, что версия - это пережиток времен SolrCloud, и ей не нужно соответствовать.