У меня есть облако solr (5.2.1) с 5 осколками и 2 узлами.
В этом кластере у меня 163.463.543 элемента. Я проиндексировал еще 200000 элементов, и теперь версии / sizeInBytes между двумя узлами кластера больше не согласованы.
shard1 | sizeInBytes | segmentCount | version |
--------------------------------------------------
replica1 | 71325055021 | 14 | 11877844 |
replica2 | 71330161457 | 8 | 11877874 |
shard2 | sizeInBytes | segmentCount | version |
--------------------------------------------------
replica2 | 71658372259 | 9 | 11965329 |
replica1 | 71660446852 | 17 | 11965305 |
shard3 | sizeInBytes | segmentCount | version |
--------------------------------------------------
replica1 | 72328398189 | 24 | 11978919 |
replica2 | 72329934372 | 20 | 11978971 |
shard4 | sizeInBytes | segmentCount | version |
--------------------------------------------------
replica1 | 71398290694 | 10 | 11882893 |
replica2 | 71398972036 | 16 | 11883065 |
shard5 | sizeInBytes | segmentCount | version |
--------------------------------------------------
replica2 | 71635961292 | 16 | 11920521 |
replica1 | 71636668652 | 9 | 11920667 |
Когда я смотрю на страницу состояния облака веб-интерфейса, все кажется прекрасным. Есть идеи, что случилось / как это исправить?
Я провел много исследований по этому поводу, и единственная ссылка, которую я могу найти, - это письмо в списке рассылки Solr: Ссылка на сайт
SolrCloud работает совсем иначе, чем старая репликация главный-подчиненный. Индекс НЕ копируется с ведущей реплики на другие реплики, за исключением крайних случаев восстановления.
Каждая реплика строит свою собственную копию индекса независимо от других. Из-за незначительных различий во времени операций индексирования и возможных действий, связанных с воспроизведением журнала транзакций при перезапуске узла, каждая реплика может иметь разный макет индекса. Также могут быть различия в количестве удаленных документов. Если что-то не пойдет не так, все реплики должны содержать одни и те же живые документы.
Спасибо, Шон
Я видел то же самое на собственном опыте. Я недавно создал 10 новых коллекций Solr с 2 репликами, загрузил несколько сотен тысяч документов в каждую из коллекций, и версии больше не совпадают. Похоже, что версия - это пережиток времен SolrCloud, и ей не нужно соответствовать.