Мы делаем ночные снимки S3. Обычно они занимают ~ 2 часа. Один у меня уже 4 дня работает. Я пытался остановить это с помощью этой команды:
time curl -XDELETE -s localhost:9200/_snapshot/sim-s3-backup/sim-autobackup_2015-05-15/?pretty
Однако даже эта команда зависает. Так что я дал ему поработать некоторое время, вот полный результат:
time curl -XDELETE -s localhost:9200/_snapshot/sim-s3-backup/sim-autobackup_2015-05-15/?pretty
^C
real 1544m19.284s
user 0m0.508s
sys 0m2.580s
Есть ли другой способ остановить этот снимок? Для справки, это вывод статуса:
curl -XGET -s localhost:9200/_snapshot/sim-s3-backup/sim-autobackup_2015-05-15/?pretty
{
"snapshots" : [ {
"snapshot" : "sim-autobackup_2015-05-15",
"indices" : [ "7199", "7399", "7299", "7499", "7599", "6202085", "6202082", "6202083", "8099", "6202059", "6202055", "5099", "5299", "5199", "6202076", "6202075", "6202078", "6202077", "6202079", "5899", "6202071", "6202073", "5699", "40061", "40064", "40065", "5599", "6201572", "3001", "3002", "3008", "3007", "3006", "3005", "5999", "6202044", "6202018", "6202013", "10109", "10009", "6099", "70005", "6201266", "6199", "6299", "10309", "10409", "10609", "10509", "7099", "6799", "6899", "40054", "40057", "40055", "40056", "6202068", "6202067", "6202060", "6699" ],
"state" : "IN_PROGRESS",
"start_time" : "2015-05-16T09:30:06.303Z",
"start_time_in_millis" : 1431768606303,
"failures" : [ ],
"shards" : {
"total" : 0,
"failed" : 0,
"successful" : 0
}
} ]
}
Я просто хочу как-то это остановить (не останавливая весь кластер). Затем я могу удалить его или повторно запустить новый снимок и получить на нем сегодняшнюю дату.
Исправил, хотя и не идеальным способом. Простой перезапуск одного узла за раз (простой двухузловой кластер) привел к сбою моментального снимка. Хорошие новости связаны с характером кластеризации, не было простоев служб, использующих ES.