Назад | Перейти на главную страницу

Диск сбойных дисковых пространств - том отключен

Мы установили недорогой физический сервер с кучей дисков по 3 ТБ, который будет использоваться в качестве промежуточной области резервного копирования, прежде чем мы перейдем на ленту. Мы установили Windows Server 2012 R2 и настроили дисковые пространства / пулы. Мы выполняем резервное копирование с помощью Veeam на более быстрый сервер, работающий на Fibre Channel, а затем с помощью скриптов перемещаем резервные копии старше x дней на наш сервер Storage Spaces.

Первоначально у нас были некоторые сбои, поскольку мы обнаружили, что использование Robocopy для перемещения данных по пути UNC не приводит к корректному закрытию соединения SMB. мы решили эту проблему, добавив в скрипт чистое использование, а затем чистое использование / удаление (а затем используя букву диска в качестве цели Robocopy). Это прекрасно работало последние недели или две.

Однако сегодня утром скрипты сообщили об ошибке. После расследования я обнаружил серию предупреждений о событии с идентификатором 51, за которыми следует событие с идентификатором 134 (из источника ReFS). Мне кажется, что отказал физический диск в пуле хранения. Однако, глядя в диспетчер сервера, он показал виртуальный диск / том / не совсем уверен, как его назвать «автономным»; просто вернуть его в оперативный режим сработало, и в пуле хранения нет неисправных физических дисков. Также есть два горячих резерва, и ни один из них не был заменен.

Мне любопытно, что здесь произошло? А также почему отключилась громкость? Я думал, что вся суть ReFS и пулов хранения заключается в обеспечении надежности в случае подобных сбоев?

РЕДАКТИРОВАТЬ: добавление всех соответствующих журналов ниже.

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
  <Provider Name="disk" /> 
  <EventID Qualifiers="32772">51</EventID> 
  <Level>3</Level> 
  <Task>0</Task> 
  <Keywords>0x80000000000000</Keywords> 
  <TimeCreated SystemTime="2014-12-23T22:13:12.704827200Z" /> 
  <EventRecordID>23901</EventRecordID> 
  <Channel>System</Channel> 
  <Computer>****</Computer> 
  <Security /> 
  </System>
 <EventData>
  <Data>\Device\Harddisk25\DR25</Data> 
  <Binary>040080000100000000000000330004802D0100006B0400C000000000000000000000000000000000FC8F470200000000FFFFFFFF0100000058000030020000000020101280032040000080003C000000000020AB09E0FFFF783583D201E0FFFF0000000000000000507383D201E0FFFF30C99FC108E0FFFF6B0400C0000000008A00000000027C288D60000008000000000000000000000000000000000000000000000000000000</Binary> 
  </EventData>
  </Event>

Ошибка была обнаружена на устройстве \ Device \ Harddisk25 \ DR25 во время операции подкачки.

FYI Disk25 - это виртуальный диск, созданный пространствами хранения, а не один из физических дисков.

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
 <System>
  <Provider Name="ReFS" Guid="{036647D2-2FB0-4E32-8349-3F5C19C16E5E}" /> 
  <EventID>134</EventID> 
  <Version>0</Version> 
  <Level>2</Level> 
  <Task>0</Task> 
  <Opcode>0</Opcode> 
  <Keywords>0x8000000000000000</Keywords> 
  <TimeCreated SystemTime="2014-12-23T22:13:13.329846900Z" /> 
  <EventRecordID>23902</EventRecordID> 
  <Correlation /> 
  <Execution ProcessID="4" ThreadID="31267444" /> 
  <Channel>System</Channel> 
  <Computer>*****</Computer> 
  <Security UserID="S-1-5-18" /> 
  </System>
<EventData>
  <Data Name="VolumeIdLength">2</Data> 
  <Data Name="VolumeId">D:</Data> 
  <Data Name="FailureReason">0xc000000e</Data> 
  </EventData>
  </Event>

Файловой системе не удалось записать метаданные на резервный носитель D :. Ошибка записи со статусом «Указано несуществующее устройство». ReFS переведет том в автономный режим. Его можно снова смонтировать автоматически.

 <Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
 <System>
  <Provider Name="Microsoft-Windows-StorageSpaces-Driver" Guid="{595F7F52-C90A-4026-A125-8EB5E083F15E}" /> 
  <EventID>304</EventID> 
  <Version>0</Version> 
  <Level>3</Level> 
  <Task>0</Task> 
  <Opcode>0</Opcode> 
  <Keywords>0x8000000000000000</Keywords> 
  <TimeCreated SystemTime="2014-12-30T23:43:40.519688500Z" /> 
  <EventRecordID>21</EventRecordID> 
  <Correlation /> 
  <Execution ProcessID="4" ThreadID="3723912" /> 
  <Channel>Microsoft-Windows-StorageSpaces-Driver/Operational</Channel> 
  <Computer>****</Computer> 
  <Security UserID="S-1-5-18" /> 
  </System>
 <EventData>
  <Data Name="Id">{DE94C7EF-6A25-11E4-80B7-647002019326}</Data> 
  </EventData>
  </Event>

Виртуальный диск {de94c7ef-6a25-11e4-80b7-647002019326} находится в нерабочем состоянии. Это может произойти, когда физический диск, на котором размещен виртуальный диск, выходит из строя, отключается или возникает ошибка записи.

Windows попытается восстановить виртуальный диск. В настоящее время никаких действий не требуется.

Предполагая, что вы определенно используете отказоустойчивый режим, такой как контроль четности или зеркалирование, эта ошибка не должна быть возможной. Мне удалось воспроизвести эту ошибку в настройке чередования с диском, который, как я знаю, плохой. Итак, либо вы настроены на чередование, либо обнаружили ошибку. Я бы привлек на этом этапе Microsoft, если вы еще этого не сделали.

После продолжительного обсуждения по электронной почте с инженером службы поддержки Microsoft мы закончили установку следующего накопительного обновления:

http://support.microsoft.com/kb/2887595

Это включает обновление, которое, кажется, специально нацелено на эту проблему:

https://support.microsoft.com/en-us/kb/2897150

После установки накопительного обновления том постоянно оставался в сети без каких-либо проблем.