Мы установили недорогой физический сервер с кучей дисков по 3 ТБ, который будет использоваться в качестве промежуточной области резервного копирования, прежде чем мы перейдем на ленту. Мы установили Windows Server 2012 R2 и настроили дисковые пространства / пулы. Мы выполняем резервное копирование с помощью Veeam на более быстрый сервер, работающий на Fibre Channel, а затем с помощью скриптов перемещаем резервные копии старше x дней на наш сервер Storage Spaces.
Первоначально у нас были некоторые сбои, поскольку мы обнаружили, что использование Robocopy для перемещения данных по пути UNC не приводит к корректному закрытию соединения SMB. мы решили эту проблему, добавив в скрипт чистое использование, а затем чистое использование / удаление (а затем используя букву диска в качестве цели Robocopy). Это прекрасно работало последние недели или две.
Однако сегодня утром скрипты сообщили об ошибке. После расследования я обнаружил серию предупреждений о событии с идентификатором 51, за которыми следует событие с идентификатором 134 (из источника ReFS). Мне кажется, что отказал физический диск в пуле хранения. Однако, глядя в диспетчер сервера, он показал виртуальный диск / том / не совсем уверен, как его назвать «автономным»; просто вернуть его в оперативный режим сработало, и в пуле хранения нет неисправных физических дисков. Также есть два горячих резерва, и ни один из них не был заменен.
Мне любопытно, что здесь произошло? А также почему отключилась громкость? Я думал, что вся суть ReFS и пулов хранения заключается в обеспечении надежности в случае подобных сбоев?
РЕДАКТИРОВАТЬ: добавление всех соответствующих журналов ниже.
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="disk" />
<EventID Qualifiers="32772">51</EventID>
<Level>3</Level>
<Task>0</Task>
<Keywords>0x80000000000000</Keywords>
<TimeCreated SystemTime="2014-12-23T22:13:12.704827200Z" />
<EventRecordID>23901</EventRecordID>
<Channel>System</Channel>
<Computer>****</Computer>
<Security />
</System>
<EventData>
<Data>\Device\Harddisk25\DR25</Data>
<Binary>040080000100000000000000330004802D0100006B0400C000000000000000000000000000000000FC8F470200000000FFFFFFFF0100000058000030020000000020101280032040000080003C000000000020AB09E0FFFF783583D201E0FFFF0000000000000000507383D201E0FFFF30C99FC108E0FFFF6B0400C0000000008A00000000027C288D60000008000000000000000000000000000000000000000000000000000000</Binary>
</EventData>
</Event>
Ошибка была обнаружена на устройстве \ Device \ Harddisk25 \ DR25 во время операции подкачки.
FYI Disk25 - это виртуальный диск, созданный пространствами хранения, а не один из физических дисков.
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="ReFS" Guid="{036647D2-2FB0-4E32-8349-3F5C19C16E5E}" />
<EventID>134</EventID>
<Version>0</Version>
<Level>2</Level>
<Task>0</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000000</Keywords>
<TimeCreated SystemTime="2014-12-23T22:13:13.329846900Z" />
<EventRecordID>23902</EventRecordID>
<Correlation />
<Execution ProcessID="4" ThreadID="31267444" />
<Channel>System</Channel>
<Computer>*****</Computer>
<Security UserID="S-1-5-18" />
</System>
<EventData>
<Data Name="VolumeIdLength">2</Data>
<Data Name="VolumeId">D:</Data>
<Data Name="FailureReason">0xc000000e</Data>
</EventData>
</Event>
Файловой системе не удалось записать метаданные на резервный носитель D :. Ошибка записи со статусом «Указано несуществующее устройство». ReFS переведет том в автономный режим. Его можно снова смонтировать автоматически.
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="Microsoft-Windows-StorageSpaces-Driver" Guid="{595F7F52-C90A-4026-A125-8EB5E083F15E}" />
<EventID>304</EventID>
<Version>0</Version>
<Level>3</Level>
<Task>0</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000000</Keywords>
<TimeCreated SystemTime="2014-12-30T23:43:40.519688500Z" />
<EventRecordID>21</EventRecordID>
<Correlation />
<Execution ProcessID="4" ThreadID="3723912" />
<Channel>Microsoft-Windows-StorageSpaces-Driver/Operational</Channel>
<Computer>****</Computer>
<Security UserID="S-1-5-18" />
</System>
<EventData>
<Data Name="Id">{DE94C7EF-6A25-11E4-80B7-647002019326}</Data>
</EventData>
</Event>
Виртуальный диск {de94c7ef-6a25-11e4-80b7-647002019326} находится в нерабочем состоянии. Это может произойти, когда физический диск, на котором размещен виртуальный диск, выходит из строя, отключается или возникает ошибка записи.
Windows попытается восстановить виртуальный диск. В настоящее время никаких действий не требуется.
Предполагая, что вы определенно используете отказоустойчивый режим, такой как контроль четности или зеркалирование, эта ошибка не должна быть возможной. Мне удалось воспроизвести эту ошибку в настройке чередования с диском, который, как я знаю, плохой. Итак, либо вы настроены на чередование, либо обнаружили ошибку. Я бы привлек на этом этапе Microsoft, если вы еще этого не сделали.
После продолжительного обсуждения по электронной почте с инженером службы поддержки Microsoft мы закончили установку следующего накопительного обновления:
http://support.microsoft.com/kb/2887595
Это включает обновление, которое, кажется, специально нацелено на эту проблему:
https://support.microsoft.com/en-us/kb/2897150
После установки накопительного обновления том постоянно оставался в сети без каких-либо проблем.