После полного отказа ИТ-специалиста, пришедшего в офис моего клиента, чтобы обновить жесткие диски на сервере (Windows 2003 RC2), наш сервер теперь практически непригоден. Машина загрузится, но примерно через час работы что-то происходит, не знаю, что, и 2-й ЦП становится полностью красным в диспетчере задач. Режим ядра и загрузка ЦП на 100%.
Журнал системных событий заполняется этой ошибкой - 4-5 минут:
Драйвер устройства \ Device \ Scsi \ viamraid1 обнаружил тайм-аут порта из-за длительного бездействия. Все связанные шины были сброшены, чтобы сбросить состояние.
Я даже позволил этому поработать 9 часов сегодня после того, как ушел, и за это время было более 2000 сообщений.
Сервер непригоден, и мой клиент полностью не может вести дела. Я не айтишник (я программист), сейчас День Благодарения, и я совершенно не в своей тарелке.
У кого-нибудь есть идеи по поводу этого сообщения? Вы когда-нибудь видели это раньше? Вы когда-нибудь решали это?
Дополнительная информация: на сервере 2 диска в массиве RAID 0 (я думаю, что или RAID 1). Дисководы SCSI. Предыдущий айтишник так запутался, что якобы вынул диски из RAID, и теперь при загрузке он должен загружаться с диска 0 ровно настолько, чтобы читать boot.ini, затем мы должны выбрать загрузку с диска 1. По какой-то причине мы не можем просто загрузиться с диска 1.
Сначала я подумал, что проблема связана с SQL Server, так как прямо перед отключением сервера мы начали интенсивный запрос, но даже после того, как я остановил все службы SQL, перезагрузился и т. Д., Он все равно отключился сам по себе через час. НИЧЕГО не происходило на сервере. То есть никого нет в офисе, не запускались процессы (насколько я знаю) и т.д.
Это чипсет VIA SATA, от которого у меня мурашки по коже, находясь на «сервере». Известны проблемы совместимости с различным оборудованием, со всеми блоками питания, которые выдают напряжение, выходящее за рамки спецификации VIA, и с Seagate HD с определенной прошивкой. Если у вас есть возможность выбрать между двумя дисками, то вы не используете аппаратный RAID, возможно, программный, но не можете сказать без дополнительной информации.
Необычная догадка: набор микросхем несовместим с новыми жесткими дисками, и когда они проводят частичное самотестирование, набор микросхем пугается, выдавая ошибку тайм-аута (похоже, примерно в нужный период).
Я бы начал с поиска новейших прошивок для MB, чипсета и HD. Потом новейшие драйверы для чипсета и контроллера SATA.