Особенности восстановения данных с поврежденного RAID 10 МАССИВА

05-Jun-2015 12:40
Для того чтобы вывести из строя зеркалированный RAID-массив, пользователю нужно очень постараться. Ведь эта система «поломается» только при повреждении всех накопителей с одного из своих зеркал. Поэтому восстановление RAID 10 требуется гораздо реже, чем для схемы 0+1, которая повреждается при «поломке» двух накопителей из разных массивов.

Однако и эта схема подвержена поломкам. Поэтому при повреждении конфигурации, файловой системы, контроллера или нескольких дисков системы нужно обращаться к специалистам, если конечно пользователь не желает самостоятельно «уничтожить» данные при попытке восстановления системы.

Специалисты знают, что поломка одного диска из зеркала еще не означает потерю всей системы, так как контроллер может выбрасывать диск из-за краткосрочного сбоя. Поэтому для выхода контроллера из строя чаще всего нужен высокий скачок напряжения, который повредит оба накопителя из одного зеркала. Впрочем, софтовый RAID-массив может выйти из строя и при повреждении таблицы разделов. Кроме того, проблемы могут возникнуть при форматировании или удалении данных на «поврежденном» логическом устройстве. Проблемы возникают и по причине повреждения самого массива данных, когда не открываются файлы или в операционной системе куда-то пропал целый раздел.

Однако чаще всего проблемы возникают из-за «человеческого фактора» - не настроили систему мониторинга и поздно заметили поврежденные диски, а затем уничтожили данные при самостоятельной попытке восстановления системы.

При этом пользователи даже не догадываются, что стандартные процедуры с поврежденным массивом (переинициализация, запуск Rebuild, добавка нового диска) в лучшем случае гарантируют лишь восстановление избыточности и работоспособности системы без сохранения данных. Тот же неправильный в одном из накопителей Rebuild просто «убьет» все зеркало.

Поэтому специалисты работаю по-другому. Сначала они пытаются выяснить причину возникновения проблемы у хозяина системы. Затем проверяют возможные гипотезы путем тестирования работоспособности всех накопителей, в ходе которого выявляются аппаратные проблемы, решаемые в определенной последовательности.

Операционная система «разбирается» с объединенными в отдельное устройство дисками, оставшимися годными к логическому анализу, путем работы с их образами. При этом удается восстановить утерянные на диске данные путем копирования, замены или «чтения» данных с исправного накопителя. Специалисты не предпринимают никаких действий, ведущих к уничтожению данных на накопителе, так как считают, что наличие любого варианта информации лучше, чем полное ее отсутствие.

Немного информации. Под термином RAID скрывается технология виртуализации данных, объединяющая в логический элемент сразу несколько независимых дисков для повышения производительности и избыточности системы. Надежность архитектуры RAID 10 (иначе 1+0) обеспечивается тем, что данные в этом зеркалированном массиве записываются на четное количество дисков (не менее четырех) с парным копированием как в RAID 1 и по последовательной схеме соединения (RAID 0). Поэтому данный массив - это сочетание лучших качеств обеих схем размещения данных, выражающихся в виде высокой производительности и «ломающейся» только при повреждении обоих накопителей одного зеркала, которые являются копией друг друга.
Print article