Использование smartctl для проверки RAID контроллеров Adaptec под Linux
Команду «smartctl -d ata -a /dev/sdb» можно использовать для проверки жесткого диска и текущего состояния его соединения с системой. Но как с помощью команд smartctl проверить SAS или SCSI диски, спрятанные за RAID контроллером Adaptec в системах под управлением Linux ОС? Для этого необходимо использовать последовательные синтаксисы проверки SAS или SATA. Как правило — это логические диски для каждого массива физических накопителей в операционной системы. Команду /dev/sgX возможно использовать в качестве перехода через контроллеры ввода/вывода, которые обеспечиваюь прямой доступ к каждому физическому диску, подключенному к RAID контроллеру Adaptec.
Распознает ли Linux контроллер Adaptec RAID?
Для проверки Вы можете использовать следующую команду:
В результате выполнения команды получите следующее:
Загрузка и установка Adaptec Storage Manager для Linux
Необходимо установить Adaptec Storage Manager в соответсвии собранному дисковому массиву.
Проверяем состояния SATA диска
Команда для сканирования накопителя выглядит довольно просто:
В результате у Вас должно получится следующее:
Таким образом, /dev/sda — это одно устройство, которое было определено как SCSI устройство. Выходит, что у нас SCSI собран из 4 дисков, расположенных в /dev/sg <1,2,3,4>. Введите следующую smartclt команду, чтобы проверить диск позади массива /dev/sda:
Контроллер должен сообщать о состоянии накопителя и уведомлять про ошибки (если такие имеются):
Для SAS диск используют следующий синтаксис:
В результате получим что то похожее на:
А вот команда для проверки следующего диска с интерфейсом SAS, названного /dev/sg2:
В /dev/sg1 заменяется номер диска. Например, если это RAID10 из 4-х дисков, то будет выглядеть так:
Проверить жесткий диск можно с помощью следующих команд:
Использование Adaptec Storage Manager
Другие простые команды для проверки базового состояния выглядят следующим образом:
Обратите внимание на то, что более новая версия arcconf расположена в архиве /usr/Adaptec_Event_Monitor. Таким образом, весь путь должен выглядеть так:
Вы можете самостоятельно проверить состояние массива Adaptec RAID на Linux с помощью ввода простой команды:
# /usr/Adaptec_Event_Monitor/arcconf getconfig 1
Или (более поздняя версия):
Примерный результат на фото:
По традиции, немного рекламы в подвале, где она никому не помешает. Напоминаем, что в связи с тем, что общая емкость сети нидерландского дата-центра, в котором мы предоставляем услуги, достигла значения 5 Тбит / с (58 точек присутствия, включения в 36 точек обмена, более, чем в 20 странах и 4213 пиринговых включений), мы предлагаем выделенные серверы в аренду по невероятно низким ценам, только неделю!.
Как проверить конфигурацию RAID в Linux?
Мне нужно проверить конфигурацию RAID в Linux. Как проверить текущую конфигурацию программного RAID-массива на сервере под управлением Linux, работающем на RHEL/CentOS или Debian/Ubuntu Linux?
Введение
Linux поддерживает как программные, так и аппаратные устройства RAID. В этой статье показано, как проверить программные RAID-устройства, созданные из двух или более реальных блочных устройств (жестких дисков/разделов).
Как проверить текущую конфигурацию RAID в Linux?
RAID — аббревиатура от «Redundant Array of Independent Disks». Это ничто иное, как объединенное виртуальное устройство, созданное из дисков или разделов. Некоторые уровни RAID включают избыточность и могут пережить некоторую степень сбоя устройства. Linux поддерживает следующие устройства RAID:
- RAID0 (striping)
- RAID1 (mirroring)
- RAID4
- RAID5
- RAID6
- RAID10
- MULTIPATH
- FAULTY
- CONTAINER
Проверка конфигурации RAID в Linux
/proc/mdstat — это специальный файл, в котором хранится важная информация обо всех активных на данный момент RAID-устройствах. Введите следующую команду cat:
Из приведенного выше вывода ясно, что у меня есть устройство RAID 10 viraul, состоящее из 5 разделов на диске:
- md125 — имя файла устройства RAID
- active raid10 — тип RAID
- sde3[3] sdb3[2] sdc3[1] sdd3[4] sda3[0] — устройство RAID 10 с именем /dev/md125, состоящее из пяти разделов (также называемое «компонентное устройство»)
- [UUUUU] — показывает состояние каждого устройства диска/раздела raid. «U» означает, что устройство исправно и работает. «_» — означает, что устройство не работает или повреждено
Просмотр конфигурации RAID в Linux
Чтобы определить, является ли конкретное устройство устройством RAID или компонентным устройством, запустите:
Давайте рассмотрим устройство RAID с именем /dev/md125 более подробно, выполнив следующую команду:
Наконец, для просмотра информации о компонентном устройстве с именем /dev/sdd3, выполните:
Спасибо за уделенное время на прочтение статьи!
Если возникли вопросы, задавайте их в комментариях.
Подписывайтесь на обновления нашего блога и оставайтесь в курсе новостей мира инфокоммуникаций!
Linux: Работа с RAID контроллером от HP
Небольшая инструкцию по мониторингу и настройке Raid массива на Raid контроллерах HP под CentOS 6.7.
При наличии необходимых навыков эта инструкция подойдет под любой другой дистрибутив Linux.
1) Для начала убедимся, что у нас есть HP контроллер:
Смотрим в разрезе устройств на шине:
Устройств при загрузке:
Или проверяем наличие символьного устройства hpilo.
Стоит уточнить, что на нескольких серверах, несмотря на наличие контроллера, символьного устройства не было.
1а) Более длинными способами, можно получить похожую картину:
Через smartctl:
Через lshw:
2) Устанавливаем утилиту hpacucli.
Подключаем репозитарий HP:
Версию и разрядность системы необходимо подставить самостоятельно или написать общий шаблон.
Как вариант ставим RPM пакет HP, который соответствует вашей системе:
3) Начало работа с hpacucli.
Проверяем статус контроллера:
Команда для проверки hpacucli controller all show status
Нормальное состояние контроллера должно отображаться так:
С чем я сталкивался:
Отсутствие «Cache Status» говорит об отсутствии батареи у кеша.
В этом состоянии:
— по неподтвержденным данным замедленной работой контроллера, по сравнению с присутствием батареи;
— невозможностью расширения массива на лету, путем добавления дисков и т.п.
Батарея есть, но подлежит замене
Примерно тоже самое, что выше, но также есть риск потери данных кеша при внезапном отключении питания.
Ошибка выглядит так:
Пора заменить микрокод контроллера!
Ошибка намекает на несовместимость утилиты hpacucli с установленным микрокодом в контроллере. Вариант или подобрать утилиту или обновиться.
Процедура обновления достаточно простая, но как обычно существуют стандартные риски при обновлении любых рейд контроллеров и это тема для отдельной статьи.
Заинтересованным смотреть с Firmware CD Supplemental Update Smart Array P212, P410, P410i, P411, P712m, and P812. Обновление прошло на лету, изменения применяются после перезагрузки.
Это же обновление лечит появление ошибок вида:
Перед обновлением собираем диагностическую информацию:
Данные будут доступны в «/tmp/diag_log.txt»
А также текущую конфигурацию контроллера:
Проверяем ранее собранную информацию. В моей диагностике видно, что запущено расширение массива (хотя оно было уже после накатки микрокода), что определенно вводит ограничение на обновление.
4) Настройка RAID с hpacucli.
Просмотр статусов логических дисков
Если логический диск в «работе» статус это покажет.
Результат добавления дисков в массив:
Просмотр статусов физических дисков
Один из дисков в режиме «скоро умрет».
Можем получить более детальную информацию:
Создание RAID массива
Добавление дополнительного физического диска к логическому
Добавить запасной диск:
Увеличение размера логического диска до указанного в size, после добавление нового физического
В моем случае ругнется и даст подсказку — нельзя делать диск меньше чес он сейчас.
Свободное место можно взять из детального вывода «hpacucli ctrl all show config detail».
У меня после добавления свободно 0,9Tb