RAID (monitoring)
Nástroj mdadm
umožňuje průběžně sledovat stav pole a v případě, že dojde k jeho rozpadu či selhání některého z disků vám odešle upozornění na jehož základě budete moct provést servisní zásah.
Aby to fungovalo, musíte mít na stroji funkční odesílání e-mailů (nakonfigurovaný exim4 nebo jiný mailovací systém) a v souboru /etc/mdadm.conf
nastaveno na jakou adresu má být upozornění odesláno (MAILADDR) a pokud možno i zpáteční adresu (MAILFROM), abyste si pak nemuseli lámat hlavu s tím, na kterém stroji vám RAID pole vlastně selhalo.
E-mail však není příliš spolehlivé komunikační médium, proto je vhodné nastavit systém tak, aby byl tento informační mail odesílán opakovaně, dokud nebude problém odstraněn.
Kromě výpisu souboru /proc/mdstat
, můžete zjistit další informace o běžícím RAID poli pomocí dotazů přes mdadm:
stroj~# mdadm -Q /dev/md0
/dev/md0:37.28GiB raid1 2 devices, 0 spares. Use mdadm --detail for more detail.
|
Podrobnější výpis můžete dostat buď přidáním volby --detail
a nebo rovnou nahrazením parametru -Q
za -D
:
stroj~# mdadm -D /dev/md0
/dev/md0:
Version : 00.90.01
Creation Time : Thu Mar 12 01:34:06 2009
Raid Level : raid1
Array Size : 39086016 (37.28 GiB 40.02 GB)
Device Size : 39086016 (37.28 GiB 40.02 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 0
Persistence : Superblock is persistent
Update Time : Tue Jul 21 10:55:23 2009
State : clean
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
UUID : ae074243:b857e8b6:85943576:cab70855
Events : 0.13454779
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
1 8 17 1 active sync /dev/sdb1
|
Ve výše uvedeném výpisu jsou vypsány tyto informace:
- Jde o pole typu RAID1 (zrcadlo)
- je složeno ze dvou logických diskových oddílů (
/dev/sda1
a/dev/sdb2
) - major-minor čísla tj. čísla speciálních zařízení jednotlivých oddílů jsou: 8-1 (
/dev/sda1
) a 8-17/dev/sdb2
). - preferované minor number RAID pole je 0 (nula), takže se pole automaticky sestaví po spuštění jako
/dev/md0
. - položka update time se používá při sestavování pole, kdy je potřeba zjistit, které členy pole obsahují platná data (novější záznam o poslední aktualizaci pole). Pokud jsou tedy u dvou členů zrcadla (pole RAID1) časy různé, použije se pro sestavení pouze novější člen(!) a starší člen je tedy poté nutno s polem synchronizovat (viz Rekonstrukce degradovaného pole).
Výše uvedené informace se zapisují do superbloku každého členu pole (dřív se superbloky nepoužívaly, takže bylo například velmi obtížné pole po změně zapojení disků správně složit). Informace o poli musí být konzistentní u všech členů pole.
Informace z jednotlivých členů pole, lze zjišťovat jejich přímým dotazováním:
stroj~# mdadm -Q --examine /dev/sda1
|
Výstup bude obdobný jako tabulka která byla uvedena výše. Navíc v ní však bude uvedeno, kterého člena pole jsme se zeptali. Na základě tohoto výpisu pak můžeme kupř. zjistit:
- do kterého RAID pole patří resp. patřil
- kdy byl naposled aktualizován a v jakém stavu se tehdy pole nacházelo.
- jaké bylo v poli jeho pořadí
To jsou informace důležité především při úpravách na úrovni fyzických zařízení či opravě rozpadlého pole.