Datenverlust bei RAID 5 Systemen – trotz Redundanz

Wie ist Datenverlust bei RAID 5 Systemen möglich? Schließlich werden die Daten doch redundant – wie der Name Redundant Array of Independent Disks schon sagt, auf den Festplatten gespeichert, von denen eine HDD ausfallen darf, ohne dass das RAID ausfällt?

Ich selbst war viele Jahre im IT-Groß- und Fachhandel tätig. In der Zeit habe ich mit einer Vielzahl von Entscheidern, Händlern, Inhabern und Verkäufern gesprochen. Einen Server zu verkaufen war in der Regel nicht schwer. Kunden davon zu überzeugen, dass ein RAID – wenn nicht gerade ein RAID 0, was zudem nichts mit Redundanz zu tun hat – eine sinnvolle Investition ist meist auch nicht. Das RAID 5 war hier meist schon das Mittel der Wahl. Wenn es allerdings darum ging, eine Backup-Lösung an den Mann zu bringen, dann hat man sich nicht selten die Zähne an der Sache ausgebissen.

Das RAID5 ist mein Backup – die Hot-Spare meine Sicherheit

Traurig, aber wahr – noch heute ist dieser Ansatz nicht wenig verbreitet. Das hat mehrere Ursachen. Bei der Sonntagsfrage würde die „Partei Unwissenheit“ wahrscheinlich die absolute Mehrheit erreichen, gefolgt von der „Partei Kosten“. Alle weiteren „Parteien“ würden hingegen schon fast an der 5% Hürde scheitern. Schauen wir uns die beiden Hauptpunkte näher an:

  • Unwissenheit:

In den Jahren habe ich festgestellt, dass auch Verkäufer gerne zu dem Argument greifen, dass ein RAID 5 quasi ausfallsicher ist – schließlich darf ja eine Festplatte ausfallen, ohne dass das System ausfällt. Durch ein Rebuild im Hintergrund springt die Hot-Spare ein und es kommt zu keinerlei Beeinträchtigung. Grundsätzlich stimmt dies natürlich, neben der Schulbuchtheorie gibt es aber auch eine weitere Seite der Medaille. Was oft nicht bekannt ist, ist die Tatsache, dass während eines Rebuilds ein (!) Lesefehler – ganz zu schweigen von tatsächlich defekten Sektoren – ausreichen kann, um den Rebuild-Prozess abzubrechen. Je älter die Festplatten und je größer die Kapazität und Anzahl der im RAID 5 Verbund eingesetzten Festplatten, desto höher auch die Wahrscheinlichkeit, dass dieses Szenario eintreten kann. Bricht der Prozess ab, ist das RAID 5 offline – und ein Weiterarbeiten ist nicht mehr möglich. Häufig haben auch die entsprechenden Personen auf der anderen Seite – die Einkäufer – keinerlei Vorstellung dieser Risiken.

Nicht unerwähnt bleiben sollte auch die Tatsache, dass ein RAID 5 Controller mal kaputt gehen kann. Dann hat man zwar heile Festplatten, aber der Austausch eines Controllers hat nicht automatisch zur Folge, dass das RAID 5 dann wieder intakt ist. Häufig genug führt dies nicht zum Erfolg.

  • Kosten:

Meist geht der Punkt „Kosten“ mit „Unwissenheit“ Hand in Hand. Wenn man die Risiken nicht kennt, dann ergibt es auch wenig Sinn, Geld für eine Backup-Lösung auszugeben, die flüchtig betrachtet unnötig ist und ausschließlich totes Kapital darstellt. Je nachdem, wie groß die Datenmenge ist, die gesichert werden muss, kann dies eine immense Investition bedeuten – für den meist eh sehr knapp kalkulierten Etat für IT.

Administrationsfehler – Irren ist leider menschlich

Administrationsfehler passieren – und die Folgen können dann sehr schwerwiegend sein. Wenn der RAID-Controller keine Fehlermeldung auswirft, dann kann das zwar auch ein Fehler des Controllers sein, meist aber eher der Fehler des IT-Verantwortlichen, der vergessen hat, diese Funktion zu konfigurieren. Und ganz im Ernst: wer überprüft in regelmäßigen Abständen, ob die Daten, die gesichert werden, sich auch tatsächlich auf der Sicherung befinden UND diese auf logische Verfügbarkeit hin zu verifizieren? Wahrscheinlich scheitern wir wieder an der 5% Hürde. Schließlich ist dies mitunter mit massivem Zeitaufwand verbunden, gegebenenfalls sind Zusatzinvestitionen für Testumgebungen zu tätigen. Menschlich verständlich, dass die wenigsten dies vollziehen.

RAID 5 Datenrettung – der letzte Ausweg

Meist ist die RAID 5 Datenrettung der letzte Ausweg, um doch noch an die Daten zu gelangen. Allerdings sind die Kosten der Datenrettung – abhängig vom Aufwand – auch nicht unerheblich. Daher wird leider der letzte Ausweg mitunter sehr wörtlich genommen. So wird erst einmal alles selbst versucht, die ursprüngliche Konfiguration zerschossen, chkdsk und weitere Reparaturtools drüber laufen lassen, ggf. das Ganze noch fatal geforced– bis schließlich verzweifelt aufgegeben wird.

Je weniger Rettungsversuche unternommen wurden, desto größer sind unsere Chancen, die Daten erfolgreich – und nicht selten auch vollständig – wiederherzustellen. In den letzten Jahren hat Attingo viel Zeit im Bereich Forschung und Entwicklung investiert, um zum einen den Prozess der Datenrettung deutlich zu beschleunigen und zum anderen vermeintlich nicht reparable Daten, verursacht durch diverse Eigenversuche, wiederherzustellen. Sprechen Sie uns sofort an, wenn es zum Ausfall des Systems kommt. Je weniger Eigenversuche, desto geringer ist in der Regel der Aufwand für uns – und desto günstiger wird am Ende auch die Datenrettung.

[Gesamt:3    Durchschnitt: 4.7/5]

Schreibe einen Kommentar