Hardwaremangel

Vorsorge ist besser als Nachsorge

Autor: Jan P. Paschen (Consultant #FORTSCHRITT)
- 01.03.2023 -

In den letzten Jahren kam es in allen Bereichen immer wieder zu mangelnder Verfügbarkeit. Egal ob für Dinge des alltäglichen Lebens, Fahrräder oder Computerhardware. Lange Lieferzeiten und fehlerhafte Chargen traten in einem Ausmaß auf, das für viele ungewohnt und vor allem unvorhersehbar war. Aber was tun, wenn Hardware dringend benötigt wird?

Auch wenn prognostiziert wird, dass mit Anfang des Jahres 2023 die Halbleiterknappheit langsam zurückgehen wird und sich somit auch die Verfügbarkeit von Hardware wieder der Normalität nähert, sollte man aus den Erfahrungen der vergangenen Jahre lernen. Es ist nicht ausgeschlossen, dass der Markt an verfügbarer Hardware erneut unvorhersehbar einbricht und es somit wieder zu massiven Verzögerungen in den Lieferketten oder zu empfindlichen Preiserhöhungen kommt.

 

Digitale Wertschätzung von Daten und Zeit

Das richtige und vor allem sichere Speichern von Daten wird immer wichtiger, da bereits heute 90% aller erarbeiteten Informationen digital gespeichert werden. Durch die aktuelle Entwicklung und zunehmende Digitalisierung der Arbeitswelt wird diese Zahl aller Voraussicht noch weiter steigen. So wird sich das weltweite Datenaufkommen seit dem Jahr 2020 bis 2025 fast auf 181 Zettabyte verdreifachen! Zudem führt die zunehmende Anzahl an Remote-Arbeitsplätzen dafür, dass mehr Festplattenzugriffe auf den Firmenservern stattfinden, wodurch verlässliche Backup-Lösungen wichtiger werden, denn je zuvor.

Steht also keine betriebsbereite und fehlerfreie Backup-Lösung bereit, können schnell einige hundert Arbeitsstunden, wenn nicht sogar Jahre verloren gehen. Wir reden hier also im worst case über ein Arbeitspensum, welches sich mit hoher Wahrscheinlichkeit nicht wieder aufholen lässt. Unter Umständen gehen sogar Daten verloren, zu denen Unternehmen gesetzlich verpflichtet sind, diese für 10 Jahre zu lagern und abrufen zu können. Daher sollten wichtige Daten immer an mehr als einem Ort gespeichert werden, optimalerweise physisch getrennt.

Denken wir also einmal über lokale Backup-Lösungen nach und welche netzwerkstrukturellen Lösungen zur Verfügung stehen.

  • können wir sichergehen, dass im Falle eines Festplattenausfalls der fehlerhafte Datenträger sofort getauscht werden kann?
  • Ist passende Ersatzhardware vorrätig?
  • Liegen die Daten an unterschiedlichen Speicherorten?

Mit anderen Worten: Gibt es ein Konzept bzw. ein Protokoll, wie bei Fehlern im Backup-System zu handeln ist? Denn es gibt eine Vielzahl an Fehlerquellen, auf die man unterschiedlich reagieren muss.

Fehlerquelle

Reaktion

Daten verschwinden oder können nicht mehr geöffnet werden

Die Daten können oft repariert oder wiederhergestellt werden und sollten dann auf einem sicheren Datenträger gespeichert werden.

Lesezugriffe dauern immer länger

Dies muss nicht zwingend mit der Festplatte zu tun haben, kann aber ein Zeichen für fehlerhafte Sektoren sein. Dieses sollte geprüft werden, da fehlerhafte Sektoren oft erste Anzeichen für einen Ausfall sind.

Laute Festplatten

Deuten auf Defekte am Lesekopf oder Motor hin. Die Festplatte sollte dringend getauscht und Daten gesichert werden.

Deaktivierung durch Überhitzung

Prüfung auf Staub, Lüfterfunktionalität und der Umgebungstemperatur.

„Die Inflation macht auch bei den Hardwarepreisen keinen Halt und wird durch weitere Faktoren stark beeinflusst.“

Im Jahr 2021 lag der Preis für eine Festplatte, welche für den 24/7 Serverbetrieb geeignet ist, zwischenzeitlich über 700 EUR und damit bei fast 300% des normalen Bezugspreises.

Preisentwicklung Festplatte

Abb. 1: Preisentwicklung am Beispiel einer 10 TB Festplatte

Diese signifikant höheren Mehrkosten in der Beschaffung zu rechtfertigen, könnte den Einkauf mitunter in Erklärungsnot bringen. Zusätzlich zu diesen Preisspitzen war jedoch auch die kurzfristige Verfügbarkeit nicht immer gegeben. Selbst wenn man bereit gewesen wäre, diese Preise zu zahlen, bedeutete dies noch lange nicht, dass eine Festplatte verfügbar war.

„Daher ist es zu empfehlen, immer Ersatz in dem Umfang vorrätig zu haben, um mindestens 10% des verfügbaren Speichers erneuern zu können.“ – IT-Faustregel

Gemeinsam altern

In komplexen Dateisystemen besteht eine weitere Gefahr im Alter der Datenträger. Wurde das System in vollem Umfang innerhalb eines bestimmten Zeitraums eingerichtet, haben alle Datenträger ungefähr das gleiche Alter und somit ähnliche Laufzeiten. Natürlich entstehen Defekte nicht automatisch nach einer bestimmten Betriebszeit, jedoch steigt die Wahrscheinlichkeit, dass Datenträger aus einer Charge ein ähnliches Verhalten zeigen. Daher ist es nicht unüblich, dass in einem größeren System eine ‚tote‘ Festplatte allein kommt.

Mögliche Fehler und wie man diese erkennt

Baseline Failure Rates

Festplatten, die ihr erstes Jahr überstanden haben, halten zumindest statistisch gesehen mindestens ein weiteres, meist aber 5 bis 10 Jahre. Dennoch ist die Belastung für Festplatten im 24/7 Betrieb enorm. Wie lange eine Festplatte fehlerfrei funktioniert, hängt unter anderem auch von Vibrationen im Raum, Raumtemperatur und Staubvorkommen ab. Hiervon lassen sich einige Faktoren leichter beeinflussen als andere. Aber egal, wie gut die Voraussetzungen sind: ein Datenträger kann jederzeit ausfallen.

CRC Error

Der Cyclic Redundancy Check (zyklische Redundanzprüfung) beschreibt die Prüfung von Daten auf CRC-Fehler und ist ein wichtiges Tool zur Erkennung von Fehlern. Hierbei wird auf ungewollte Veränderung der Daten geprüft. Besonders bei schon länger gespeicherten Daten können diese Fehler darauf hinweisen, dass eine Festplatte in absehbarer Zeit einen Totalausfall erleidet. Diese sollte dann vorzeitig getauscht werden.

Temperatur & Lebensdauer

Festplatten sind stark temperaturabhängig und geben im Dauerbetrieb eine Menge Wärme ab. Deswegen sind Serverräume nicht selten klimatisiert, um die Abwärme der Festplatten zu regulieren. Hier möchte ich einfach einmal dafür sensibilisieren, dass es auch Fremdfaktoren geben kann, welche zu einem Ausfall führen können. Fällt die Klimatisierung unbemerkt aus oder werden die Außentemperaturen so hoch, dass die Radiatoren nicht mehr genügend Wärme abgeben können, werden die Server im besten Fall nach ein paar Stunden wegen Überhitzung herunterfahren. Es kann aber auch zu einer massiven Verkürzung der Lebenszeit oder Ausfällen kommen. Allgemein kann man sagen, dass Computer-Hardware dauerhaft auf Temperaturen über 60°C nicht unbedingt positiv und ab 85°C kritisch reagieren kann, aber auch hier gibt es keine Garantie.

Möglichkeiten, einem Ausfall vorzubeugen

„Festplatte ist nicht gleich Festplatte! Oder logisch betrachtet HD != HD“
Alte Festplattenmodelle haben eine höhere Wahrscheinlichkeit auszufallen und weniger Selbstschutz. Moderne Systeme erkennen Fehler rechtzeitig und können oft schlimmeres vermeiden. Daher kann es sich lohnen, etwas mehr in moderne Systeme zu investieren als später ein Vielfaches in Datenrettung. Aktuelle Festplatten analysieren sich selbst, haben Funktionen, um Fehler selbstständig zu beheben und verfügen über ein abrufbares Monitoring für z.B. Betriebsdauer, Temperaturverlauf, aufgetretene Fehler und vieles mehr. So können Ausfällen und Dateiverlust entgegengewirkt werden, bevor es zu spät ist und Dateien möglicherweise unwiderruflich verloren sind.

Potenzielle Risiken & Sensibilisierung

Aktuelle gibt es einige Faktoren, welche zur nächsten Verknappung führen können.

  • Die politische Lage zwischen China und Taiwan; viele Bauteile, die Halbleiter benötigen, werden in Taiwan gefertigt
  • Die allgemeine Ressourcenknappheit
  • Ausfälle und Einschränkungen auf Handelswegen

Dies sind nicht alle globalen Probleme, welche unvorhersehbar sind und zur nächsten Hardwarekrise führen können. Daher die Empfehlung immer einen Plan für das Backup zu haben, da der Wert der Daten oft nicht ersetzbar ist.

#FORTSCHRITT-Fazit

Insgesamt muss das Management schnell und proaktiv auf einen Hardwaremangel reagieren können, um die Auswirkungen auf das Unternehmen zu minimieren. Wir hoffen, dass Sie bisher noch keine dieser Erfahrungen machen mussten. Durch vorausschauende strategische Planung und ein solides Risikomanagement für Ihre Daten können wir Ihnen dabei helfen, dass Sie und Ihre Mitarbeiter Daten mit einem guten Gefühl ablegen können.

Haupterkenntnis: Hardware bzw. allgemein der Umgang mit Daten betrifft den Kern aller Unternehmensprozesse. Fällt Hardware aus oder verzögert sich deren Ersatz, kann es zu langen, kostspieligen oder gar unternehmensgefährdenden Einschränkungen kommen.

Lessons Learnd: Unternehmen sollten ein allgemeines Bewusstsein für das Thema entwickeln und Mitarbeitende auf allen Ebenen dafür sensibilisieren. Weiterhin sollten sie, falls noch nicht geschehen, einen Datenschutzbeauftragten bestimmen und Hardware systematisch listen/katalogisieren und pflegen. In diesem Zusammenhang besteht eine Kernaufgabe in der Erstellung eines individuellen Konzepts und dem Aufbau einer parallelen Datensicherung an zwei Orten.

Warum #FORTSCHRITT

Wir haben in unserem Team umfangreiche Kompetenz im Bereich IT, IT-Sicherheit und IT-Projektmanagement. Von Bestandsanalysen über Risikobewertungen und strategischer Planung (Konzepterstellung) bis hin zur operativer Projektsteuerung in IT-Projekten kann unser erfahrenes Team den gesamten Prozess abbilden. Sprechen Sie uns gerne auf unsere Referenzprojekte an und vereinbaren Sie ein unverbindliches Gespräch mit unseren Experten.

Jan Paschen
Consultant

Als studierter Informatiker mit jahrelanger Erfahrung im IT-Projektmanagement und Strukturen des öffentlichen Dienstes verfügt er über ein breites Wissen in technologischen und organisatorischen Arbeits- und Anwendungsgebieten. Er hat in der Vergangenheit erfolgreich diverse IT-Projekte geleitet, Software und Frameworks implementiert und die Effizienz sowie Effektivität von Prozessen optimiert. Des Weiteren ist er seit mehr als 15 Jahren im Bereich der digitalen Medien und Social Media tätig. Durch diese Aufgabenfelder entwickelte er ein natürliches und dauerhaftes Interesse an Digitalisierungsprozessen. Für #FORTSCHRITT ist er in den Bereichen IT-Sicherheit und IT-Projektmanagement tätig.

Jan P. Paschen