Die Zuverlässigkeit von USV-Anlagen – wichtiger denn je

Eine Ausfallrate von null gibt es nicht – auf null gesunken ist in der Welt der digitalen Dienste allerdings die Toleranz gegenüber Unterbrechungen.  Selbst wenige Sekunden Ausfallzeit können zu Datenverlusten, Nichtverfügbarkeit von Diensten oder Vertragsstrafen (SLA-Verstöße) führen.
Unternehmens- und Edge-Datenzentren müssen in einer Umgebung, die komplexer und anspruchsvoller denn je ist, eine höchstmögliche Verfügbarkeit von nahezu 100 % gewährleisten.
 

Wesentliche Herausforderungen verlangen nach höchster Zuverlässigkeit

  • KI und HPC erleben einen Boom – Unternehmens-Workloads stellen unvorhersehbare und hohe Anforderungen und belasten die Strominfrastrukturen damit enorm.
  • Cyberangriffe auf kritische Infrastrukturen – böswillige Angriffe können Strom- und Kühlsysteme außer Betrieb setzen oder destabilisieren.
  • Komplexe Hybridarchitekturen – bei Edge-Computing, Multi-Site-Bereitstellungen und Hybrid-Cloud-Modellen muss die Ausfallsicherheit mehrere Ebenen umfassen.
     

Folgen für Datenzentren

  • Redundante Architekturen sind zwingend erforderlich – Tier III/IV-, 2N- oder N+1-Konfigurationen werden zum Standard, um die Kontinuität zu gewährleisten.
  • USV-Anlagen müssen allen Stromanomalien standhalten und eine unterbrechungsfreie Versorgung sicherstellen, und zwar unabhängig von Lastverhalten und Lastdynamik.
  • Wartung ohne Betriebsunterbrechung und proaktive Überwachung – vorausschauende Wartung, Hot-Swap-fähige Module und kontinuierliche Diagnose sind entscheidend, um die Zuverlässigkeit in großem Maßstab aufrechtzuerhalten.

 

In diesem Zusammenhang ist die Zuverlässigkeit modularer USV-Anlagen, die durch hohe MTBF-Werte quantifiziert wird, zu einem entscheidenden Faktor für alle Betreiber geworden, die langfristige Ausfallsicherheit und Verfügbarkeit gewährleisten wollen.

MTBF
Ausfälle minimieren
IN MODULAREN SYSTEMEN
Reliabilität
MAXIMIERUNG DER MTBF
JEDES EINZELNEN MODULS

Was bedeutet MTBF im Zusammenhang mit einer USV?

Die Wahrscheinlichkeit eines kritischen Ausfalls mit Lastverlust ist bei sehr hochwertigen modularen unterbrechungsfreien Stromversorgungen (USV) äußerst gering dank ihrer redundanten Architektur und der Konstruktion ihrer Leistungsmodule, die unabhängig voneinander arbeiten und zur Verhinderung einer Fehlerausbreitung jeden internen Fehler isolieren können.

Dennoch können zufällige Ausfälle einzelner Leistungsmodule auftreten.  Diese haben zwar in der Regel keinen Einfluss auf die Leistung einer hochwertigen modularen USV, beeinträchtigen jedoch die Systemredundanz und müssen verhindert werden, um eine optimale Fehlertoleranz aufrechtzuerhalten.

Das Hauptproblem ist die Zuverlässigkeit des einzelnen Leistungsmoduls – je mehr Module im System verwendet werden, desto höher ist das kumulative Ausfallrisiko. Die interne Ausfallrate der USV steigt mit der Anzahl der Module und sinkt mit der MTBF jedes einzelnen Moduls.

Da die Anzahl der Leistungsmodule durch die Leistungs- und Redundanzanforderungen des Systems bestimmt wird, besteht die einzige Möglichkeit, eine akzeptable Gesamtzuverlässigkeit zu erreichen darin, Leistungsmodule mit einer sehr hohen MTBF bzw. außergewöhnlich niedriger Ausfallrate zu verwenden.

Die MTBF (Mean Time Between Failures) gibt die mittlere Betriebsdauer eines Moduls zwischen Ausfällen an.  Je höher die MTBF, desto geringer die Ausfallrate und desto zuverlässiger das Leistungsmodul.


Bedeutung der MTBF für Datenzentren

Über die typische Lebensdauer einer USV von 15 Jahren verringert eine hohe MTBF die Anzahl der Modulausfälle erheblich. Dies erhöht nicht nur die Zuverlässigkeit des Systems, sondern hat auch erhebliche wirtschaftliche Vorteile und minimiert die Risiken, die mit dem Austausch von Modulen verbunden sind.
Vorteile einer höheren MTBF in der Praxis:

  • Weniger Ausfälle über den gesamten Lebenszyklus.
  • Geringere Betriebskosten dank reduziertem Wartungs- und Austauschbedarf.
  • Verbesserte SLA-Konformität.
  • Höhere Nachhaltigkeit.

Berechnung und Zertifizierung der MTBF

Aufgrund ihrer Schlüsselrolle für die Gewährleistung der Systemzuverlässigkeit wird die MTBF durch eine eingehende Bewertung der Modulkomponenten und Unterbaugruppen unter Anwendung strenger statistischer Methoden berechnet. Dazu kommen eine Reihe gezielter Prüfungen auf mechanische Festigkeit, Haltbarkeit und Langzeitzuverlässigkeit.

Um die Glaubwürdigkeit des MTBF-Werts zu gewährleisten, muss die Zertifizierung durch eine unabhängige Prüfstelle durchgeführt und mit realen Felddaten validiert werden. Dadurch wird bestätigt, dass die prognostizierte MTBF nicht nur einen theoretischen Wert darstellt, sondern auf der tatsächlichen Leistung basiert.
Mit anderen Worten: Zuverlässigkeit ist nicht nur ein Versprechen – sie wird durch unabhängige Prüfungen nachgewiesen und durch Felddaten von vielen Tausenden von Modulen im Praxisbetrieb bestätigt.

Die Lösung von Socomec: MODULYS XM

MODULYS XM ist eine hochmodulare USV, die für absolute Zuverlässigkeit entwickelt wurde. Ihre Leistungsmodule haben eine MTBF von über 1.000.000 Stunden – viermal höher als der Marktstandard. Diese Zahl wurde von einer unabhängigen Prüfstelle nach zweijährigen strengen Prüfungen ermittelt. Eine offizielle Zertifizierung ist auf Anfrage erhältlich.

Nach mehreren Jahren und mit über 50.000 installierten Leistungsmodulen, die insgesamt mehr als 1 Milliarde Betriebsstunden geleistet haben, liegt die gemessene MTBF deutlich über 1.000.000 Stunden und übertrifft damit den ursprünglich berechneten Wert. Ein offizieller Bericht über die gemessene MTBF, der alle sechs Monate aktualisiert wird, ist auf Anfrage erhältlich.
Dieses Ergebnis ist einzigartig in der USV-Branche und kann nur durch die Entwicklung von Leistungsmodulen erreicht werden, bei denen Zuverlässigkeit und nicht Kosten im Vordergrund steht.
Mit MODULYS XM profitieren Datenzentren von folgenden Vorteilen:

  • Fehlertolerante Konstruktion.
  • Hot-Swap-fähige Module für Wartungsarbeiten ohne Betriebsunterbrechung.
  • Skalierbarkeit zur Anpassung an sich wandelnde Anforderungen an Datenzentren.
  • Unabhängige Zertifizierung und regelmäßig aktualisierte Daten zur Zuverlässigkeit in der Praxis.

Modulys XM entdecken
 

Beispiel: MTBF von 1.000.000 Stunden in der Praxis 
 

Nehmen wir Folgendes an:
– Ein System hat 24 USV-Module.
– Jedes Modul hat eine MTBF von 1.000.000 Stunden.
– Erwartete Lebensdauer: 15 Jahre = 131.400 Stunden

Erwartete Ausfälle = (24 × 131.400) ÷ 1.000.000 = ≈3 Module im Lauf von 15 Jahren.
Eine marktübliche modulare USV mit einer MTBF von 250.000 Stunden würde 12 Module benötigen.

Eine hohe MTBF bedeutet entsprechend erhebliche Kosteneinsparungen, weniger Risiken und eine höhere Systemverfügbarkeit.
 

Impact du MTBF sur la durée de vie des modules

Ausführliche Erklärung der MTBF

  • Die berechnete MTBF ergibt sich aus der Analyse der Belastungsfaktoren der einzelnen USV-Komponenten und Teilsysteme sowie den Ergebnissen von Belastungstests.
  • Die gemessene MTBF wird aus Installationen im Feld und kumulierten Betriebsstunden ermittelt.
  • Beide sind unverzichtbar: Berechnete Werte liefern Vorhersagen, während gemessene Daten diese in der Praxis validieren.

Die MTBF sollte grundsätzlich zusammen mit der MTTR (Mean Time to Repair, mittlere Reparaturzeit) betrachtet werden. Eine hohe MTBF senkt die Anzahl der Ausfälle, während eine niedrige MTTR bei einem Ausfall eine schnelle Wiederherstellung sicherstellt. Zusammen bestimmen sie die endgültige Verfügbarkeit eines USV-Systems.
 

Häufig gestellte Fragen: Leistungsmodule, USV-Ausfälle und MTBF

Sind Leistungsmodule immer zuverlässig?

Moderne USV-Leistungsmodule sind vor allem auf Zuverlässigkeit ausgelegt. Im Rahmen der Zertifizierungsprozesse werden die Module von unabhängigen Prüfstellen strengen Temperatur-, Belastungs- und Dauerhaltbarkeitsprüfungen unterzogen. Daten aus der Praxis bestätigen oft sogar noch höhere gemessene MTBF-Werte, was den Betreibern von Datenzentren die Gewissheit gibt, dass die Module über eine lange Lebensdauer hinweg zuverlässig funktionieren werden. Die Zuverlässigkeit wird außerdem durch bestimmte Entscheidungen hinsichtlich der Konstruktion erhöht: Die Trennung der Module isoliert Ausfälle, die Hot-Swap-fähige Auslegung gewährleistet einen schnellen Austausch, und die vorausschauende Wartung hilft, Anomalien frühzeitig zu erkennen. Dadurch sind die Module nicht nur als einzelne Bausteine höchst zuverlässig, sondern tragen auch zu einem hochgradig fehlertoleranten USV-System bei, wenn sie parallel eingesetzt werden. Im Vergleich zu monolithischen USV-Auslegungen verringern modulare Stromversorgungseinheiten das Risiko von Single Points of Failure und erhöhen die Ausfallsicherheit, weshalb sie zunehmend zum Standard für Unternehmens- und Edge-Datenzentren werden.

Wie erkennt man den Ausfall einer USV?

Anzeichen für einen USV-Ausfall können je nach Ursache allmählich oder plötzlich auftreten. Übliche Anzeichen sind häufige Alarme, kürzere Autonomie bei Stromausfällen, ungewöhnliche Geräusche von Lüftern oder Elektronik und sichtbare Veränderungen der Batterien (Aufblähung, Auslaufen). Oft sind auch Leistungsschwankungen wie Spannungsschwankungen oder wiederholte Warnmeldungen in der Überwachungssoftware feststellbar. In fortschrittlichen Systemen liefert die vorausschauende Überwachung Frühwarnungen, indem sie Parameter wie Batterieimpedanz, Kondensatorzustand, Temperatur und Lastverteilung verfolgt. Werden dabei Schwellenwerte überschritten, signalisiert das System ein Ausfallrisiko, sodass vorbeugende Maßnahmen ergriffen werden können. In modularen USV-Architekturen erfolgt die Überwachung auf Modulebene, wodurch sich die Ursache einer Leistungsminderung leichter eingrenzen lässt. Die frühzeitige Erkennung eines drohenden Ausfalls ist entscheidend: Unbeachtete geringfügige Anomalien können zu unerwarteten Ausfällen führen, die die Betriebszeit gefährden. Regelmäßige Inspektionen in Verbindung mit intelligenten Tools zur Überwachung und eine besonders zuverlässige Auslegung sind die wirksamsten Methoden, um die Zuverlässigkeit des Systems aufrechtzuerhalten.

Wie wird die MTBF einer USV berechnet?

Die MTBF einer USV wird anhand einer Kombination aus Modellen zur Zuverlässigkeitsprognose, Belastungsprüfungen durch Prüfstellen und der Validierung von Praxisdaten ermittelt. Beim Reliability Engineering, also der Anwendung von Methoden der Zuverlässigkeitsanalyse und -bewertung, erfolgt die primäre Schätzung durch eine Belastungsanalyse der Komponenten nach Normen wie IEC 61709, SN 29500 oder MIL-HDBK-217F. Die Ausfallrate der einzelnen Komponenten wird aus Referenzdatenbanken abgeleitet und unter Berücksichtigung von Belastungsfaktoren für Temperatur, Spannung und Umgebung angepasst. Diese Ausfallraten der Komponenten werden dann in einem Zuverlässigkeitsblockdiagramm (RBD, Reliability Block Diagram) zusammengefasst, das die gesamte USV-Architektur einschließlich aller redundanten (N+1) Elemente abbildet. Die resultierende Systemausfallrate (λ) liefert die berechnete MTBF = 1 / λ. Diese Modelle werden im Rahmen von Laborprüfungen validiert oder verfeinert. Komponenten oder Module werden erhöhten Belastungsbedingungen (z. B. erhöhte Temperatur, Luftfeuchte, Vibration und zyklische Belastungen) ausgesetzt, um zu bestätigen, dass Alterungsmechanismen wie vorhergesagt ablaufen. Diese Prüfungen stützen die im Zuverlässigkeitsmodell verwendeten Annahmen, dienen jedoch nicht der direkten Bestimmung des MTBF-Werts. Da beschleunigte Prüfungen nicht alle Feldbedingungen abbilden können, werden auch Felddaten von installierten Systemen analysiert. Die tatsächlichen Betriebsstunden und Ausfallzahlen großer Bestände liefern eine gemessene MTBF, die die Leistung in der Praxis widerspiegelt. Wenn eine relevante Basis installierter Systeme vorhanden ist – Tausende von Modulen, die über Millionen oder Milliarden von kumulierten Stunden betrieben werden –, sind die daraus resultierenden Statistiken äußerst zuverlässig. Unabhängige Prüfstellen wie SERMA oder TÜV können die Methodik prüfen und die Datenkonsistenz verifizieren. Dieser duale Ansatz – vorhergesagte MTBF (analytisch) und gemessene MTBF (empirisch) – stellt sicher, dass die angegebene Zuverlässigkeitszahl nachvollziehbar, belastbar und repräsentativ für die tatsächlichen Betriebsumgebungen von Datenzentren ist.

Was gilt als gute MTBF?

Für USV-Leistungsmodule ist eine MTBF von über 1.000.000 Stunden in der Tat außergewöhnlich. Ein solcher Wert weist auf eine extrem niedrige theoretische Ausfallrate hin (λ ≈ 1 × 10⁻⁶ Ausfälle/Stunde), sollte jedoch immer im Rahmen der Annahmen des Zuverlässigkeitsmodells interpretiert werden, d. h. unter Zugrundelegung einer konstanten Ausfallrate, einer nicht stattfindenden Alterung der Komponenten und idealer Installationsbedingungen. Bei marktüblichen modularen USV-Systemen liegt die durchschnittliche MTBF der Leistungsmodule je nach Qualität der Komponenten, Umgebungstemperatur, Lastprofil und Wartung zwischen 200.000 und 300.000 Stunden. Für unternehmenskritische Anwendungen wie Unternehmens- oder Edge-Datenzentren ist entscheidend, USV-Systeme mit der höchsten MTBF auf dem Markt auszuwählen. Eine doppelte Validierung stellt durch eine analytische Vorhersage, die möglicherweise durch unabhängige Audits (z. B. SERMA oder TÜV) zertifiziert ist, sowie eine empirische Bestätigung auf der Grundlage einer statistisch relevanten installierten Basis sicher, dass die angegebene Zuverlässigkeit nachvollziehbar und repräsentativ hinsichtlich der tatsächlichen Bedingungen ist. Letztendlich ist eine „gute MTBF“ keine abstrakte Zahl: Sie unterstützt die Einhaltung SLA-Verpflichtungen am Standort, ermöglicht fehlertolerante Architekturen und minimiert das Risiko und die Gesamtkosten von Ausfallzeiten über den Lebenszyklus der USV.