Über das Brennen im Betrieb des Rechenzentrums

    Wir haben genau die Hälfte des Kurses „Management der Engineering-Infrastruktur des Rechenzentrums“ absolviert . So kam es vor, dass bei fast jedem Seminar bestimmte Themen angesprochen wurden - egal, wir erzählten unseren Zuhörern, wie sie das Rechenzentrum für den Sommer vorbereiten, mit Auftragnehmern zusammenarbeiten oder unseren eigenen Betriebsservice aufbauen. Wir haben beschlossen, einen kleinen Leitfaden zu den dringendsten Themen und Empfehlungen aus unserer Erfahrung zusammenzustellen.



    Gerätekennzeichnung


    Dieses Thema ist der Rekordhalter für Erwähnungen in unseren Seminaren. Über die Kennzeichnung müssen Sie Folgendes wissen:

    1. Das Markierungssystem wird in der Entwurfsphase des Rechenzentrums oder Servers mit dem Betriebsservice durchdacht und abgestimmt. Wenn Konstrukteure und Bauherren ein für den Wartungsdienst unverständliches Kennzeichnungsprinzip haben, müssen die Ingenieure dieses gesamte Erbe entziffern oder alles in einem für sie verständlichen Koordinatensystem erneut markieren.

    2. Alle Elemente aller Systeme müssen markiert sein. Nicht nur die Klimaanlage, der Kühler und die USV müssen eine eigene Nummer haben, sondern auch jede Maschine, jedes Ventil und jede Videokamera. Oft bleiben Kabelstrecken, Frequenzweichen ohne Kennzeichen. Achten Sie besonders auf „Notunterkünfte“ - diese müssen auch gekennzeichnet sein.

    3. Das Prinzip der Kennzeichnung sollte für jeden Ingenieur transparent und verständlich sein. Beispielsweise kann die erste Ziffer in der Chiffre ein Rechenzentrum angeben, die zweite eine Halle, die dritte eine Reihe und die vierte eine Racknummer. Dann stellt sich heraus, dass sich das Rack 5H3C030 im Rechenzentrum 5 im Maschinenraum H3 in Reihe C unter der Nummer 030 befindet.

      Für Schalttafeln kann das Prinzip wie folgt lauten: Art der Schalttafel, Halle, Balken, Nummer der Schalttafel. Dann wird der Ingenieur verstehen, dass Щ2.2.1 die Schalttafel Nummer 1 ist, die vom zweiten Strahl in der zweiten Halle gespeist wird.

    4. Die Markierung muss sichtbar und lesbar sein, damit der Techniker die Ausrüstung leicht identifizieren kann. Verwenden Sie für mehr Klarheit Farbe. Hier wird zum Beispiel die „Farbdifferenzierung von Hosen“ verwendet, um die Versorgungsbalken und -rohre des Kälteversorgungssystems zu kennzeichnen.

    5. Die Beschriftung muss aktuell sein. Wenn das Gerät in einen anderen Raum verlegt wird, ändert sich die Anordnung. Vergessen Sie nicht, all dies in der Markierung wiederzugeben.


    Kennzeichnung von Rohrleitungen für den Wasserkreislauf der Kälteversorgung NORD-4. Jedes Rohr ist mit einer Nummer, Durchflussrichtung und Wassertemperatur (warm oder kalt) gekennzeichnet.

    Überwachung


    Ein Rechenzentrum oder Serverraum jeder Größe ist ohne ein Überwachungssystem nur schwer zu betreiben und zu warten. Keine Überwachung - keine Informationen, dh das Rechenzentrum oder der Server müssen blind verwaltet werden.

    Unsere Empfehlung für das Gentlemen's Monitoring Kit lautet wie folgt. Track:

    1. Status der technischen Ausrüstung (ein, aus, wenn Fehler vorliegen): Eingaben aus der Stadt, Dieselaggregat, USV, Batterieladezustand, Batterielebensdauer an der USV, Kraftstoffstand am Dieselaggregat.

    2. Die in Ihrem SLA angezeigten Indikatoren sind: Temperatur, Luftfeuchtigkeit in den Klimaanlagen, Spannung und Ströme für die USV.

    Wenn das Mindestprogramm abgeschlossen ist, können Sie optional Folgendes hinzufügen:

    • eigenständige Leckagesensoren unter Rohrleitungselementen;
    • autonome Temperatursensoren in Maschinenräumen;
    • Stromanalysatoren in Schalttafeln;
    • Pyrometer in Umspannwerken.

    In der 80. Überwachungsstufe wird bereits der Betrieb von Elementen innerhalb der Ausrüstung überwacht. Zum Beispiel: Mit welcher Drehzahl dreht sich der Lüfter des Außengeräts, welcher Druck herrscht im Freon-System oder wie viel Prozent ist der Kompressor in der Kältemaschine aktuell belastet? Dies wird in Zukunft dazu beitragen, zu verstehen, ob für die Ausrüstung eine Reserve vorhanden ist (funktioniert sie nicht bei 100% ihrer Kapazität), ein potenzielles Problem zu verfolgen und den Betrieb von Systemen unter verschiedenen Bedingungen zu analysieren.

    Eine Vielzahl von überwachten Parametern ist noch kein Indikator für die Qualität der Überwachungsarbeit. Alles muss auch richtig konfiguriert sein. Hier sind die grundlegenden Bündnisse:

    1. Stellen Sie unterschiedliche Abfragezeiten für verschiedene Systeme ein. Eine Minute reicht für die Klimatisierung und eine Minute ist für die Energieversorgung zu selten. Während dieser Zeit kann der Strahl abfallen, das Umschalten auf die Batterie funktioniert möglicherweise nicht und der Dieselmotor startet nicht. Aus diesem Grund entfernen wir so oft wie möglich Daten aus den Stromversorgungsanlagen. Wir erhalten zum Beispiel jede Sekunde Messwerte.

    2. Visualisieren Sie die Hauptüberwachungsanzeigen auf den Bildschirmen, damit Sie immer im Blick sind. Es ist einfacher, Informationen aus Diagrammen und Grafiken zu extrahieren als aus Tabellen mit Zahlen. Überlasten Sie den Bildschirm jedoch nicht, da sonst die Sichtbarkeit verloren geht.

    3. Notieren Sie sich die kritischen Werte, nach denen Warnungen ausgelöst werden. Es ist besser, zwei Warnstufen bereitzustellen - Warnung (Warnung) und kritische Fehler (Alarm).

    4. Halten Sie Ihre Daten auf dem neuesten Stand. Auf dem Bildschirm für Warnungen sollte nicht "abgelaufene" Alarme hängen. Eine solche Situation kann eintreten, wenn im Überwachungssystem eine Warnung vor einem Unfall ausgelöst wird. Vergessen Sie nach dem Auslösen des Unfalls nicht, den Status des Unfalls in „In Arbeit“ zu ändern. So geht der neue Alarm bei den alten nicht verloren. Bei Bedarf können Sie E-Mail- und SMS-Warnungen für Warnungen und Alarme konfigurieren.


    Die schematische Darstellung des NORD-3-Rechenzentrums im Überwachungssystem ermöglicht eine schnelle Beurteilung des Zustands des Energiezentrums und der Temperatur in den kalten Korridoren des Maschinenraums.


    Im Kontroll- und Überwachungszentrum überwachen diensthabende Ingenieure die Arbeit von NORD-3.

    Dies ist völlig optional, aber da wir ein kommerzielles Rechenzentrum sind, haben wir für unsere Kunden konfiguriert, dass alle Hauptindikatoren an das persönliche Konto und die mobile DL Monitor-Anwendung gesendet werden.

    Statistikerfassung


    Alle Parameter müssen nicht nur in Echtzeit beobachtet, sondern auch statistisch erfasst werden. In Zukunft wird dies helfen, das Verhalten der Geräte während des Lebenszyklus besser zu verstehen, wie oft Reparaturen erforderlich sind und ob ein Leistungsspielraum besteht. Auf diese Weise können Sie die Häufigkeit der Wartung planen, die erforderliche Anzahl von Ersatzteilen schätzen und ein Budget für den Kauf und die Wartung von Geräten aufstellen .

    Wie funktioniert es Beispielsweise verfügen wir über Langzeitstatistiken zur Klimatisierung und über Informationen zu den Wetterbedingungen (an jedem unserer Standorte ist eine Wetterstation in Betrieb). Wir können nachvollziehen, wie das Kühlsystem im letzten Sommer bei +32 ° C funktioniert hat. Wenn ein heißer Sommer erwartet wird, können wir abschätzen, ob das Kühlsystem über eine Leistungsreserve verfügt oder ob es irgendwie verstärkt werden muss. Auch aus der Geschichte der Pannen und Reparaturen können wir vorhersagen, welche Ersatzteile am wahrscheinlichsten benötigt werden.

    Um solche Statistiken zu führen, sind keine speziellen Programme erforderlich. Einziger Rat: Es ist bequemer, mit einem Überwachungssystem zu arbeiten, das Grafiken erstellen kann. Wenn die Informationen nicht in Form von Diagrammen angezeigt werden (z. B. der Inhalt von Vorfällen, Reparaturen, Unfällen und Wartungen), können Sie Daten in regulärem Excel eingeben.

    So könnte die Übersichtstabelle für die DGU aussehen. Stellen Sie aktive Links zu Informationen über den Vertrag, den Garantieservice, den Wartungsplan, Reparaturen, Teststarts und Anweisungen bereit, und alle Informationen zu einem bestimmten Dieselgenerator sind immer verfügbar.



    Ersatzteile und Verbrauchsmaterialien


    Ersatzteile und Verbrauchsmaterialien sollten immer zur Hand sein. Wenn es möglich ist, sie in der Nähe des Servers zu speichern, ist dies ideal. Wenn der Platz für das Lager eng ist, können Sie den Auftragnehmer auf Anfrage mit der Lagerung und Bereitstellung von Ersatzteilen beauftragen.

    Was Sie an Ersatzteilen und Verbrauchsmaterialien für dringende Reparaturen vorrätig haben müssen:

    • für Freon-Klimaanlagen - Öl und Freon, Lüfter für externe Einheiten (ja, wir haben es Verbrauchsmaterial, da es mehr als 1000 davon gibt);
    • zur Stromversorgung - Automaten, Sicherungen, Kabel verschiedener Typen;
    • zur Überwachung - Sensoren;
    • für Sicherheitssysteme - mehrere Sätze von Zugangskontrollsystemen (Controller, Leser, Magnetverschluss).
    • für die Telekommunikationsinfrastruktur - Switches, Leitungskarten, Chassis, Router.

    Langlebige Ersatzteile (Kompressoren, Steuerungen, Hauptschalter der Hauptschalttafel) sollten verfügbar sein, damit das Rechenzentrum nicht ohne die notwendige Reserve bleibt.


    Lagerersatzteile für Klimaanlage.

    Rack-Montage


    Wir hatten eine separate Lektion über die korrekte Installation der Ausrüstung , aber wir erinnern uns bei fast jedem Seminar an häufige Fehler. Warum? Alles ist einfach. Ein nicht ordnungsgemäß installierter Server im Rack kann auch in einem gut konzipierten Rechenzentrum mit einem kompetenten Betriebsservice zu lokalen Problemen führen.

    Hier sind die Hauptfehler:

    1. IT-Geräte mit zwei Netzteilen sind an eine PDU angeschlossen.
    2. Geräte mit einer Stromversorgung werden ohne automatischen Umschalter angeschlossen.
    3. Das Gerät ist an benachbarte Racks angeschlossen.
    4. Überladene PDU-Abschnitte.
    5. Das Gerät wird „frontal“ in einem heißen Korridor installiert.
    6. Es gibt keine Stecker, die die Übertragung von Streuwärme in freien Einheiten verhindern.


    Das richtige Verbindungsschema für Server mit einem und zwei Netzteilen.

    Damit ist unsere Hitparade der brennenden Themen für den Instandhalter abgeschlossen. Teilen Sie Ihre Beobachtungen in den Kommentaren mit, stellen Sie Fragen. Im nächsten Seminar werden wir darüber sprechen, wie die Engineering-Systeme des Rechenzentrums getestet und ein Überwachungssystem aufgebaut werden kann.

    Weitere Artikel zum Design und Betrieb von Rechenzentren:

    " Wie das NORD-4-Rechenzentrum-Kühlsystem entstanden ist
    " Fehler im Design des Rechenzentrums, die nur in der Betriebsphase auftreten
    » Der Stromweg im Rechenzentrum
    » Rundgang durch das größte Rechenzentrum Zentrum in Russland

    Jetzt auch beliebt: