Mit den Augen eines Neulings durchbohrt: Wie wir ein Tresorinventarsystem erstellt haben



    Vor kurzem hat uns der Kunde gebeten, ein Plattenkapazitätsabrechnungssystem zu implementieren. Die Aufgabe bestand darin, Informationen von mehr als 70 Festplatten-Arrays verschiedener Hersteller, von SAN-Switches und ESX-Hosts von VMware, zu kombinieren. Anschließend mussten die Daten systematisiert, analysiert und in Dashboards und verschiedenen Berichten angezeigt werden, z. B. auf dem freien und belegten Speicherplatz in allen oder separat erfassten Arrays.

    Wir beschlossen, das Projekt mit dem Operational Performance Analysis System - Splunk - umzusetzen.

    Warum Splunk?


    Splunk visualisiert die gesammelten Daten. Sie können interaktive Berichte - Dashboards - erstellen, die in Echtzeit aktualisiert werden. Daraufhin haben wir Informationen über den gesamten Speicherplatz der Festplatte abgeleitet, alle Arrays gleichzeitig angezeigt und können nach verschiedenen Filtern sortiert werden, beispielsweise nach Kapazität. Wenn Sie auf das Array klicken, erhalten wir sofort Informationen zu allen Verbindungen. In einem separaten Fenster können Sie den Namen der virtuellen Maschine eingeben und sehen, auf welchem ​​ESX-Host sie sich befindet, von welchen Arrays sie Daten und andere Parameter empfängt.

    Meines Erachtens hat Splunk bisher keine Analoga, die mit allen Speichersystemen problemlos funktionieren. Vor einigen Jahren erschien ein kostenpflichtiges CommandCentral-System, das jedoch nicht die erforderliche Flexibilität bietet. Es ist nicht möglich, beliebige Berichte (in den ersten Versionen der Berichte gab es überhaupt keine Berichte) und mit lahmer Visualisierung. Im Allgemeinen dient dieses Tool nicht zur Inventur, sondern zur Überwachung und Kontrolle des Status von Systemen. Um die vom Kunden vorgegebene Aufgabe zu erfüllen, müsste die Verfeinerung lang und teuer sein.

    Gleichzeitig bietet Splunk beeindruckende Anzeigemöglichkeiten: Sie können Grafiken frei miteinander verknüpfen, den Status aller Systeme in einem einzigen Fenster nachverfolgen und somit deren Wartung vereinfachen. Alles andere - für unsere Aufgabe haben wir die kostenlose Version verwendet.



    Was hast du gemacht


    Bis zu diesem Zeitpunkt hatte unser Team keine Erfahrung mit Splunk. Glücklicherweise war das System freundlich und intuitiv, und mit Hilfe regelmäßiger Hilfe oder einer Suchmaschine wurden leicht Lösungen für aufkommende Probleme gefunden.

    Splunk hat eine Reihe von Tools, die wir benötigen. Das System ermöglicht es beispielsweise, Daten aus verschiedenen Quellen für jedes Feld über die sogenannten Lookup'y (Verzeichnisse) zu kombinieren. In einer Tabelle wurden also ESX-Hosts als IP-Adresse und in der anderen als DNS-Namen angezeigt. Zunächst wollten wir ein hausgemachtes Lookup erstellen und mit dem Dienstprogramm nslookup DNS-Einträge auswählen und die Tabellen sammeln. Es stellte sich jedoch heraus, dass Splunk über ein Verzeichnis verfügt, in dem DNS über IP und umgekehrt abgelegt wird. Dieses integrierte Lookup muss nicht konfiguriert werden. Es extrahiert selbst Daten zu DNS-Servern aus den Systemeinstellungen. Dabei spielt es keine Rolle, ob es sich um Windows oder Linux handelt, und Daten zu DNS-Einträgen sind immer auf dem neuesten Stand.



    Eines der interessantesten Szenarien, die mit Splunk implementiert werden, ist die Änderungskontrolle (RFC) im System. Ein RFC-Manager empfängt beispielsweise eine Serviceanfrage von einem der SAN-Switches von einem Techniker. Er gibt den Namen des Switches in Splunk ein und sieht, welche Speicher mit ihm verbunden sind und welche Server Daten von diesen Speichern erhalten. Gleichzeitig sieht der Manager den Arbeitsplan, den der Ingenieur geschrieben hat, und kann einschätzen, wie das Deaktivieren dieses Switches während der Wartung die Leistung der Arrays und Server beeinflusst.

    Wir richten täglich einen Download für Splunk ein, um Informationen zum Verbinden aller Switches und Arrays zu erhalten. Der Kunde ist mit dieser Aktualisierungsrate zufrieden. Er hatte bereits ein Überwachungstool Stor2RRD, aber er kann Daten aus verschiedenen Quellen nicht kombinieren und visualisieren. Deshalb richten wir das Splunk-Datenerfassungssystem wie folgt ein:

    1. Wir erhalten von Stor2RRD Informationen über die Lagerung.
    2. Von Switches erhalten wir Informationen zu SAN.
    3. Über vCenter erfassen wir Daten von ESX-Hosts mithilfe von PowerCLI-Skripts.

    Die empfangenen Daten werden automatisch in ein einziges Formular gebracht, verarbeitet und in Form notwendiger Berichte angezeigt.

    Was musste kämpfen?


    Splunk ist ein leistungsfähiges System, aber es gibt Aufgaben, die nicht sofort gelöst werden können, und für die Lösung einiger Probleme sind fundierte Kenntnisse von VMware erforderlich.



    Beispielsweise verwendet ein Kunde virtuelle Maschinen und direkt zugewiesene RDM-Festplatten sowie gewöhnliche virtuelle Datenspeicher. Diese beiden Arten von Datenträgern müssen unterschiedlich funktionieren. Zuerst haben wir das Problem selbst gelöst, aber dann hatten wir eine Situation, in der die virtuelle Maschine sowohl RAW-Festplatten als auch virtuelle Festplatten erhielt. Es stellte sich heraus, dass wir im Bericht von vCenter das falsche Pfadfeld und die falsche Verknüpfung zum Festplatten-Array der RAW-Festplatte erhalten haben. Die Schaltung arbeitet mit regulären Datastores, aber nicht mit RAW-Platten. Für diese müssen Sie die Eigenschaft der Datenträger-RAW-Datenträger-ID verwenden, die das Vorzeichen des Datenträgers enthält. Ich musste mich an VMware-Spezialisten wenden, die das Skript so umgestalteten, dass es das korrekte Array mithilfe der RAW-Festplatten-ID berechnet.

    Wir haben auch nicht sofort gelernt, wie man mit PowerCLI-Skripten optimal arbeitet. Später mussten wir die Algorithmen verfeinern. Anfänglich verarbeiteten Skripte Daten von mehreren tausend virtuellen Maschinen für bis zu drei Stunden! Nach der Fertigstellung wurde die Dauer der Skripte auf vierzig Minuten reduziert.

    Was ist das ergebnis


    Da wir keine Erfahrung mit Splunk haben, haben wir schnell ein darauf basierendes Plattenkapazitätsabrechnungssystem implementiert, das Informationen aus zahlreichen Quellen erhält, diese konsolidiert und eine breite Palette an komfortablen und visuellen Grafiken liefert. Wenn Sie noch nie ein solches System auswählen oder erstellen mussten, ist Splunk ein guter Kandidat für diese Rolle. Sie ist schnell, einfach und flexibel konfigurierbar und erfordert kein Fachwissen, um die meisten Aufgaben zu lösen.

    Vladislav Semenov, Leiter der Gruppe Systemarchitektur, Jet Info Systems Design Center

    Jetzt auch beliebt: