Die Machbarkeit und die Vorteile der Verwendung von Serverlaufwerken beim Erstellen von RAID-Arrays. Lohnt es sich, diese zu sparen, und wann?

    Auf dem Markt ist eine große Anzahl von Antrieben mit verschiedenen Drehzahlen und verschiedenen Herstellern erhältlich. Nicht jeder weiß genau, welches Laufwerk für welche Aufgabe am besten zu kaufen ist und warum es manchmal besser ist, mehr zu bezahlen und wann Sie sparen können. In diesem Artikel werde ich versuchen, die wichtigsten Punkte zu klären und das Auswahlproblem zu vereinfachen. Der Artikel ist nicht nur für diejenigen nützlich, die einen dedizierten Server kaufen / mieten möchten, sondern auch für diejenigen, die zu Hause ein zuverlässiges Repository mit Informationen erhalten möchten. Nach dem Lesen des Materials wird klar, warum es nicht immer ratsam ist, Desktop-Lösungen in kostengünstigen Rechenzentren zu mieten, und es besser ist, sich für eine zuverlässigere Server-Hardware zu entscheiden.

    Zunächst lassen sich alle auf dem Markt erhältlichen Laufwerke klar in Klassen einteilen:

    - Festplatten für normale Desktops (die in Heim-PCs, Laptops und Desktop-Servern für kostengünstige Rechenzentren verwendet werden);
    - Server-Festplatten mit einer Geschwindigkeit von 7200 U / min (RPM);
    - Enterprise-Festplatten mit einer Geschwindigkeit von 10.000 und 15.000 U / min;
    - Solid State Drives.

    In einem separaten Artikel werden wir uns wahrscheinlich mit den Merkmalen der Auswahl von Solid-State-Laufwerken befassen. Im Moment konzentrieren wir uns jedoch hauptsächlich auf Festplatten und überlegen, welches Laufwerk wo und wann verwendet werden soll.

    Beginnen wir mit normalen PC-Laufwerken. Hierbei handelt es sich um hervorragende Laufwerke mit relativ großer Kapazität und guter Leistung. Der Hauptnachteil besteht jedoch darin, dass sie aufgrund ihrer Konstruktionsmerkmale nicht für die Verwendung in einem RAID-Array ausgelegt sind. Bei diesen Scheiben werden die durch die Drehung der Spindel verursachten Schwingungen praktisch nicht kompensiert. Natürlich sind diese Vibrationen minimal und bei der Verwendung von 1-2 Discs zu Hause kein Problem. Betrachtet man jedoch das Servergehäuse, so kann der Einfluss von Vibrationen bei vielen Festplatten erheblich sein, da gegenseitige Vibrationen auftreten und Resonanzen den Effekt verstärken. Wenn also 12 Festplatten gleichzeitig im Gehäuse installiert sind und sogar sehr leistungsstarke Serverlüfter mit 5.000 bis 9.000 U / min arbeiten, steigt der Vibrationspegel ganz erheblich und damit der Prozentsatz der Fehler und Verluste. was sich negativ auf die Leistung auswirkt. Die Leistung von Desktop-Laufwerken nimmt in diesen Fällen um ein Vielfaches ab, da sie erhebliche Schwierigkeiten beim Positionieren der Köpfe haben und den Überblick verlieren. Dies ist aus dem beliebten Diagramm der Leistung in Abhängigkeit von der Vibrationsbelastung klar ersichtlich:



    Eine andere Sache sind SATA RE (RAID Edition) -Datenträger oder Server-Datenträger mit einer Geschwindigkeit von 7200 U / min. Sie sind weniger vibrationsanfällig und weniger abhängig von ihnen. Wie Sie aus der Grafik ersehen können, ist die Wahrscheinlichkeit von Fehlern aufgrund von Vibrationen um 50% geringer.

    Aber nicht nur Vibrationen sind ein Problem, ein weiteres Hauptproblem aller Antriebe ist die Anzahl der nicht erneuerbaren Fehler. Was bedeutet das in der Praxis?

    Bei SATA-PC-Festplatten beträgt die Anzahl der nicht erneuerbaren Fehler 1 Fehler pro 10 14 Bit oder 1 Fehler pro 12,5 TB Daten. Ein 1-TB-Laufwerk verfügt über 1000 / 12500x10 14 Bit. 5 Festplatten haben eine Kapazität von 5x (1000 / 12500x10 14 ) Bit, und die Wahrscheinlichkeit eines Fehlers, wenn diese Festplatten in einem RAID5-Array arbeiten, beträgt (5x (1000 / 12500x10 10 )) / 10 14x 100% = 40%.

    Wie Sie sehen, ist es einfach unmöglich, 5 PC-Festplatten in RAID5 zu verwenden, da die Wahrscheinlichkeit eines irreparablen Fehlers während der Wiederherstellung sehr hoch ist und die Wiederherstellung eher fehlschlägt. Auf diese Weise erhalten wir ein Array, das im Falle einer Neuerstellung mit Sicherheit fehlschlägt und bei dem die Daten verloren gehen. Früher wusste ich nichts über diese Funktion, und als ich 2008 meinen ersten Server auf PC-Laufwerken baute, baute ich ein RAID5-Array, um Speicherplatz und Geld zu sparen, und weniger als einen Monat später gingen die Daten verloren . Jetzt ist es erstaunlich für mich, dass das Array so lange gelebt hat :)

    Natürlich können Sie zuverlässigere RAID-Levels wie RAID10 oder in extremen Fällen RAID6 verwenden. Bei einer großen Anzahl von Festplatten ist jedoch auch die Wahrscheinlichkeit eines irreparablen Fehlers während der Wiederherstellung relativ hoch.

    Eine andere Sache sind Server-Festplatten mit einer Geschwindigkeit von 7200 Umdrehungen pro Minute (RPM) SATA RE oder Festplatten Near Line (NL) SAS. Die Wahrscheinlichkeit eines irreparablen Fehlers ist für sie bereits aufgrund ihrer technischen Eigenschaften um eine Größenordnung geringer, pro 10 15 Datenbits tritt ein Fehler auf . Wenn Sie jedoch nicht nur eine große Anzahl von Laufwerken, sondern auch Laufwerke mit großem Volumen verwenden, ist dies möglicherweise bereits unzureichend. In solchen Fällen müssen Sie immer noch SAS-Laufwerke der Enterprise-Klasse verwenden, deren Zuverlässigkeitsstufe 1 nicht behebbarer Fehler pro 10 16 beträgt bisschen Daten.

    Es ist auch erwähnenswert, dass bei SATA RE, Near Line (NL) SAS-Festplatten und SAS-Festplatten der Enterprise-Klasse, die effektiv mit einem RAID-Controller interagieren können, die Wahrscheinlichkeit eines irreparablen Fehlers sogar noch geringer ist Berücksichtigung dieser Fähigkeit. Wenn Sie also mit einem geladenen Array arbeiten (Datenbanken, mit denen viele Benutzer gleichzeitig arbeiten, aktives Schreiben und Lesen von Daten), spielen bereits behebbare Fehler eine Rolle, mit denen normale Festplatten ineffizient arbeiten. Sie versuchen, das Problem wiederholt erneut zu lesen. In derselben Western Digital-Version wird der Wert auf 64 Kopfdurchläufe mit unterschiedlichen Parametern für Höhe und Winkel festgelegt. Erst danach verarbeitet der Kopf andere Aufgaben. Aufgrund dessen ist die Wartezeit stark erhöht, Welches RAID nicht toleriert und die Festplatte mit Sicherheit als verloren betrachtet und versucht, die Festplatte wiederherzustellen, wodurch die Belastung des Arrays kritisch wird, da gleichzeitig die Wiederherstellung mit der Arbeitsbelastung einhergeht. Das Ergebnis ist vorhersehbar - der Zusammenbruch des gesamten Arrays.

    Festplatten, die mit RAID arbeiten können, können dem RAID-Controller mitteilen, dass beim Lesen des Datenblocks ein Problem aufgetreten ist, diesen Block von anderen Festplatten anfordern und gleichzeitig andere Anforderungen verarbeiten. Nach dem Empfang des Blocks können Sie ihn an einer anderen Stelle auf der problematischen Festplatte überschreiben. Aufgrund dessen tritt kein Leistungsabfall des RAID-Arrays auf, und die Wahrscheinlichkeit eines Datenverlusts wird erheblich verringert. Es sollte jedoch beachtet werden, dass nicht alle auf Chipsätzen installierten Software-RAID-Controller solche Datenträger "verstehen" können, da es manchmal nicht ausreicht, RE-Datenträger für ein zuverlässiges Array zu haben, Sie aber dennoch einen Hardware-Controller oder eine andere Plattform verwenden müssen, die mit RAID ordnungsgemäß funktioniert.

    Wenn Sie jedoch einen zuverlässigeren Speicher als die Speicherung auf PC-Laufwerken erstellen möchten, können Sie günstigere Datenträger als RE-Datenträger kaufen, z. B. Constellation CS, die ausschließlich für Software-Raids entwickelt wurden und nicht über einen Desktop verfügen (Versuche, mehrmals neu zu lesen) Daten zum Nachteil anderer Aufgaben), obwohl sie natürlich nicht vollständig mit den Controllern interagieren, so dass RAID-Ausfälle nicht vollständig ausgeschlossen sind.

    Unabhängig davon, welches Laufwerk Sie verwenden, sollten Sie sich auch daran erinnern, dass Laufwerke einen Cache von 32, 64 MB oder mehr haben. Was bedeutet das für ein RAID-Array? In Bezug auf die Leistung ist der Cache sowohl für das Lesen als auch für das Schreiben von Vorteil. In Bezug auf die Aufzeichnungszuverlässigkeit ist dies jedoch ein Minus. Bei Verwendung des Caches glaubt der RAID-Controller, dass bereits Daten in das Array geschrieben wurden. In Wirklichkeit kann er sich jedoch nur im Cache befinden und wird später auf die Festplatte geschrieben. Abhängig von der Größe des Arrays nimmt die Größe des allgemeinen Caches zu, und bei 12 Laufwerken beträgt der Cache bereits fast Gigabyte. Was passiert mit den Daten, wenn das Gerät ausgeschaltet wird? Richtig. Sie werden verloren gehen. Und wenn wir über Dateispülungen sprechen, ist das wahrscheinlich nicht so kritisch, aber wenn wir über Datenbanken sprechen, wird es Spaß machen. Daher empfiehlt es sich für Daten von besonderer Kritikalität, wie z Deaktivieren Sie wie Datenbanken weiterhin den Schreibcache. Dies verringert die Festplattenleistung im Datenbankmodus um 8-15%, erhöht jedoch die Zuverlässigkeit erheblich. Aus diesem Grund deaktivieren große Hersteller beim Kauf eines Data Warehouse mit hoher Kapazität den Cache standardmäßig und können ihn nicht aktivieren. Wenn Sie Laufwerke in Servern verwenden, insbesondere in einem kostengünstigen Rechenzentrum, in dem die Stromversorgung des Servers nicht reserviert ist, müssen Sie dieses Risiko berücksichtigen.

    Wir stellen auch eine weitere Schlüsselfunktion von SAS-Festplatten der Enterprise-Klasse fest, auf denen Daten noch zuverlässiger gespeichert werden, da die minimale Clustergröße 520 Bytes beträgt und nicht 512, sondern 8 weitere Bytes für die Parität hinzugefügt werden. Eine große Anzahl von Datenwiederherstellungsalgorithmen wird ohne Controller verwendet. Aus diesem Grund ist das Volumen dieser Festplatten nicht sehr groß.

    Apropos Volumen, es ist eine extreme Empfehlung, wenn Sie die Aufgabe haben, Daten zuverlässig zu speichern, versuchen Sie nicht, größere Datenträger als erforderlich zu verwenden, da die Wiederherstellung im Falle einer Neuerstellung länger dauert. In der Regel analysieren die Controller nicht, wie viel Speicherplatz auf der Festplatte tatsächlich belegt ist, und stellen die gesamte Festplatte als Ganzes wieder her, da der Unterschied in der Wiederherstellungszeit zwischen Laufwerken mit 1 und 6 TB mehr als das Sechsfache beträgt.

    Um es zusammenzufassen. Auf der Grundlage des Vorstehenden ist es klar, dass für ein kleines RAID-Array die Verwendung der teuersten Laufwerke der Enterprise-Klasse nicht kritisch ist und keine Vorteile in Bezug auf die Zuverlässigkeit bietet. Die Verwendung von Server-Festplatten ist jedoch sehr wünschenswert, da bei dieser Option die Wahrscheinlichkeit, dass die Neuerstellung erfolgreich abgeschlossen wird, um eine Größenordnung höher ist. Sie sollten keine größeren Datenträger als erforderlich verwenden, es sei denn, Sie müssen eine höhere IOPS-Leistung bereitstellen (bei einigen größeren Datenträgern kann es aufgrund von mehr Köpfen und Platten zu einem Geschwindigkeitsgewinn kommen). In Fällen, in denen Sie ein großes Volumen und viele Festplatten und gleichzeitig ein ausreichendes Maß an Zuverlässigkeit benötigen, können Sie auf SAS NL blicken, die aufgrund der SAS-Schnittstelle im Wesentlichen eine modifizierte Version von SATA RE-Laufwerken sind. Sie haben jedoch immer noch die gleichen 7200 U / min. Um die Zuverlässigkeit zu erhöhen, wird empfohlen, ein RAID höherer Stufe zu verwenden. Wenn das Volumen des Arrays nicht grundlegend ist und maximale Zuverlässigkeit erforderlich ist, müssen Sie auf jeden Fall SAS 15000 RPM Enterprise verwenden.

    Sie können jetzt einen Server in den Niederlanden auf unserer Switch-Site mieten, indem Sie den Konfigurator unten auf der Seite http://www.ua-hosting.company/servers verwenden oder eine der Specials ändern. Vorschläge:





    Es gibt ein Verständnis dafür, welche Laufwerke und welcher Server besser zu verwenden sind und für welche Aufgaben, wann es besser ist, Laufwerke in RAID zu verwenden und wann getrennt, je nach Beliebtheit Softwaredateien zu verteilen (Balancerskript abhängig von der Last). Warum 4 größere Festplatten in Bezug auf die Zuverlässigkeit besser sind als 12 kleinere, aber schlechter in Bezug auf die Wiederherstellungszeit im Falle einer Wiederherstellung. Nun, das Wichtigste ist, warum unser Angebot für das Serversegment wirklich cool ist und wir den Preis wirklich näher an Desktop-Plattformen gebracht haben, während wir ohne Übertreibung eine um eine Größenordnung höhere Zuverlässigkeit beibehalten haben! Wenn Sie oder Ihre Freunde also einen guten Server benötigen - willkommen, der Verkauf einiger Konfigurationen aus der folgenden Liste ist begrenzt. Bald werden die Preise für diese Konfigurationen höher sein, obwohl wir großzügig, aber nicht unbegrenzt sind :):






    Ja, wenn jemand echte Erfahrung mit der Verwendung dieser oder anderer Laufwerke für bestimmte Aufgaben hat, zögern Sie nicht, diese in den Kommentaren mitzuteilen. Alles ist interessant, bis hin zur Ausfallstatistik. Zu diesem Thema sowie zu den Problemen bei der Auswahl eines SSD-Laufwerks werden wir später versuchen, das Material zu veröffentlichen.

    Jetzt auch beliebt: