Monster nach den Ferien: AMD Threadripper 2990WX 32-Core und 2950X 16-Core (Teil 4)

Published on September 04, 2018

Monster nach den Ferien: AMD Threadripper 2990WX 32-Core und 2950X 16-Core (Teil 4)

Ursprünglicher Autor: Ian Cutress
  • Übersetzung
Teil 1Teil 2Teil 3Teil 4 → Teil 5

Stromverbrauch, TDP und Prime95 im Vergleich zu POV-Ray


Für die meisten von uns liegt die Prozessorleistung auf Laptops bei etwa 15 Watt und auf Desktop-Systemen bei 65 bis 95 Watt. Hochleistungs-Desktop-Prozessoren waren schon immer unersättlicher, und daher ist eine TDP von 130 W und 140 W für sie eine normale Zahl. Als AMD auf der alten Vishera-Plattform einen 220-Watt-Prozessor herausbrachte, der die Bulldozer-Familie auf 5,0 GHz übertaktete, kam der Gedanke auf, ob AMD völlig verrückt sei: Viele Motherboards waren mit einem AMD-Sockel kompatibel, verwendeten jedoch eine TDP von 220 W und höher Ich musste einige neue Motherboards herausbringen. Heute hat der leistungsstärkste Intel-Prozessor auf dem Markt eine offizielle TDP von 205 Watt, AMD ging jedoch noch einen Schritt weiter und legte die Messlatte auf 250 Watt.



Zwei neue WX-Prozessoren mit 32 Kernen, 2990WX und 2970WX, sind für 250 Watt ausgelegt. In beiden Prozessoren sind alle vier Silikonmatrizen aktiv, es gibt sechs aktive Infinity Fabric-Linien. Diese Prozessoren sollen ein neues Leistungsniveau erreichen, während AMD Folien mit einer Turbofrequenz auf allen 3,6-GHz-Kernen demonstriert. Zwei Prozessoren, die die X-Serie ablösten, haben eine Leistung von 180 W, ebenso wie die Threadripper-Prozessoren der ersten Generation.

Es sind jedoch nicht alle TDP gleich. Die Art und Weise, wie Intel und AMD die TDP messen, hat sich im Laufe der Jahre geändert und ist mittlerweile weit von der Realität entfernt. Lass es mich erklären.

TDP ist so ein Witz


Die TDP (Thermal Design Power) gibt keinen Hinweis auf den Energieverbrauch. Technisch gesehen ist dies ein Indikator für die Leistung des Kühlers, was bedeutet, dass der Kühler den gleichen TDP-Wert aufweisen muss, um mit seiner Arbeit fertig zu werden. Der tatsächliche Stromverbrauch sollte etwas höher sein - die Wärmeübertragung vom Prozessor zum Sockel und vom Sockel zum Motherboard trägt zur Kühlung bei, ist jedoch nicht im TDP enthalten. Häufig werden die Wärmeabgaberate und der Stromverbrauch des Prozessors von TDP als eine Sache angesehen, da ihre Unterschiede unerheblich sind.

Beginnen wir die Berechnung mit AMD-Prozessoren. Die AMD-TDP-Berechnung basiert auf einer einfachen Formel:

TDP = (Betriebstemperatur in Celsius - Leerlauftemperatur in Celsius) / Wärmeleistung des Kühlers

Wenn AMD die TDP seines Ryzen 7 2700X-Prozessors mit einer Lasttemperatur von etwa 62 ° C, einer Leerlauftemperatur von 42 ° C und einem Kühler mit einer Wärmekapazität von 0,189 C pro Watt (Wraith Max) ermittelt, erhalten wir einen Wert von etwa 105 W.

Die AMD-Formel hat gleich zwei Probleme: Erstens kann die Temperatur des geladenen Prozessors über einen Kühler oder einen externen Luftstrom eingestellt werden, und zweitens wird das Ergebnis stark von der Wärmekapazität des Kühlers beeinflusst. Mit einem großen Flüssigkeitskühler mit einer höheren Wärmeleistung von beispielsweise 0,400 C pro Watt ist die nominelle TDP eines Prozessors geringer: Beim Ryzen 7 2700X beträgt die TDP nur 50 Watt. Die TDP-Bewertung und der Stromverbrauch sind nicht gleich und ihr Verhältnis kann sich in jede Richtung ändern, sobald AMD einen anderen Kühler für Vergleiche auswählt.

Die TDP-Version von Intel ist etwas komplizierter, aber macht dieser Indikator Sinn ... Intel ermittelt die TDP seiner Prozessoren nur für die Basisfrequenz, ohne die Turbofrequenzen zu berücksichtigen. Wenn Intel einen Prozessor mit einer TDP von 95 W, einer Grundfrequenz von 3,2 GHz, einem Single-Core-Turbo von 4,7 GHz und einem vollen Turbo von 4,2 GHz auf den Markt bringt, liegt der garantierte Stromverbrauch von 95 W bei einer Grundfrequenz von 3,2 GHz. Auf jedem Motherboard, das einen Turbo verwendet (das heißt im Allgemeinen auf jedem), verbraucht der Prozessor bei jeder Last mehr Strom als seine offizielle TDP.

Und das ist sehr ärgerlich. Der Marketing-Schritt von Intel besteht darin, einen Single-Core-Turbo seiner Prozessoren zu bewerben und keine niedrigeren Werte für einen „All-Core“ -Turbo zu veröffentlichen. Uns wird gesagt, dass dies „Insiderinformationen eines Unternehmens“ sind, die unter eine Geheimhaltungsvereinbarung fallen. In jedem Fall verbraucht jeder Prozessor, dessen "All-Core" -Turbofrequenz über der Basisfrequenz liegt, mehr als die angegebene TDP.

Ein gutes Beispiel ist der Core i7-8700 mit 65 W TDP. Es hat eine Grundfrequenz von 3,2 GHz, einen Single-Core-Turbo mit 4,6 GHz und einen vollen Turbo mit 4,3 GHz. Wenn wir mehr Ströme laden und den Energieverbrauch auf 65 W begrenzen, erhalten wir Folgendes:



Lohnt es sich wirklich, die TDP-Werte ernst zu nehmen? Behandle sie mit Humor.

Leistungsaufnahme


Es gibt verschiedene Möglichkeiten, den Stromverbrauch eines Prozessors zu messen. Am einfachsten ist es, ein Messgerät zu verwenden, mit dem Sie den Stromverbrauch des gesamten Systems einschließlich der Verluste im Stromversorgungssystem des Motherboards ermitteln können. Die komplizierte Methode besteht darin, die erforderlichen Werkzeuge an die Platine anzuschließen, um den Strom über einen 12-Volt-Anschluss zu messen. Dabei wird die Spannung des Prozessors mithilfe der Übertaktungseinstellungen einiger Motherboards gemessen. Die dritte Möglichkeit besteht darin, die Hardwareregister mit der entsprechenden Software zu lesen.

Register lesen ist ein zweischneidiges Schwert. Erstens verlassen Sie sich auf interne Messungen, die häufig eine relativ große Fehlerquote aufweisen. Zweitens verlassen Sie sich auf den Prozessorhersteller, der genaue Daten zu Ihrem Prozessor bereitstellen muss. Dies ist nicht immer sinnvoll (!). Ein positiver Punkt: Es ist möglich, mehr Informationen vom Prozessor zu erhalten, z. B. Leistungsanalyse für jeden Kern, DRAM-Leistung, IO / Interconnect-Leistung, integrierte Grafikleistung, um ein allgemeines Verständnis der Leistungsverteilung zu erlangen.

Hardwareregister sind die Art und Weise, wie das System die Daten über die Arbeit an sich selbst meldet: wie viel Energie es verbraucht, wie es die Spannung / Frequenz in Abhängigkeit von Strom, Leistung oder thermischer Leistung regeln sollte. Eine weitere positive Seite ist die einfache Verwendung solcher Daten in Testskripten.

Energietests werden oft kontrovers diskutiert. In der Regel wird ein spezialisierter Virus verwendet, der jeden Bereich des Prozessors gleichzeitig mit maximaler Leistung laden kann. "Power Virus" wird verwendet, um die Stabilität der Beschleunigung zu überprüfen, hat jedoch einen Nachteil: Bei täglicher Belastung spiegeln die Ergebnisse in der Regel nicht den tatsächlichen Stromverbrauch wider. Dies ist eine feine Linie zwischen echten Tests und synthetischem Teig, der so konstruiert ist, dass jeder Energiestoß durch den Chip geleitet wird. Software wie LINPACK wird häufig als Effektivleistungstest verwendet. Mithilfe der internen Tools von Intel und AMD kann der Chip noch mehr geladen werden.

Prime95 ist ein beliebtes Tool, es ist perfekt für fast jeden Kern optimiert und verwaltet die Stromversorgung. Seine Arbeitslast ist halbsynthetisch und basiert auf der Berechnung von Primzahlen. Der Stresstest ignoriert die Ergebnisse und konzentriert sich nur auf den Energieverbrauch. Während dieses Tests haben wir ein wenig mit POV-Ray als Leistungstest gespielt: Es liefert einen noch höheren Stromverbrauch als Prime95 und nutzt auch den tatsächlichen Bedarf an Raytracing. Schreiben Sie mir eine Bewertung, denn ich entscheide, welches Tool für Stromverbrauchstests am besten geeignet ist. Prime95 hat Probleme bei der Arbeit mit einer großen Anzahl von Kernen (manchmal ist es schwierig, ein Testergebnis zu erhalten, wenn die 25 Threads überschritten werden). Um POV-Ray zum Laufen zu bringen, müssen wir seine Lademethoden anpassen. Schließlich geht es mehr um die Überprüfung der Kernel-Last, nicht um Threads. Wir erwarten jedoch Ergebnisse, die von der Anzahl der Threads abhängen. Es zeigt an, welche Software in den einzelnen Testphasen verwendet wurde (wir konnten unsere Version von POV-Ray erst in der Mitte des Tests vorbereiten, sodass die meisten Daten von Prime95 stammen).

Gesamtstromverbrauch


Als erstes möchte ich den Gesamtstromverbrauch des Prozessors darstellen, gemessen in verschiedenen Situationen. Im Leerlauf:



Dann laden wir mit Prime95 nur einen Kern mit zwei Threads. Unsere Testmethode bewirkt, dass beide Threads auf demselben Kern ausgeführt werden, falls die Prozessorkerne mehrere Threads verarbeiten können. Benutzer, die sich auf Einzelaufgaben konzentrieren, werden den Stromverbrauch in diesem bestimmten Bereich bemerken. Dies gilt auch für Systeme, auf denen Windows ständig im Hintergrund ist.



Der dritte Test ist ein System, das mit Prime95 mit vier Threads geladen wurde. Dies ist genau die Bandbreite der Workloads, die die meisten Benutzer täglich in ihren Systemen verwenden: Es werden mehrere Browser-Registerkarten, ein paar Fenster, mehrere Softwarepakete und ein oder mehrere Spiele ausgeführt.



Indem wir die Prozessorlast auf zwölf Threads erhöhen (mit Prime95), wenden wir uns an Benutzer, die große und multitaskingfähige Workloads verwenden. Dies sind Spieler - Streamer oder Benutzer, die mit dem Rendern beginnen und gleichzeitig mit anderen Aufgaben arbeiten.



Das endgültige Diagramm zeigt den Gesamtstromverbrauch. Für diesen Test führen wir die maximale Anzahl von Streams aus (Prime95), in Zukunft planen wir, POV-Ray für diesen Test zu verwenden, da es sich bei einer hohen Anzahl von Streams viel besser zeigt. Der einzige Nachteil dieses Tests ist, dass der übertaktete 2990WX den POV-Ray-Test in weniger als 20 Sekunden durchführen kann.



Stromverbrauch eines einzelnen Kerns


Bevor ich den POV-Ray-Stromverbrauchstest erstellt habe, habe ich beide neuen Threadripper-Prozessoren im Prime95-Test in der All-Thread-Version gestartet. Ich habe den Stromverbrauch jedes Kerns bei jeder Last ermittelt.



Beim Laden des ersten Kerns sehen wir, dass sein Stromverbrauch ~ 23 Watt beträgt. Dies ist viel im Vergleich zu Zeppelin-Kernen. Dies gilt auch für den Fall, dass zwei Kerne geladen sind. Nach dem Laden von drei Kernen stellen wir einen Rückgang des Verbrauchs auf 18,8 W pro Kern fest. Wenn man bedenkt, dass dieser Chip vier CCXs hat, stellt sich die Frage, ob dieses Ergebnis mit der Tatsache zusammenhängt, dass die Threads in denselben CCX geladen werden (was anscheinend passieren sollte) und wir die Leistungsgrenze von CCX erreichen. Beim Laden von vier Kernen beträgt der Verbrauch jedes Kerns etwa 17,4 Watt.

Wenn wir die Anzahl der geladenen Kerne auf fünf erhöhen, stellen wir fest, dass der fünfte Kern bei 18,2 Watt und die verbleibenden vier bei 16,8 Watt arbeiten. Das Ergebnis zeigt an, dass sich dieser fünfte Kern auf dem neuen CCX befindet. Beim Übergang von acht auf neun Kerne sehen wir dasselbe: Der neunte Kern verbraucht 17,5 Watt, während die anderen acht etwa 14,3 Watt verbrauchen. Am Ende der Leistungsverteilung sinkt die Leistung auf 7-9 Watt pro Kern, wenn wir alle 16 Kerne verwenden.

Der Gesamtstromverbrauch des Prozessors beträgt ~ 178 W, etwa 180 W TDP mit einem Verbrauch von ~ 135 W für die Kerne und der Rest für Uncore (Hardware außerhalb des Kerns - Infinity Fabric, IO, IMC).

Was die Testergebnisse des 2990WX betrifft, sieht das resultierende Bild sehr, sehr seltsam aus.



Der Stromverbrauch von bis zu 15 Kernen entspricht größtenteils dem des 2950X. Mit zunehmender Strömung wird jedoch deutlich, dass die erste Schicht der Matrix eindeutig vorzuziehen ist. Wenn Sie zusätzliche Streams laden und die zweite Matrix anschließen, fällt die Leistung der Kerne mit bis zu 2,4 W pro Kern deutlich geringer aus. Die erste Zeppelinschicht verbraucht bei Volllast ca. 6,6 Watt pro Kern, die restlichen Prozessorkerne ca. 2,4 Watt. Es passiert etwas, wodurch die erste Matrix im Vergleich zu den anderen der Ernährung Priorität einräumt. Es ist anzumerken, dass der Energieverbrauch des Chips etwa 180 Watt und nicht 250 Watt beträgt, wie seine TDP zeigt.

Um diese Zeit haben wir das POV-Ray Power Test Script fertiggestellt. Ich habe es auf 2990WX versucht, ich gebe die Ergebnisse. Und jetzt sind sie viel höher als erwartet:



Überraschenderweise wurde die Last mit zunehmender Anzahl der Threads sehr gleichmäßig verteilt. Wir konnten sogar alle 250 Watt TDP mit Aktienoptionen und einem guten Kühler voll ausnutzen. Nachdem die Prozesse vollständig geladen waren, verbrauchten die anderen Komponenten 193 W Kerne, 55 W. Unter keinen Umständen haben wir ein "Absacken" der aktiven Kerne unter 3 W beobachtet. Wenn alle Kerne geladen waren, verbrauchte jeder Kern seine „komfortablen“ 6 Watt. Wir haben eine Prozessorleistung von 240-250 W bei einer Belastung von ca. 40 Threads erreicht. Bei einem weiteren Anstieg der Ströme verursachte der hinzugefügte Kern eine Umverteilung der Leistung.

Zwei Ideen kamen in den Sinn. Das erste war leicht zu überprüfen: War das BIOS nach der Installation von 2950X bei einer Leistungsaufnahme von 180 Watt "hängen geblieben"? Ich habe es noch einmal überprüft und bevor ich die Tests mit 2990WX durchführte, habe ich die bereits vor 1920X ausprobierten getestet. Ein vollständiger BIOS-Reset hatte keinen Einfluss auf die Ergebnisse. Ich kann argumentieren, dass dies keine Leistungsbegrenzung seitens des BIOS ist. Die zweite Idee ist, die Frequenzen zu überprüfen. Nachdem wir nur einen Referenzpunkt überprüft hatten (40 Streams sind geladen), fanden wir eine kleine Streuung, jedoch nur in Bezug auf die Leistung.

Während des Prime95-Tests arbeitete die erste Matrix mit 7 W pro Kern bei einer Frequenz von 3575 MHz. Der zweite Siliziumkristall ergab 3 W pro Kern bei einer Frequenz von 3525 MHz. Andere (Leerlauf-) Kerne liefen mit 1.775 MHz oder 2000 MHz und verbrauchten Milliwatt.

Während des POV-Ray-Tests verbrauchte jeder aktive Kern etwa 9,1 Watt pro Kern und hatte eine Frequenz von 3575 MHz. Alle freien Kerne hatten eine Frequenz von 2000 MHz (drei weitere waren bei 1775 MHz) und verbrauchten Milliwatt pro Kern.

Neben den Daten zum Kernverbrauch sahen die Chips in der Regel gleich häufig aus. Die POV-Ray-Testergebnisse sind etwas höher, was einen höheren Gesamtenergieverbrauch mit POV-Ray bedeutet.

Letztendlich kommt es darauf an, dass der Prime95-Leistungstest nach Überschreiten der Schwelle von etwa 20 Kernen oder bei Chips mit mehreren Kristallen nicht wie erwartet funktioniert. In Zukunft werden wir unseren Test-POV-Ray verwenden, der in der Lage ist, mehr aus modernen Mehrkernprozessoren herauszuholen.

Core Cons vs. Non-Core


Zurück zu dem Punkt, an dem wir über die Frequenz von Infinity Fabric gesprochen haben, können Sie das Verhältnis des Stromverbrauchs im POV-Ray-Test für 2990WX sehen.



Obwohl wir einige Abweichungen vom vorherigen Ergebnis feststellen, entsprechen die Daten (zusätzlich zum Spitzenverbrauch) im Allgemeinen unserem Uncore-Leistungstest mit Prime95. Infinity Fabric zeigt immer noch 55-60 Watt. Infolgedessen beginnt der Anteil des nichtnuklearen Verbrauchs an der Gesamtleistung bei 75% mit zwei Strömen und erreicht zum Zeitpunkt des Starts von 40 Strömen 22%.

Übertakten: 4,0 GHz pro 500 W


Wer hat gesagt, dass ein 250-Watt-Prozessor nicht übertaktet werden sollte? AMD ist stolz auf seine Fertigungsprozessoren, die jeweils mit einem unverriegelten Multiplikator verkauft werden, und verwendet auch gelötetes Material als thermische Schnittstelle.

Es ist Zeit zu bereuen. Wir hatten nicht genug Zeit zum Übertakten. Dieser Prozessor hat eine Grundfrequenz von 3,0 GHz, Turbo 4,2 GHz. In einem klimatisierten Raum mit einem 500-Watt-Kühler von Enermax Liqtech, in dem alle Kerne unter POV-Ray geladen waren, arbeitete jeder Kern mit einer Frequenz von 3150 MHz, und dies ist sehr weit von der Turbofrequenz entfernt. Als erstes habe ich einen Full-Core-Turbo mit 4,2 GHz sowie einen Single-Core-Turbo installiert. Dies ergab einen guten Anstieg.

Trotzdem überraschte mich die nächste Phase meiner Experimente mit Übertakten. Ich habe den CPU-Multiplikator im BIOS für 4,0 GHz auf allen Kernen ständig auf 40-fach eingestellt. Beim Verlassen des Auto-Modus habe ich die Spannung nicht angepasst, dafür musste ich sogar das Motherboard ASUS verlassen. Hören Sie, der Prozessor hat unser 4,0-GHz-Testpaket fehlerfrei ausgeführt. Ich war geschockt.

Alles, was ich für dieses Übertakten getan habe, ist das Umschalten von "Auto" auf "40". POV-Ray-Tests, die mehr Energie verbrauchen, haben erfolgreich funktioniert. Jeder Test aus dem Set hat funktioniert. Obwohl die Wärmeleistung (bei maximaler Belastung) hoch war, kam der Kühler problemlos damit zurecht.



Bei Volllast im POV-Ray-Test zeigte der Prozessor einen Verbrauch von 500 Watt, der Kühler ist für 500 Watt ausgelegt. Irgendwann sahen wir einen Sprung auf 511 W, wobei 440 W für Kerne (oder 13,8 W pro Kern) und 63 W für Uncore (IF, IO, IMC) reserviert waren, was 12,5% des Gesamtverbrauchs entspricht Energie. Wenn Sie möchten, dass der Ladeluftkühler weniger Strom verbraucht, übertakten Sie den Prozentsatz!

Wir haben die Frequenz auf 4,1 GHz eingestellt, und es schien auch zu funktionieren, bis wir das System vollständig geladen haben. Wie oben erwähnt, war es bei 4,2 GHz nicht möglich, ein Arbeitsergebnis zu erzielen, selbst wenn die Spannung anstieg. Für diejenigen, die sich mit Übertakten beschäftigen möchten, kann die Flüssigkeitskühlung die Lösung sein.

Leistung bei 4,0 GHz


Wenn also die Frequenz aller Kerne 3125 MHz beträgt, sollte das Übertakten auf 4000 MHz eine Leistungssteigerung von 28 Prozent bewirken, oder? Hier sind die Ergebnisse einiger Schlüsseltests in unserem Paket.













Das Übertakten von 2990WX ergab gemischte Ergebnisse. In einigen Tests hat es sehr gut funktioniert, in anderen blieb es aufgrund der Zwei-Modul-Architektur noch hinter dem 2950X zurück.

Übertakten lieferte in diesen Tests ein wirklich gutes Ergebnis: Blender zeigt eine Durchsatzsteigerung von 19%, POV-Ray von 19%, 3DPM von 19%. In anderen Tests ist es 2950X (Photoscan) unterlegen, bleibt jedoch zurück (Anwendungs-Download, WinRAR).

Durch das Übertakten werden nicht alle Leistungsprobleme des 2990WX behoben, der Prozessor profitiert jedoch davon.

Vielen Dank für Ihren Aufenthalt bei uns. Mögen Sie unsere Artikel? Möchten Sie weitere interessante Materialien sehen? Unterstützen Sie uns, indem Sie eine Bestellung aufgeben oder Freunden empfehlen. 30% Rabatt für Habrs Benutzer auf ein einzigartiges Analogon der Einstiegsserver, die wir für Sie erfunden haben: Die ganze Wahrheit über VPS (KVM) E5-2650 v4 (6 Kerne) 10 GB DDR4 240 GB SSD 1 Gbit / s von 20 Dollar oder wie man den Server teilt? (Optionen sind mit RAID1 und RAID10, bis zu 24 Kernen und bis zu 40 GB DDR4 verfügbar).

3 Monate kostenlos, wenn Sie ein halbes Jahr lang für das neue Dell R630 zahlen - 2 x Intel Deca-Core Xeon E5-2630 v4 / 128 GB DDR4 / 4 x 1 TB Festplatte oder 2 x 240 GB SSD / 1 Gbit / s 10 TB - ab 99,33 USD pro Monat , nur bis Ende August kann hier sein .

Dell R730xd 2 mal günstiger?Nur wir haben 2 x Intel Dodeca-Core Xeon E5-2650v4 128 GB DDR4 6 x 480 GB SSD 1 Gbit / s 100 TV ab 249 US-Dollar in den Niederlanden und den USA! Lesen Sie mehr darüber, wie Sie ein Infrastrukturgebäude bauen. Klasse C mit Servern Dell R730xd E5-2650 v4 im Wert von 9000 Euro für einen Cent?