Hochleistungs-Computing auf der x86-Architektur für eine Ära der Präsenztechnologie

    Suche, maschinelles Lernen, Datenanalyse, Erstellung und Bereitstellung von Inhalten, Augmented und Virtual Reality, Computerspiele - die Liste der ressourcenintensiven Aufgaben für Computersysteme wird jeden Tag erweitert. Wenn wir über die technologische Seite des Themas sprechen, diskutieren wir zwei Themen.



    Der erste ist der ständig wachsende Bedarf nach mehr Rechenleistung. Was auch immer die Halbleiterindustrie vorschlägt, die Endanwender passen sich schnell an neue Produkte an und fragen erneut nach mehr.

    Die zweite ist natürlich Marktveränderungen. Ich arbeite seit über 30 Jahren in diesem Bereich und in der letzten Zeit gab es eine Menge Veränderungen. Schauen wir uns nur ein Beispiel an: Durch das Aufkommen des World Wide Web und einer grafischen Benutzeroberfläche wurde ein PC von einem Textverarbeitungswerkzeug zu einem echten Zugangsportal für die ganze Welt, was das Leben der Menschen radikal verändert hat. Infolgedessen konnten wir Informationen so einfach finden und austauschen, dass dies bisher nicht möglich war. Dann wurden die Geräte portabel und erhielten eine permanente Verbindung zum Netzwerk - zuerst waren es Laptops und dann Smartphones und Tablets. Bald gab es eine echte Explosion in der Popularität von Anwendungen, und die riesige Datenmenge, die gespeichert, verarbeitet und analysiert werden musste, erforderte noch mehr Rechenleistung.

    Vor vier Jahren begann AMD mit der Renovierung seiner leistungsstarken x86-Kernarchitektur, um diese wachsenden Anforderungen zu erfüllen. Unsere bisherige Prozessorfamilie konnte auf dem Gebiet der Energieeffizienz erhebliche Erfolge verzeichnen, diese Chips waren jedoch nicht bereit, das erforderliche Niveau für anspruchsvolle Anwendungen bereitzustellen. Basierend auf dieser Aufgabe haben wir das Design des Kernels mit dem Codenamen "Zen" von Grund auf erstellt.



    Bei der Konzeption von Zen wollten wir in jeder Hinsicht einen neuen und modernen Kern entwickeln. Die Architektur wurde optimiert, um höhere Leistung, Durchsatz und Energieeffizienz zu erreichen, so dass Prozessoren die anspruchsvollsten Anwendungen bewältigen können. Infolgedessen erwies sich Zen als eine wesentlich produktivere Lösung, da AMD auf den Markt für Hochleistungssysteme zurückkehrt und die Implementierung von 40% mehr Anweisungen pro Taktzyklus zeigt, ohne den Energieverbrauch zu erhöhen 1. Dieses ehrgeizige Ziel haben wir mit Fokus auf Leistung und Stromverbrauch erreicht. Die neu entwickelte Mikroarchitektur enthält wesentliche Änderungen im Bereich der Verarbeitungsanweisungen, Arbeitsschemata von Ausführungsmodulen und Cache-Speichersubsystemen, um die Ausführung von Aufgaben und deren parallelen Betrieb zu beschleunigen. Wie wir auf der Hot Chips 2016 Konferenz an der Stanford University gezeigt habenZen zeichnet sich durch eine verbesserte Verzweigungsvorhersage und die Auswahl der richtigen Anweisungen aus und arbeitet mit dem Mikro-Op-Cache, um diese Anweisungen besser auszuführen. Die neue Architektur unterstützt außerdem eine um 75% höhere Planungstiefe, wodurch die Anzahl der Anweisungen erhöht wird. Außerdem werden im parallelen Modus mehr Anweisungen ausgeführt, da die Breite der Anweisungen um 50% im Vergleich zur vorherigen Generation von Kernen zunimmt. Diese Kombination bietet eine enorme Steigerung der Rechenleistung pro Takt.

    Wenn Sie einen leistungsstarken Motor haben, müssen Sie ihn auftanken. Wir nennen diesen Prozess bedingt "das Tier füttern". In unserem Fall handelt es sich bei dem Kraftstoff um die Daten und Anweisungen aus dem Speicher. Wir haben die Cache-Hierarchie überarbeitet und dem Chip 8 MB L3-Cache, gemeinsam genutzten L2-Cache für Anweisungen und Daten sowie separate Cache-Volumes mit geringer Latenz für Befehle und Daten zur Verfügung gestellt. Ein einzelner Kernel kann jetzt fünfmal schneller mit dem Cache arbeiten als in der vorherigen Architektur.



    Der Zen-Vorabrufblock spielt eine entscheidende Rolle für den Durchsatz und verkörpert einen der komplexesten Algorithmen, die für Prozessoren erstellt wurden. Der Vorabruf nimmt an und bestimmt anhand der Daten über die aktuelle Aufgabe, welche Anweisung im nächsten Zyklus benötigt wird. Wie gut Sie Ihre Pläne umsetzen und wie schnell Sie Fehler korrigieren können, ist nicht nur eine Frage der Wissenschaft, sondern auch der Kunst, und im Falle des Zen haben wir in dieser Hinsicht beeindruckende Ergebnisse erzielt.

    Die deutliche Steigerung des Durchsatzes im Zen im Vergleich zur vorherigen Prozessorgeneration erklärt sich durch den Übergang zur parallelen Multithreading-Architektur (SMT). Dieser Ansatz ermöglicht es dem Kernel, Aufgaben innerhalb des Programms zu verfolgen. Wenn eine Aufgabe angehalten wird und auf das Eintreffen eines anderen Befehls oder anderer Daten gewartet wird, wird eine andere Aufgabe zur Verarbeitung verwendet, die sich nicht im Standby-Modus befindet. In Bezug auf Software erhalten wir daher zusätzliche Prozessorressourcen, wenn der SMT-Modus aktiviert ist.

    Schließlich zur Verbesserung der Energieeffizienz. Die Zen-CPU wurde für den Einsatz in verschiedenen Geräten entwickelt - von Laptops mit passiver Kühlung bis zu Supercomputern - und alle erfordern eine hohe Energieeffizienz. In einer Welt, in der ein Leistungszuwachs von 10% als bedeutend erachtet wird, schien unser Ziel einer Leistungssteigerung von 40% ohne zusätzliche Leistungssteigerung auf den ersten Blick unmöglich zu sein. Die AMD-Ingenieure konzentrierten sich jedoch auf diese Aufgabe und fanden neue Wege, um den Stromverbrauch zu senken und die Mikroarchitektur zu optimieren, und wendeten ein fortschrittlicheres Taktsteuerungssystem an.

    Der Wunsch nach einer Verbesserung der Energieeffizienz wurde von Anfang an in das Produkt einbezogen: Bei der Entwicklung eines neuen Designs versuchten die Ingenieure, jedes Mikrowatt einzusparen, und jeder Stromkreis wurde hinsichtlich der Leistung optimiert. Selbst wenn ein kleiner Teil des Prozessors nicht aktiv aktiv ist, wird er vollständig ausgeschaltet, um unnötigen Stromverbrauch zu vermeiden. Wenn Sie jedoch die Taktfrequenz übertakten und die Last erhöhen, zeigt der Prozessor eine sehr hohe Leistung pro Watt. Darüber hinaus wird Zen mit der neuen 14-nm-FinFET-Prozesstechnologie hergestellt. FinFET-Transistoren sind kleiner, wirtschaftlicher und produktiver als Analoge der Vorgängergeneration. Mit dieser preisgekrönten Lösung unseres Industriepartners konnten wir bei der Implementierung einer neuen Mikroarchitektur von Rechenkernen die größtmögliche Wirkung erzielen.

    Welche Ergebnisse all diese Innovationen am Ende bringen werden, wird im nächsten Jahr klar, wenn die ersten Produkte mit Prozessoren auf Zen-Basis auf den Markt kommen werden. Heute können Labortests jedoch beeindrucken. Wir haben kürzlich einen 8-Core / 16-Line-Desktop-Prozessor Summit Ridge und einen 32-Core / 64-Line-Prozessor von Naples für Server demonstriert. Diese beiden Prozessoren mit Zen-Kernen ermöglichen es uns, mit viel Optimismus in die Zukunft zu blicken. Es ist auch wichtig zu verstehen, dass Zen nur ein Zwischenschritt in Richtung Zukunft des AMD x86-Computing mit hoher Leistung ist. Unser Entwicklungsplan beinhaltet die nächste Generation von Chips mit zusätzlichen Verbesserungen. Unsere Teams arbeiten bereits an neuen Projekten.

    Mark Papermaster, Senior Vice President und CTO bei AMD


    Basierend auf internen Leistungsbewertungen der Zen-Kerne der x86-Architektur im Vergleich zu den Kernen der x86-Baggerkerne.

    Jetzt auch beliebt: