Ein riesiger Schritt für eine Schachmaschine

Ursprünglicher Autor: Steven Strogatz
  • Übersetzung

Der unglaubliche Erfolg von AlphaZero, einem Algorithmus mit tiefem Lernen, verkündet eine neue Ära des Denkens, die für den Menschen von kurzer Dauer sein kann




Anfang Dezember berichteten Forscher des künstlichen Intelligenzunternehmens DeepMind, das sich im Besitz von Alphabet Inc., einer Muttergesellschaft, zu der auch Google gehört, über das Geschehen an der Front des Schachs.

Ein Jahr zuvor, am 5. Dezember 2017, schlug das Team die Schachwelt mit der Ankündigung seines AlphaZero-Algorithmus für das Lernen am Computer (MO), der nicht nur gewöhnliches Schach, sondern auch japanisches Shogi und Go- Spiel beherrschte . Der Algorithmus funktionierte ohne jegliche Spielkonzeption mit Ausnahme der Grundregeln. Dann fing er an, mehrere Millionen Mal mit sich selbst zu spielen und aus seinen Fehlern zu lernen. In nur wenigen Stunden war der Algorithmus der beste Spieler, sowohl von Menschen als auch von Computern, von allem, was die Welt sah.

Details zu den Erfolgen von AlphaZero und seiner internen Struktur werden derzeit einer formellen Überprüfung unterzogen. Anschließend werden sie in der Zeitschrift Science veröffentlicht . Neue Arbeit reagiert auf ernsthafte Kritik an der ursprünglichen Aussage. Zum Beispiel war es schwer zu sagen, ob AlphaZero mit seinem Gegner, dem Computer-Monster Stockfish, recht ehrlich spielte. Aber all diese Zweifel wurden ausgeräumt. In den letzten 12 Monaten ist AlphaZero nicht stärker geworden, aber es ist ein überzeugenderer Beweis für seine Überlegenheit. Er stellt eindeutig eine Art von Geist dar, die noch nie zuvor von Menschen gesehen wurde, über die wir lange nachdenken müssen.

In den letzten 20 Jahren hat Computerschach einen langen Weg zurückgelegt. 1997 gelang es IBMs Computerschachprogramm Deep Blue, den damaligen menschlichen Weltmeister Garry Kasparov in einem Match von sechs Spielen zu schlagen. Rückblickend kann gesagt werden, dass diese Errungenschaft kein Geheimnis hatte. Deep Blue könnte 200 Millionen Positionen pro Sekunde schätzen. Sie wurde nie müde, machte nie einen Fehler und vergaß nie, was sie kurz zuvor dachte.

So oder so spielte sie wie eine Maschine, brutal und materialistisch. Sie hätte besser denken können als Kasparov, aber sie konnte nicht besser denken als er. Im ersten SpielIn diesem Match akzeptierte Deep Blue den von Kasparov angebotenen Turmwechsel gegen Bischof voraussagend, verlor aber 16 Züge später. Die derzeitige Generation der weltweit stärksten Schachprogramme, zum Beispiel Stockfish und Komodo, spielt nicht menschlich. Sie nehmen gerne die Zahlen anderer Leute mit. Sie bauen eine eiserne Verteidigung. Obwohl sie stärker sind als andere Personen, haben diese Schachmaschinen keine Ahnung von dem Spiel. Sie müssen die grundlegenden Prinzipien des Schachspiels erlernen.

Diese durch jahrzehntelange Erfahrung menschlicher Großmeister verfeinerten Prinzipien werden in Form komplexer Bewertungsfunktionen in die Maschine einprogrammiert. Sie geben an, was in Position erreicht werden muss und was zu vermeiden ist: wie sehr Sie die Sicherheit des Königs schätzen müssen, die Aktivität der Teile, die Anordnung der Spielfiguren, die Kontrolle über die Mitte des Brettes usw. und wie man die Kompromisse zwischen diesen Dingen handhabt. Heutige Schachmaschinen, denen alle diese Prinzipien fremd sind, verhalten sich wie grobe Tiere: Sie sind extrem schnell und stark, aber es fehlt ihnen an Gehirn.

Das alles änderte sich jedoch nach dem Erscheinen von MO. AlphaZero selbst spielte mit sich selbst und aktualisierte ihre neuronalen Netzwerke, während sie aus Erfahrung lernte. Sie selbst entdeckte die Prinzipien des Schachspiels und wurde schnell zum besten Spieler. Sie konnte die Meister unter den Leuten nicht nur leicht schlagen, sie besiegte Stockfish, den Computerschachmeister. In einem Match mit 100 Spielen gegen eine beeindruckende Maschine gewann AlphaZero 28 Mal und reduzierte das Spiel 72 Mal auf ein Unentschieden, ohne einen einzigen zu verlieren.

Das Ärgerlichste war, dass AlphaZero das Denken demonstrierte. Sie spielte wie kein anderer Computer intuitiv und wunderschön mit einem romantischen Angriffsstil. Sie spielte Gambits und wagte es. In einigen Spielen lähmte sie Stockfish und spielte mit ihr. Angriff im 10. SpielAlphaZero zog sich von der Königin in ihre Ecke des Brettes zurück, weg von dem König von Stockfish, und benahm sich anders als sie den König angreifen sollte.

Dieser seltsame Exkurs erwies sich jedoch als giftig. Egal wie Stockfish reagierte, sie war zum Scheitern verurteilt. Es schien, als würde AlphaZero nach Milliarden von aufgezählten Kombinationen auf Stockfish warten, würde erraten, wie hoffnungslos ihre Position war, sich entspannen und sich friedlich wie ein besiegter Stier einem Matador ergeben. So etwas haben die Großmeister noch nie gesehen. AlphaZero spielte mit virtuoser Anmut und Maschinenleistung. Es war die erste kurze Bekanntschaft mit einer erstaunlichen neuen Art von Intelligenz.


Garry Kasparov, links, spielt im sechsten und letzten Spiel des Spiels, das im Mai 1997 in New York ausgetragen wurde, gegen den IBM Deep Blue-Computer. Die Figuren hinter dem Computer wurden von Joseph Hoan, einem IBM-Ingenieur, gesteuert.

Als die Entwickler AlphaZero erstmals einführten, beklagten sich einige Beobachter darüber, dass Stockfish die Möglichkeit gewählt hatte, auf eine Reihe von Debüts zuzugreifen. Diesmal war sie trotz ihres Sets zermalmt. Und selbst als AlphaZero Stockfish einen Vorsprung verschaffte und die Rechenzeit um das Zehnfache erhöhte, gewann sie trotzdem.

Es ist beeindruckend, dass AlphaZero gewonnen hat und nicht schneller, sondern besser gedacht hat. Sie studierte nur 60.000 Positionen pro Sekunde und nicht 60 Millionen Positionen wie Stockfish. Sie war schlauer und wusste, worüber sie nachdenken und was sie ignorieren sollte. Unabhängig von den Prinzipien des Schachspiels entwickelte AlphaZero einen Spielstil, der "die Wahrheit" des Spiels widerspiegelt und nicht die "Prioritäten und Vorurteile der Programmierer", schrieb Kasparov in einem begleitenden Kommentar zu einem Artikel in Science.

Nun stellt sich die Frage, ob das Verteidigungsministerium den Menschen helfen wird, ähnliche Wahrheiten über Dinge zu entdecken, die wirklich wichtig sind: die großen ungelösten Probleme der Wissenschaft und der Medizin, wie etwa die Heilung von Krebs oder Bewusstsein; Rätsel des Immunsystems, die Geheimnisse des Genoms.

Die ersten Anzeichen sind inspirierend. Im August untersuchten zwei Artikel in der Fachzeitschrift Nature Medicine die Verwendung von MOs für medizinische Diagnosen. In einem Fall haben Forscher von DeepMind in Zusammenarbeit mit den Ärzten des Murfields Eye Hospital in London einen Algorithmus mit tiefgreifendem Lernen entwickelt, der eine Vielzahl von Netzhautpathologien sowie menschliche Experten klassifizieren kann. In der Augenheilkunde gibt es einen gravierenden Mangel an Experten, die in der Lage sind, die Millionen diagnostischer Bilder der Augen jährlich zu interpretieren. KI-Assistenten wären von unschätzbarem Wert.

Ein anderer Artikel befasste sich mit dem MO-Algorithmus, der das Vorhandensein einer Computertomographie auf Bildern von Notfallpatienten, Anzeichen von Schlaganfall, intrakraniellen Blutungen oder anderen neurologischen Problemen erkennt. Für Schlaganfallopfer ist jede Minute wichtig; Je länger sich die Behandlung verzögert, desto schlechter ist das Ergebnis. Neurologen haben sogar ein Sprichwort: "Zeit ist das Gehirn." Der neue Algorithmus kennzeichnet diese und andere kritische Ereignisse mit einer Genauigkeit, die für menschliche Experten vergleichbar ist, arbeitet jedoch 150-mal schneller. Die Hochgeschwindigkeitsdiagnose ermöglicht die Übersetzung der dringlichsten Fälle vor der Warteschlange, wonach sie von einem menschlichen Radiologen ausgewertet werden können.

Ärgerlich in MO ist, dass Algorithmen ihre Gedanken nicht erklären können. Wir wissen nicht, warum sie funktionieren, also wissen wir nicht, ob man ihnen vertrauen kann. AlphaZero zeigt alle Anzeichen der Entdeckung der wichtigen Prinzipien des Schachspiels, kann dieses Verständnis jedoch nicht mit uns teilen. Zumindest vorerst. Die Menschen brauchen mehr als nur Antworten. Wir brauchen ein Verständnis. Von nun an wird dieses Problem zu Spannungen in unserer Interaktion mit Computern führen.

In der Mathematik ist das schon lange passiert. Betrachten Sie ein langjähriges mathematisches Problem, das als Vierfarbensatz bezeichnet wird . Sie argumentiert, dass jede Karte benachbarter Länder unter bestimmten vernünftigen Einschränkungen mit vier Farben gefärbt werden kann, so dass zwei Nachbarländer unterschiedliche Farben haben.

Obwohl der Satz 1977 mit einem Computer bewiesen wurde, kann keine einzige Person alle Schritte des Beweises überprüfen. Seitdem wurden die Beweise bestätigt und vereinfacht, aber sie enthalten immer noch Teile, die vollständige Berechnungen des rohen Kraftbedarfs erfordern, wie zum Beispiel die von AlphaZero-Vorgängern, die Schach spielen. Diese Situation ärgerte viele Mathematiker. Sie mussten nicht von der Richtigkeit des Satzes überzeugt werden; Sie glaubten es schon. Sie wollten verstehen, warum es wahr ist, und solche Beweise halfen nicht.

Aber stellen Sie sich vor, dass der Tag vielleicht sehr bald kommen wird, wenn AlphaZero zu einem allgemeineren Algorithmus wird. Nennen wir es AlphaInfinity. Wie sein Vorfahre wird er überlegene Intelligenz besitzen: Er kann hervorragende Beweise vorlegen, so elegant wie die Spiele von AlphaZero gegen Stockfish. Und jeder Beweis wird zeigen, warum der Satz wahr war. AlphaInfinity zwingt Sie nicht, hässliche und komplexe Beweise zu akzeptieren.

Für Mathematiker und Wissenschaftler wäre ein solcher Tag der Beginn einer neuen Ära des Denkens. Aber sie kann nicht lange dauern. Je schneller die Maschinen werden und Menschen überholen, deren Neuronen im Millisekundenbereich mit Schneckentempo arbeiten, desto schneller wird der Tag kommen, an dem wir nicht mithalten können. Der Beginn des Denkens einer Person kann sich schnell in einen Sonnenuntergang verwandeln.

Angenommen, es gibt bestimmte Muster, die noch entdeckt werden müssen - bei der Genregulation oder der Krebsentwicklung. im Immunsystem; im Tanz der subatomaren Teilchen. Angenommen, diese Muster können nur durch den Verstand vorhergesagt werden, der unserem weit überlegen ist. Wenn AlphaInfinity sie identifizieren und verstehen könnte, wäre es uns wie ein Orakel erschienen.

Wir saßen zu ihren Füßen und hörten aufmerksam zu. Wir würden nicht verstehen, warum das Orakel immer recht hat, aber wir könnten seine Berechnungen und Vorhersagen in Experimenten und Beobachtungen überprüfen und seine Offenbarungen bestätigen. In der Wissenschaft, einem symbolischen Beruf der Menschen, würde sich unsere Rolle auf die Beobachterrolle reduzieren, wobei wir das Erstaunen und Verwirrung betrachten.

Vielleicht werden uns unsere Denkfehler eines Tages nicht mehr stören. AlphaInfinity kann nämlich alle Krankheiten heilen, alle wissenschaftlichen Probleme lösen und alle anderen intelligenten Züge im Zeitplan halten. Die ersten 300.000 Jahre unseres Bestehens als Homo sapiens haben wir gut überstanden. Wir werden keine Probleme mit dem Gedächtnis haben, wir werden uns stolz an die goldene Ära des menschlichen Geistes erinnern, an dieses herrliche Zwischenspiel, das mehrere Jahrtausende dauerte, zwischen der unbegreiflichen Vergangenheit und der unerklärlichen Zukunft.

Jetzt auch beliebt: