Das neuronale AlphaStar-Netzwerk schlug die StarCraft II-Profis mit einer Punktzahl von 10-1

Published on January 25, 2019

Das neuronale AlphaStar-Netzwerk schlug die StarCraft II-Profis mit einer Punktzahl von 10-1



    DeepMind, eine Tochtergesellschaft von Alphabet, die auf dem Gebiet der künstlichen Intelligenz forscht, kündigte einen neuen Meilenstein in dieser großen Aufgabe an: Zum ersten Mal schlug AI den Mann in der Starcraft-II-Strategie . Im Dezember 2018 verbreitete das Faltungsnetzwerk AlphaStar die Profispieler TLO (Dario Wünsch, Deutschland) und MaNa (Grzegorz Comints, Polen) und gewann zehn Siege. Zu diesem Anlass gab das Unternehmen gestern in einer Live-Sendung auf YouTube und Twitch bekannt.

    In beiden Fällen spielten sowohl die Leute als auch das Programm für die Protoss. Obwohl sich TLO nicht auf dieses Rennen spezialisiert hat, bot MaNa ernsthaften Widerstand und gewann dann sogar ein Spiel.

    In der beliebten Echtzeitstrategie stehen die Spieler für eines von drei Rennen, die um Ressourcen kämpfen, Strukturen aufbauen und auf einer großen Karte kämpfen. Es ist wichtig anzumerken, dass die Geschwindigkeit des Programms und sein Sichtfeld auf dem Schlachtfeld begrenzt waren, damit AlphaStar keinen unfairen Vorteil gegenüber Menschen erlangt (Änderung: Offensichtlich war der Sichtbereich nur im letzten Spiel begrenzt). Laut Statistik führte das Programm sogar weniger Aktionen pro Minute durch als Menschen: durchschnittlich 277 für AlphaStar, 390 für MaNa, 678 für TLO.



    Das Video zeigt das Spiel aus Sicht des KI-Agenten im zweiten Match gegen MaNa. Die Ansicht der Person wird ebenfalls angezeigt, war jedoch für das Programm nicht verfügbar.

    AlphaStar lernte, in einer Umgebung namens AlphaStar League für die Protoss zu spielen. Zuerst überprüfte das neuronale Netzwerk drei Tage lang die Aufzeichnungen von Spielen und spielte dann mit sich selbst, wobei eine Technik verwendet wurde, die als Verstärkungstraining und Honen von Fähigkeiten bekannt war.

    Im Dezember organisierten sie erstmals eine Spielesitzung gegen TLO, in der fünf verschiedene Versionen von AlphaStar getestet wurden. In diesem Zusammenhang beschwerte sich TLO , dass er sich nicht an das Spiel des Feindes anpassen könne. Das Programm gewann mit einer Punktzahl von 5-0.

    Nach der Optimierung der neuronalen Netzwerkeinstellungen wurde eine Woche später ein Match gegen MaNa organisiert. Das Programm gewann erneut fünf Spiele, aber MaNa rächte sich im letzten Spiel gegen die neueste Version des Algorithmus live, sodass er auf etwas stolz sein kann.


    Bewertung des Levels der Gegner, auf denen das neuronale Netzwerk trainiert wurde

    Um die Prinzipien der strategischen Planung zu verstehen, musste AlphaStar eine bestimmte Denkweise beherrschen. Die für dieses Spiel entwickelten Methoden können möglicherweise in vielen praktischen Situationen nützlich sein, die eine komplexe Strategie erfordern: zum Beispiel Handels- oder Militärplanung.

    Starcraft II ist nicht nur ein extrem schwieriges Spiel. Es ist auch ein Spiel mit unvollständigen Informationen, bei dem die Spieler die Aktionen ihres Gegners nicht immer sehen können. Es hat auch keine optimale Strategie. Und es braucht Zeit, bis die Ergebnisse der Aktionen des Spielers klar werden: Dies erschwert auch das Lernen. Das DeepMind-Team verwendete eine sehr spezialisierte neuronale Netzwerkarchitektur, um diese Probleme zu lösen.

    Begrenztes Lernen in Spielen


    DeepMind ist bekannt als Softwareentwickler, der die weltbesten Profis in Sachen Go and Chess geschlagen hat. Zuvor entwickelte das Unternehmen mehrere Algorithmen, die das Spielen einfacher Atari-Spiele erlernt haben. Videospiele sind eine großartige Möglichkeit, den Fortschritt bei der künstlichen Intelligenz zu messen und Computer mit Menschen zu vergleichen. Dies ist jedoch ein sehr enger Testbereich. Wie bei früheren Programmen führt AlphaStar nur eine Aufgabe aus, wenn auch unglaublich gut.

    Wir können sagen, dass eine schwache KI mit engen Zielen die Fähigkeiten der strategischen Planung und Taktik von Kampfhandlungen beherrscht. Theoretisch können sich diese Fähigkeiten in der realen Welt als nützlich erweisen. In der Praxis ist dies jedoch nicht unbedingt der Fall.

    Einige Experten glauben, dass solche hochspezialisierten KI-Anwendungen nichts mit starker KI zu tun haben: „Programme, die gelernt haben, ein bestimmtes Video- oder Brettspiel auf einer„ übermenschlichen “Ebene geschickt zu spielen, gehen bei geringfügigen Änderungen der Bedingungen (Änderung des Hintergrunds auf dem Bildschirm oder Änderung der Position) vollständig verloren virtuelle „Plattform“ für den „Ball“) zu schlagen, - sagt Professor für Informatik an der Portland State University Mitchell Melanie Artikel „Künstliche Intelligenz in eine Barriere ponima lief gen " . - Dies sind nur einige Beispiele, die die Unzuverlässigkeit der besten KI-Programme belegen, wenn sich die Situation geringfügig von der unterscheidet, in der sie studiert haben. Die Fehler dieser Systeme reichen von lächerlich und harmlos bis potenziell katastrophal. “

    Der Professor ist der Ansicht, dass der Wettlauf um die Kommerzialisierung der KI einen enormen Druck auf die Forscher ausgeübt hat, Systeme zu entwickeln, die bei engen Aufgaben "ganz gut" funktionieren. Letztendlich erfordert die Entwicklung einer verlässlichen KI ein tieferes Studium unserer eigenen Fähigkeiten und ein neues Verständnis der kognitiven Mechanismen, die wir selbst anwenden:

    Unser eigenes Verständnis der Situationen, denen wir begegnen, basiert auf umfassenden, intuitiven „gesunden Menschenverstand“ -Konzepten über die Funktionsweise der Welt und über die Ziele, Motive und das wahrscheinliche Verhalten anderer Lebewesen, insbesondere anderer Menschen. Darüber hinaus basiert unser Weltverständnis auf unseren grundlegenden Fähigkeiten, das, was wir wissen, zusammenzufassen, abstrakte Konzepte zu bilden und Analogien zu ziehen - kurz gesagt, unsere Konzepte flexibel an neue Situationen anzupassen. Seit Jahrzehnten experimentieren Forscher mit der Vermittlung von KI an den intuitiven gesunden Menschenverstand und die nachhaltigen menschlichen Fähigkeiten zur Verallgemeinerung. In dieser sehr schwierigen Angelegenheit gibt es jedoch nur geringe Fortschritte.

    Das neuronale AlphaStar-Netzwerk kann nur für Protoss spielen. Die Entwickler haben Pläne angekündigt, sie in Zukunft für andere Rennen auszubilden.