Neuronale Netze verstehen nicht, was optische Täuschungen sind

Ursprünglicher Autor: Emerging Technology
  • Übersetzung

Bildverarbeitungssysteme können Gesichter auf Augenhöhe mit den Menschen erkennen und sogar realistische künstliche Gesichter erstellen. Forscher haben jedoch herausgefunden, dass diese Systeme optische Täuschungen nicht erkennen können und daher neue schaffen.




Das menschliche Sehen ist ein erstaunliches Gerät. Obwohl es sich seit Millionen von Jahren in einer spezifischen Umgebung entwickelt hat, ist es für Aufgaben in der Lage, die in frühen visuellen Systemen nie vorkamen. Ein gutes Beispiel wäre das Lesen oder Definieren künstlicher Objekte - Autos, Flugzeuge, Verkehrsschilder usw.

Das visuelle System weist jedoch eine Reihe bekannter Fehler auf, die wir als optische Täuschung wahrnehmen. Forscher haben bereits viele Optionen ausgemacht, bei denen diese Illusionen dazu führen, dass Menschen Farbe, Größe, relative Position und Bewegung falsch einschätzen.

Illusionen sind für sich selbst interessant, da sie eine Vorstellung von der Natur des visuellen Systems und der Wahrnehmung vermitteln. Daher ist es sehr nützlich, einen Weg zu finden, um neue Illusionen zu finden, die helfen, die Grenzen dieses Systems zu erkennen.


Konzentrische Kreise?

Hier sollten wir vom tiefen Lernen profitieren. In den letzten Jahren haben Maschinen gelernt, Objekte und Gesichter in Bildern zu erkennen und dann ähnliche Bilder zu erstellen. Es ist leicht vorstellbar, dass ein Computer Vision System in der Lage sein muss, Illusionen zu erkennen und eigene zu schaffen.

Hier treten Robert Williams und Roman Yampolsky von der University of Louisville in Kentucky auf. Diese Jungs haben versucht, so etwas aufzubauen , fanden aber heraus, dass alles nicht so einfach ist. Bestehende maschinelle Lernsysteme sind nicht in der Lage, ihre eigenen optischen Illusionen zu erzeugen - zumindest für jetzt. Warum so

Erste allgemeine Informationen. Die jüngsten Fortschritte beim Tiefenlernen basieren auf zwei Durchbrüchen. Der erste ist die Verfügbarkeit leistungsfähiger neuronaler Netzwerke und einiger Software-Tricks, mit denen sie gut studieren können.

Die zweite ist die Erstellung einer großen Anzahl von gekennzeichneten Datenbanken, auf deren Basis Maschinen lernfähig sind. Um beispielsweise einer Maschine das Erkennen von Gesichtern beizubringen, sind Zehntausende von Bildern mit deutlich markierten Gesichtern erforderlich. Mit solchen Informationen kann ein neuronales Netzwerk lernen, die charakteristischen Muster von Gesichtern zu erkennen - zwei Augen, eine Nase, einen Mund. Was ist noch beeindruckender, ein paar Netzwerke - die sogenannten. Generative-Adversary Network (GSS) - kann sich gegenseitig beibringen, realistische und völlig künstliche Gesichtsbilder zu erstellen

Williams und Yampolsky begannen, das neuronale Netzwerk bei der Definition von optischen Täuschungen zu unterrichten. Es gibt genug Rechenleistung und es gibt nicht genügend geeignete Datenbanken. Daher bestand ihre erste Aufgabe darin, eine Datenbank mit optischen Illusionen für das Training zu erstellen.

Es stellte sich als schwierig heraus. "Es gibt nur wenige tausend statische optische Täuschungen, und die Anzahl der einzigartigen Arten von Täuschungen ist sehr gering - vielleicht ein paar Dutzend", sagen sie.

Und dies ist ein ernstes Hindernis für moderne maschinelle Lernsysteme. "Die Schaffung eines Modells, das aus so kleinen und begrenzten Datenbeständen lernen kann, wird für generative Modelle und das Verständnis der menschlichen Sichtweise ein großer Fortschritt sein", sagen sie.

Daher sammelten Williams und Yampolsky eine Datenbank mit mehr als 6000 Bildern von optischen Täuschungen und trainierten das neuronale Netzwerk, um sie zu erkennen. Dann erstellten sie die GSS, die unabhängig optische Täuschungen erzeugen sollte.

Die Ergebnisse enttäuschten sie. "Nach sieben Stunden Training auf dem Nvidia Tesla K80 wurde nichts Wertvolles geschaffen", sagen die Forscher, die die Datenbank für alle zugänglich gemacht haben.

Das Ergebnis ist jedoch interessant. "Die einzigen uns bekannten optischen Täuschungen wurden durch Evolution (z. B. Augenzeichnungen auf Schmetterlingsflügeln) oder durch menschliche Künstler erzeugt", weisen sie darauf hin. In beiden Fällen spielten die Menschen eine entscheidende Rolle bei der Bereitstellung von Feedback - die Illusion kann von den Menschen gesehen werden.

Und Computer Vision Systeme können nicht. "Es ist unwahrscheinlich, dass die GSS in der Lage sein wird, den Anblick zu täuschen, ohne die Prinzipien zu verstehen, die den Illusionen zugrunde liegen", erklären Williams und Yampolsky.

Dies kann schwierig sein, da es zwischen menschlichen und maschinellen visuellen Systemen kritische Unterschiede gibt. Viele Forscher schaffen neuronale Netzwerke, die dem menschlichen Sehsystem noch ähnlicher sind. Vielleicht ist eine der interessantesten Überprüfungen für diese Systeme, ob sie die Illusion sehen können.

In der Zwischenzeit sind Williams und Yampolsky nicht optimistisch: "Anscheinend reicht der Datensatz mit Illusionen nicht aus, um neue Illusionen zu erzeugen", sagen sie. Während also optische Täuschungen eine Bastion der menschlichen Wahrnehmung bleiben, unterliegen sie keinen Maschinen.

Jetzt auch beliebt: