Zusammenfassung des Problems von „zwei oder mehr Lehrern“ und subjektive Meinung zur KI-Community

    Während ich die Idee darlegte, verbreitete sie sich etwas unter Artikel

    1. Ein Modell der funktionalen Trennung von Bewusstsein und Unbewusstem. Einleitung
    2. Ein Modell der Manifestation von Bewusstsein oder ANN ohne den Effekt des Vergessens.
    3. Das Problem von „zwei oder mehr Lehrern“. Die ersten Berührungen
    4. Training mit Verstärkung in neuronalen Netzen. Die Theorie

    schien, dass das Publikum das notwendige Wissen hat, aber wir haben die Farbe der Gesellschaft - Programmierer :) Aber leider ... die neueste Umfrage zeigte, dass nicht alle Programmierer AI-Probleme kennen. Und die boorischen Studenten, die in den Kommentaren auf diese Artikel gestoßen sind, haben ihr Studium noch nicht abgeschlossen.

    Lassen Sie uns versuchen, dies als einen in der Umfrage versprochenen erweiterten Artikel zusammenzufassen und zu betrachten. Gleichzeitig sagten sie mir, dass es ernsthafte Probleme in der KI-Community gibt. Nach einer Reihe von Kommentaren - ja anscheinend gibt es das wirklich. Lassen Sie uns versuchen, den Trend zu betrachten.



    Subjektive Meinung über die KI-Community



    Beginnen wir damit. Vielen wird es nicht gefallen, aber versuchen Sie, es selbst nüchtern zu bewerten.

    Wie in jeder Wissenschaft hat AI bereits eine vollwertige Infrastruktur erworben :). Und so sieht es aus:

    1. Am Fuße der KI-Pyramide sitzen Orakel - das sind die Leute, die lautstark erklären, dass wir uns mit „starker KI“, „schwacher KI“ beschäftigen - wir sind nicht interessiert. Das sind Freaks - zumindest die, die ich getroffen habe, waren alle Freaks. Dies sind Kreationisten des 21. Jahrhunderts, sie übernehmen Logik und versuchen, fiktive Theorien zu entwickeln. Nicht mehr und nicht weniger. Wenn Sie ein junger Mann sind, der dies noch nicht getan hat, verlassen Sie diesen Sumpf, es nervt gute, kluge Köpfe. Sprechen Sie zunächst nicht einmal mit solchen Menschen - sie ernähren sich ebenso von Ihrer Energie wie religiöse Sekten.
    2. Ingenieure befinden sich auf den Stufen zur Pyramide der KI. Sie zögern nicht, sich auf "schwache KI" einzulassen, oft ist es ihr Brot. Auch am Institut wählen sie eine sehr enge Richtung - Erkennung von Maschinennummern, Bildverarbeitung, Vorhersage an der Börse, Steuerung von Robotern usw. usw. Oft haben sie den Titel eines Doktors der Wissenschaften und ein bisschen weniger den Titel eines Professors. Wenn Sie ein junger Mann sind, der mit solchen Ingenieuren arbeiten musste oder deren Vorlesung hört - lernen Sie die Grundlagen kennen, sonst rutschen Sie mit Sicherheit auf den Fuß. Aber die Grundlagen aufgesogen - nicht mitreißen lassen. Werden Sie kein Student, der nur die Terminologie kennt - äußern Sie Ihre Gedanken auf natürliche Weise. Versuchen Sie etwas selbst zu tun, beurteilen Sie niemals den Algorithmus, der Ansatz basiert nur auf dem, was ein solcher Ingenieur Ihnen gesagt hat. Es stellt sich oft heraus, dass er nur Bücher liest und sie beurteilt (ja, Ich kannte gute KI-Professoren, die das eingestanden haben, was ihnen nur mehr Ehre machte. Wenn Sie ihm glauben, woran er nicht direkt beteiligt ist, dann ohne die Originale zu überprüfen - in ein paar Jahren werden Sie dieses Wissen aus den Worten anderer weitergeben. Infolgedessen irren Sie sich ein wenig mehr als vollständig. Natürlich ist es zeitaufwändig, die Originale zu überprüfen und zu versuchen, die Experimente der Autoren der Methoden zu reproduzieren. Aber sonst muss man im Laufe der Zeit den falschen Eindruck erwecken, dass man etwas in Nachbargebieten versteht. Und Sie werden nicht nur ein frecher Student, der nur die Terminologie kennt, sondern eine Person mit Autorität, weil Sie mit einer privaten Aufgabe befasst waren (Sie werden sie stolz als spezifisch und mit konkreten Ergebnissen bezeichnen), sondern gleichzeitig absichtlich ungenaue Eindrücke verbreiten
    3. Auf den Stufen im Schatten, ein wenig von der Hitze entfernt, hockten sich neurophysiologische Ingenieure nieder, und sie wurden es so leid, mit Patienten zu arbeiten, dass sie daran dachten, dass auf der anderen Seite die KI-Ingenieure nicht aufschreien konnten. Sie machen in ihren Experimenten leise, was Sie an dem leisen Summen der KI-Ingenieure erkennen können. Etwas, das dabei herauskommt, ist etwas nicht ... aber in der Regel halten sie nicht mit dem Gedanken der KI-Ingenieure Schritt. Aber dank der Tatsache, dass sie dies wirklich in eine Mensch-Maschine-Schnittstelle umsetzen - es sieht immer spektakulär aus.
    4. Aber die Frage ist: Wer befindet sich im Pavillon oben auf der Pyramide? Es ist nicht seltsam - es ist leer, kein Eintritt ist frei, nur geht niemand dorthin. Manchmal fliegen nur laufende Ingenieure in der Hitze eines Kampfes hinein und gehen auch schnell. Dies ist der Ort für KI-Theoretiker. Ingenieure unterscheiden oft nicht, wo der Boden ist und wo der Boden ist - also verwechseln sie den Theoretiker mit dem Orakel. Aber so ist das Gehirn eines KI-Ingenieurs aufgebaut: Wenn er theoretische Verallgemeinerungen sieht, sieht er kein spezifisches Problem und versteht nicht, ob es brät. Er sieht den Wald hinter den Bäumen nicht, und wenn er die Sonne sieht, nimmt er ihn zur Enthüllung des Orakels - und er denkt, warum sollte ich mich zur Sonne erheben, um etwas Unbestimmtes zu tun. Er erhebt sich also nicht über den Bäumen, weil er Angst hat, die Sonne zu verbrennen. Und die Verbrannten, so sieht er, kriechen unter seinen Füßen am Rande der Pyramide. Aber natürlich weiß er es nicht, wenn er nach den Worten eines Zeitgenossen studiert hat

    Die Arbeit des Theoretikers ist schwierig und nicht dankbar



    Wenn es endlich passiert, dass sich die Menge der KI-Ingenieure in den Pavillon eines KI-Theoretikers drängt, erwartet Sie ein beneidenswertes Schicksal. Von oben wird ihm klar, dass er nicht das Recht hat, einfache Lösungen für einfache Probleme zu finden. Er kann es sich nicht länger leisten, eine bestimmte, aber so geliebte Aufgabe vor sich zu haben. Er sieht, dass er, um nicht vom Pavillon gestoßen zu werden, die Glut der Menschenmassen auf den Stufen der Pyramide ein wenig abkühlen muss. Und Sie müssen jedem und keiner bestimmten Gruppe Wasser spritzen.

    Aber wie kann man sich davon überzeugen, dass das Spritzwasser von KI-Ingenieuren trinkbar ist? Schließlich brauchen sie nur Lotionen, um bestimmte Probleme zu lösen. Hier ist der schwierigste Teil. Es ist notwendig, die Aufgaben der KI-Ingenieure zu degenerieren, nur dann haben sie etwas gemeinsam. Und finden Sie eine Lösung für dieses entartete Problem. Darüber hinaus ist es eigentlich nicht üblich, entartete Aufgaben an die reale Welt anzupassen, aus der KI-Ingenieure Aufgaben ableiten. Ihnen muss mindestens ein Werkzeug gegeben werden, und ihr Problem besteht darin, einen Hammer oder eine Axt zu verwenden.

    Für einen modernen Theoretiker wird es jedoch immer komplizierter, unprätentiöse Degenerationen wurden bereits konstruiert - es gibt bereits Ideen zu Klassifizierungsproblemen, Clustering-Problemen, MDP, PoMDP usw. Wir müssen die Aufgaben degenerieren, damit in ihnen immer mehr Probleme der realen Welt verbleiben.

    Wir werden also ein solches entartetes Problem betrachten.

    Das notwendige Minimum für das Verständnis ist, wie die Fitnessfunktion mithilfe eines künstlichen neuronalen Netzwerks eingestellt wird und warum dies erforderlich ist?


    Zuerst muss ich die „rosa Brille“ von denen entfernen, die sie aufsetzen. Sprechen wir über die Fähigkeit von ANNs, Vorhersagen zu treffen, und die Geschwindigkeit ihres Lernens. Alles stimmt mit Minsky überein - sie prognostizieren schlecht und langsam. Und obwohl ich auf dem Rosenblatt Perceptron zeigen werde, gibt es für andere Netzwerke grundsätzlich keinen Unterschied.

    Es sind KI-Ingenieure, die eine schöne Auswahl an Aufgaben mit guten Ergebnissen für bestimmte Aufgaben abholen. Ich werde Ihnen die Situation auf der Stirn zeigen. Wer nicht einverstanden ist - wir übernehmen die unten beschriebene Aufgabe und testen sie selbst und liefern konkrete Ergebnisse mit der Berechnung des Codes - damit die Ergebnisse reproduziert werden können (Boltologie habe ich satt - bedenken Sie).

    Herausforderung.

    Wir nehmen eine einfache Funktion c = a + b, wobei a und b ganze Zahlen von 1 bis 64 sind und c eine ganze Zahl von 1 bis 256 ist (wir werden später eine etwas größere Dimension benötigen).

    Dann haben wir 16 Eingänge und 256 Ausgänge im Perzeptron. Das heißt Es werden 2 Bytes eingegeben, die die Binärzahlen a und b darstellen. Und damit das Perceptron ein wenig besser arbeitet, wird die Ausgabe als welche Ausgabenummer, wie und welche Nummer interpretiert. Um die Mehrdeutigkeit des Ausgangs loszuwerden, arbeiten wir nach dem Prinzip „der Gewinner nimmt alles“, d. H. Wir berücksichtigen nur die Ausgabe, die am aktivsten ist.

    Die Idee der Genauigkeit der Vorhersage eines neuronalen Netzwerks

    Wenn wir ein Perzeptron auf den gesamten angegebenen Bereich der Ausgabeeingaben trainieren, wird es korrekt lernen, hinzuzufügen. Um dies grafisch darzustellen, zeichnen wir ein „rotes Quadrat“ :), wobei wir ausgehend von der oberen linken Ecke auf der X-Achse die Zahl a auf die Y-Achse b verschieben und die Summe c am Schnittpunkt mit einem Punkt und in einer Abstufung von Rot anzeigen. Wir bekommen folgendes:


    Aber wenn alles bekannt ist, gibt es keinen Raum für Vorhersagen. Entfernen wir daher jeden zweiten Punkt:



    Nehmen Sie nun einen beliebigen Grafikeditor und fügen Sie die fehlenden Punkte hinzu. Wirst du in der Lage sein, das "rote Quadrat" wiederherzustellen? Ich denke, dass nur eine Person das kann - ja, Malewitsch :)

    Aber das Perzeptron wird sich wie jede andere Person an fast jedem Punkt irren, aber es wird nur den allgemeinen Trend beibehalten. Folgendes wird ihm gelingen:



    Wir sehen also, wann mathematische Genauigkeit erforderlich ist - Prognosen sind aus Kaffeesatz eine Wahrsagerei. Aber hier ist ein Hinweis auf eine Tendenz durchaus angebracht. Perceptrons arbeiten deshalb mit Bildverarbeitung, weil Unsere Augen können getäuscht werden, und detaillierte Genauigkeit ist dort nicht erforderlich. Bei Maschinen, bei denen arithmetische Genauigkeit erforderlich ist, funktioniert das Perzeptron jedoch nicht.Unsere Intuition ist von derselben Eigenschaft - man kann sagen, dass unser Grafikspeicher in der Analytik verwendet wird. Das ist die ganze Psychologie.

    Fitness-Funktion

    Es ist eigentlich einfach. Die oben von uns verwendete Funktion c = a + b spiegelt möglicherweise die Eignung für einen bestimmten Prozess wider. (In der Wirtschaft sprechen sie gerne über die Nutzenfunktion, sie haben alles, was dort nicht nützlich ist, Sie müssen kein Geld ausgeben :) oder sie sprechen über die Bewertungsfunktion - dies sind auch die Amateure, die den Preis fragen :) Nun, aber für natürliche Prozesse fragen wir nicht nach dem Preis - Wir beurteilen die Eignung geeigneter Bedingungen für unser Handeln. Nun, lassen Sie uns das Wasser im Wasserkocher mit zwei Quellen erhitzen, von denen die Temperatursensoren jeder Quelle getrennt sind. Wir müssen bestimmen, wann das Wasser kochen wird.

    In der Tat haben wir dieses Problem oben gelöst. Oben haben wir das Perceptron darauf trainiert, die Fitnessfunktion c = a + b zu implementieren. Es bleibt nur zu schön, um die Temperatur über 100 Grad anzuzeigen, lassen Sie es uns in der Abstufung von Grün tun, das ist, was wir bekommen.



    Und wir sehen, dass im Allgemeinen, wenn das Perzeptron die Vorhersage nicht aufgegeben hat (schwarze Punkte), es im Trend im Prinzip nicht verwechselt wird. KI-Ingenieure können ein wenig mit Parametern, Arten neuronaler Netze usw. spielen. und wird fast kein fehlerhaftes Bild erhalten. Im Allgemeinen wird es viele Fehler geben - aber die Grenze wird gefunden. Und so kann ein völlig verschwommenes Gerät die Handlungsanweisungen deutlich machen. Dies wird von Personen verwendet, die Agenten für das Laufen auf der Grundlage einer bestimmten Fitnessfunktion schulen.

    Jetzt konnte man einfach nicht anders als zu verstehen, wie man die Fitnessfunktion in einem künstlichen neuronalen Netzwerk

    einstellt ;) Warum ist es praktisch, die Fitnessfunktion über ein künstliches neuronales Netzwerk einzustellen?

    Diese Frage ist etwas komplizierter. Warum sollte man ein so ungenaues und langsames Lernnetzwerk verwenden , wenn man die Fitnessfunktion leicht mit einer mathematischen Formel einstellen kann? Es ist dasselbe, als würde man nicht die Intuition benutzen, sondern die Grundlagen der Analytik, die man in der Schule erlangt hat.

    Es gibt nur ein Problem mit der mathematischen Formel - es ist hart und kompromisslos.

    In der Praxis haben wir jedoch begonnen, die Temperatur zu messen, und an zuvor unbekannten Punkten haben wir eine Art Anomalie erhalten. Es ist nicht bekannt warum, aber sie fingen an. Im Bereich noch recht niedriger Quellentemperaturen stieg die Temperatur deutlich über 100 Grad. So könnte es aussehen:



    Stellen Sie sich vor, jede Dimension ist sehr teuer, es dauert mehrere Tage und 10.000 US-Dollar - aber wir möchten wirklich verstehen, was die Anomalie ist, und zumindest in welchem ​​Bereich. Unsere Formel ist unwiderruflich veraltet und ungeeignet.

    Und hier ist nichts besser und sie haben nicht herausgefunden, wie man ein neuronales Netzwerk benutzt, obwohl es schlecht ist, dass es eine Vorhersage geben kann - zumindest dies:



    Das Problem der "zwei oder mehr Lehrer" im Kontext


    Es wird etwas schwieriger. Machen Sie sich zum Nachdenken bereit :), ich gehe davon aus, dass das oben Gesagte auch dem Wächter auf dem Markt klar geworden ist.

    Nehmen wir an, wir haben jetzt zwei Professoren, von denen einer die Erwärmung unseres Wassers aus zwei Quellen gemessen und ein Layout (rechts) und das zweite Layout (links) erstellt hat:



    Dann hat einer die Theorie analysiert und aufgebaut, dass die Temperaturen der Quellen addiert werden müssen, um die Endtemperatur zu erhalten. Und die zweite baute eine andere Theorie auf - es reicht ihm, nur eine der Temperaturen der Quelle zu messen, die heißer ist.

    Und so trafen sie sich, natürlich gestritten, und riefen sich gegenseitig Ignoranten, Betrüger usw. an. und sie waren sich über nichts einig, jeder ging in sein eigenes Labor. Normale Geschichte, nicht wahr? Dann schuf jeder von ihnen seine eigene "Schule". Er fing an, den Schülern seine Theorien beizubringen, und jeder boorische Schüler einer Schule stritt sich mit demselben boorischen Schüler einer anderen Schule - schließlich mussten sie sich gegenseitig anschreien - damit die Schüler einen Platz unter der Sonne auf den Stufen unserer Pyramide bekommen.

    Aber es wurde einer halbgebildeten Person klar, die den Kampf dieser Schulen schon lange beobachtet hatte. Aber es gibt wahrscheinlich einen Faktor, den der Professor von Schule A und der Professor von Schule B nicht berücksichtigen. Er beschließt, es ihnen zu sagen, aber sie schlossen in seinem Büro und ließen keine Menschen von der Straße, aus Angst, eine Art Orakel hereinzulassen. Deshalb muss unser Student seinen Weg durch die Studenten der Professoren finden, natürlich kicherte jeder auf seine Weise, drehte einen Finger an der Schläfe und man bemühte sich sogar, sich in die Nase fallen zu lassen. Als unser Held erkannte, dass nichts passieren würde, dass er gereift war und die Seiten geschlagen hatte, zog er sich in den Pavillon oben auf der Pyramide zurück. Dort erkannte er, dass, bis er zeigte, was der Faktor der Diskrepanz zwischen den beiden Professoren nicht sein würde. Und dann sah er sich im Sitzen und Gedränge um. Und mir wurde klar - nicht, weil ich schon so hoch geklettert war - warum sollte ich zwei Professoren anprobieren,

    Und er fing an, über das Problem in allgemeinen Kategorien nachzudenken, und dann alle, die auf den Stufen der Pyramide saßen, zu bestreuen. Ja - er war mit dem Geist des Pavillons infiziert und verstand, warum viele hier nicht hingehen wollten. Es bricht wirklich eine Person.

    Und das hat er bisher verstanden. Verwenden Sie das neuronale Netzwerk wie oben beschrieben, um festzustellen, wo die Anomalie liegt - funktioniert nicht. Anomalien gibt es überall im Staatsraum, und alles hängt davon ab, welchen Professor man sich ansieht. Das heißt Zwischen jedem Punkt von Professor A und dem Punkt von Professor B besteht ein Widerspruch.

    Er verstand auch, dass es zur Lösung dieses Widerspruchs notwendig ist, die gesamte Geschichte zu berücksichtigen, die sich aus dem Experiment von Professor A und Professor B ergibt, das um diese Zeit geschah. Viele unnötige und manchmal übereinstimmende Daten (weil die Professoren fast dasselbe taten). Aber nur in ihnen gibt es irgendwo einen Faktor, der sich auswirkt.

    Die manuelle Analyse ist anstrengend, daher hat er ein neuronales Netzwerk eingerichtet und Rückmeldungen damit verbunden, wodurch die Geschichte des gesamten Experiments aktiviert wurde. Wenn wir nun nach der Vorhersage die Temperaturen von zwei Quellen messen, erhalten wir ähnliche Daten wie bei Professor A, ein Signal aus dem Netzwerk über den Kontext - die Geschichte des Experiments von Professor A. Und ähnlich bei Daten, die Professor B nahe stehen. Die experimentellen Bedingungen mussten viele Male geändert werden, bis hat keine professorähnlichen Daten erhalten.

    Und jetzt klatscht es - und das Netzwerk hat den Grund für die Diskrepanz gefunden, das Netzwerk hat sofort seine Arbeit aufgenommen und es wurde ein vollständiges Layout erstellt, abhängig von einem anderen gefundenen Faktor. Das Muster wurde komplexer als das von Professoren, aber es lieferte erstaunlich genaue Daten (bisher jedoch ein Drittel) der professor wird keinen widerspruch bekommen) ... dieses muster muss natürlich noch irgendwie aus dem netzwerk ausgewählt und analytisch aufgezeichnet werden, aber dann musst du dich an den mann wenden, der auf einer bank in der nähe im pavillon gelegen hat ... aber nein, es war ein traum, unser halbgebildeter -geroy ich, bis das Netzwerk richtig gesponnen einnickte, und er ging um Bier zu trinken, um die Zukunft des Universums zu denken.

    Jetzt auch beliebt: