Welche Topologien sind beim maschinellen Lernen weitgehend unerforscht?


11

Geometrie und KI

Matrizen, Würfel, Ebenen, Stapel und Hierarchien können genau als Topologien bezeichnet werden . Betrachten Sie in diesem Zusammenhang die Topologie als das übergeordnete geometrische Design eines Lernsystems.

Mit zunehmender Komplexität ist es häufig nützlich, diese Topologien als gerichtete Graphstrukturen darzustellen. Zustandsdiagramme und Markovs Arbeit zur Spieltheorie sind zwei Orte, an denen häufig gerichtete Graphen verwendet werden. Gerichtete Diagramme haben Eckpunkte (häufig als geschlossene Formen dargestellt) und Kanten, die häufig als Pfeile dargestellt werden, die die Formen verbinden.

Wir können GANs auch als gerichteten Graphen darstellen, bei dem die Ausgabe jedes Netzes das Training des anderen auf kontroverse Weise steuert. GANs ähneln topologisch einem Möbius-Streifen.

Wir können keine neuen Designs und Architekturen entdecken, ohne nicht nur die Mathematik der Konvergenz auf eine optimale Lösung oder die Verfolgung einer zu verstehen, sondern auch die Topologien von Netzwerkverbindungen, die eine solche Konvergenz unterstützen können. Es ist so, als würde man zuerst einen Prozessor entwickeln und sich vorstellen, was ein Betriebssystem benötigt, bevor man das Betriebssystem schreibt.

Um zu sehen, welche Topologien wir NOCH NICHT berücksichtigt haben, schauen wir uns zunächst an, welche.

Erster Schritt - Extrusion in einer zweiten Dimension

In den 1980er Jahren wurde Erfolg mit der Erweiterung des ursprünglichen Perzeptron-Designs erzielt. Die Forscher fügten eine zweite Dimension hinzu, um ein mehrschichtiges neuronales Netzwerk zu erstellen. Eine vernünftige Konvergenz wurde durch Rückausbreitung des Gradienten einer Fehlerfunktion durch die Gradienten der Aktivierungsfunktionen erreicht, die durch Lernraten abgeschwächt und mit anderen Metaparametern gedämpft wurden.

Schritt 2 - Hinzufügen von Dimensionen zum diskreten Eingangssignal

Wir sehen die Entstehung von Faltungsnetzwerken, die auf vorhandenen manuell abgestimmten Bildfaltungstechniken basieren und Dimensionen in die Netzwerkeingabe einführen: Vertikale Position, Farbkomponenten und Rahmen. Diese letzte Dimension ist entscheidend für CGI, Gesichtsersatz und andere morphologische Techniken im zeitgenössischen Filmemachen. Ohne sie haben wir Bilderzeugung, Kategorisierung und Rauschentfernung.

Schritt drei - Stapel von Netzwerken

Wir sehen, dass Ende der neunziger Jahre Stapel neuronaler Netze entstehen, in denen das Training eines Netzwerks von einem anderen überwacht wird. Dies ist die Einführung konzeptioneller Schichten, weder im Sinne von aufeinanderfolgenden Schichten von Neuronen noch im Sinne von Farbschichten in einem Bild. Diese Art der Überlagerung ist ebenfalls keine Rekursion. Es ist eher wie in der natürlichen Welt, in der eine Struktur ein Organ in einer anderen völlig anderen Art von Struktur ist.

Schritt vier - Hierarchien von Netzwerken

Wir sehen, dass in der Forschung aus den 2000er und frühen 2010er Jahren (Laplace und andere) häufig Hierarchien neuronaler Netze auftauchen, die die Interaktion zwischen neuronalen Netzen fortsetzen und die Analogie des Gehirns von Säugetieren fortsetzen. Wir sehen jetzt eine Metastruktur, bei der ganze Netzwerke zu Eckpunkten in einem gerichteten Graphen werden, der eine Topologie darstellt.

Schritt fünf% mdash; Abweichungen von der kartesischen Orientierung

In der Literatur haben sich nicht-kartesische, sich systematisch wiederholende Anordnungen von Zellen und Verbindungen zwischen ihnen herausgebildet. Zum Beispiel untersuchen Gauge Equivariant Convolutional Networks und das Icosahedral CNN (Taco S. Cohen, Maurice Weiler, Berkay Kicanaoglu, Max Welling, 2019) die Verwendung einer Anordnung, die auf einem konvexen regulären Ikosaeder basiert.

Zusammenfassen

Schichten haben normalerweise bewertete Aktivierungsfunktionen für Eckpunkte und Dämpfungsmatrizen, die auf einen erschöpfenden Satz gerichteter Kanten zwischen benachbarten Schichten abgebildet sind [1]. Bildfaltungsschichten befinden sich häufig in zweidimensionalen Scheitelpunktanordnungen mit Dämpfungswürfeln, die auf einen verkürzten Satz gerichteter Kanten zwischen benachbarten Schichten abgebildet sind [2]. Stapel haben ganze geschichtete Netze als Eckpunkte in einem meta-gerichteten Graphen, und diese Meta-Eckpunkte sind in einer Sequenz verbunden, wobei jede Kante entweder ein Trainings-Metaparameter, ein Verstärkungssignal (Echtzeit-Feedback) oder eine andere Lernsteuerung ist . Hierarchien von Netzen spiegeln die Vorstellung wider, dass mehrere Steuerelemente aggregiert werden können und das Lernen auf niedrigerer Ebene steuern, oder den Flip-Fall, in dem mehrere Lernelemente von einem übergeordneten Supervisor-Netzwerk gesteuert werden können.

Analyse des Trends bei Lerntopologien

Wir können Trends in der Architektur des maschinellen Lernens analysieren. Wir haben drei topologische Trends.

  • Tiefe in der Kausalitätsdimension - Schichten zur Signalverarbeitung, bei denen die Ausgabe einer Aktivierungsschicht über eine Matrix von Dämpfungsparametern (Gewichten) der Eingabe der nächsten Schicht zugeführt wird. Wenn größere Kontrollen eingerichtet werden, kann erst beginnend mit dem grundlegenden Gradientenabstieg in der Rückenpropagagion eine größere Tiefe erreicht werden.

  • Dimensionalität des Eingangssignals - Von der skalaren Eingabe bis zu Hyperwürfeln (Video hat horizontale, vertikale, Farbtiefe einschließlich Transparenz und Rahmen - Beachten Sie, dass dies nicht mit der Anzahl der Eingaben im Perzeptron-Sinne übereinstimmt.

  • Topologische Entwicklung - Die beiden oben genannten sind kartesischer Natur. Bemaßungen werden rechtwinklig zur vorhandenen Bemaßung hinzugefügt. Da Netzwerke in Hierarchien (wie in Laplace-Hierarchien) und Möbius-Streifen (wie in GANs) verkabelt sind, sind die Trends topografisch und werden am besten durch gerichtete Graphen dargestellt, bei denen die Eckpunkte keine Neuronen sind, sondern kleinere Netzwerke davon.

Welche Topologien fehlen?

Dieser Abschnitt erweitert die Bedeutung der Titelfrage.

  • Gibt es einen Grund, warum mehrere Meta-Vertices, die jeweils ein neuronales Netz darstellen, so angeordnet werden können, dass mehrere Supervisor-Meta-Vertices zusammen mehrere Mitarbeiter-Meta-Vertices überwachen können?
  • Warum ist die Rückausbreitung eines Fehlersignals das einzige nichtlineare Äquivalent einer negativen Rückkopplung?
  • Kann nicht eine Zusammenarbeit zwischen Meta-Vertices anstelle einer Überwachung angewendet werden, bei der zwei reziproke Kanten Steuerelemente darstellen?
  • Da neuronale Netze hauptsächlich zum Lernen nichtlinearer Phänomene verwendet werden, warum sollten andere Arten geschlossener Pfade beim Entwurf der Netze oder ihrer Verbindung verboten werden?
  • Gibt es einen Grund, warum dem Bild kein Ton hinzugefügt werden kann, damit Videoclips automatisch kategorisiert werden können? Wenn dies der Fall ist, ist ein Drehbuch eine mögliche Merkmalsextraktion eines Films und kann eine kontroverse Architektur verwendet werden, um Drehbücher zu erstellen und Filme ohne das Filmstudiosystem zu produzieren? Wie würde diese Topologie als gerichteter Graph aussehen?
  • Obwohl orthogonal angeordnete Zellen eine beliebige regelmäßige Packungsanordnung von nicht orthogonalen Eckpunkten und Kanten simulieren können, ist dies bei der Bildverarbeitung effizient, wenn eine andere Neigung der Kamera als plus oder minus 90 Grad üblich ist?
  • Ist es effizient, einzelne Zellen in Netzwerken oder Netzwerken von Zellen in KI-Systemen orthogonal in Lernsystemen anzuordnen, die auf das Verstehen und Zusammensetzen natürlicher Sprachen oder auf künstliche Wahrnehmung abzielen?

Anmerkungen

  1. Künstliche Zellen in MLPs verwenden Gleit- oder Festkomma-Arithmetikübertragungsfunktionen anstelle von elektrochemischen Impulsübertragungen basierend auf der auf Amplitude und Nähe basierenden Schwelle. Sie sind keine realistischen Simulationen von Neuronen, daher wäre das Aufrufen der Eckpunkte Neuronen eine Fehlbezeichnung für diese Art der Analyse.

  2. Die Korrelation von Bildmerkmalen und relativen Änderungen zwischen Pixeln in unmittelbarer Nähe ist viel höher als die von entfernten Pixeln.


Ich habe diese Frage ein- oder zweimal durchgelesen und muss zugeben, dass ich keine Ahnung habe, was gefragt wird. Insbesondere bezieht sich "Topologie" nicht auf eines der von Ihnen erwähnten Konzepte. vielleicht meinst du "architektur"? aber das scheint auch keinen Sinn zu machen ...... Ich denke, diese Frage fällt genau in die Kategorie "nicht einmal".
kc sayz 'kc sayz'

Antworten:


0

Topologie ist das Studium geometrischer Formen, die sich durch Schnittmenge und Gabelung unterscheiden. Der Begriff wird für die grafischen Aspekte Netzwerkarchitekturen verwendet. Es ist naheliegend, damit die Erweiterung der Analogie des neuronalen Netzwerks zu betrachten, mit dem Verständnis, dass ANNs in ihrer Aktivierung biologischen Neuronen nicht sehr ähnlich sind. Aus diesem Grund ist es schwierig, die Diskussion auf topologische Belange zu beschränken, wenn man bedenkt, was weitgehend unerforscht ist.

Das Supervisor-Mitarbeiter-Paradigma wird von Stacks und Laplace-Hierarchien verwendet, während das Collaborator-Paradigma von gegnerischen Netzwerken verwendet wird. Obwohl das Feedback negativ ist, arbeiten das generative Modell (G) und das diskriminative Modell (D) tatsächlich zusammen, um ein Ziel zu erreichen, da ein Anwalt des Teufels im Diskurs verwendet wird, um auf Wahrheiten zu konvergieren. Sicherlich sind andere Designs geplant, bei denen die Eckpunkte keine künstlichen Neuronen sind, sondern ganze ANNs oder CNN-Elemente.

Die Paradigmen Lehrer-Schüler und Vorgesetzter-Mitarbeiter sind wahrscheinlich nur zwei von vielen. Um die neuronale Plastizität zu simulieren, müssen die Paradigmen Gärtnerpflanze, Gerätereparaturmann und Ingenieurprodukt untersucht werden.

Die Rückausbreitung eines Fehlersignals ist nicht das einzige nichtlineare Äquivalent einer negativen Rückkopplung. Die zirkuläre Topologie von GANs ist ebenfalls eine negative Rückkopplung, wie Sie bei der Verwendung der Möbius-Streifenanalogie angegeben haben. Es sollte jedoch mehr darüber nachgedacht werden.

Die Zusammenarbeit zwischen Meta-Vertices ist interessant. Muss die Zusammenarbeit vom Typ eines vorgetäuschten Gegners sein? Kann positives Feedback in Topologien künstlicher Intelligenz nützlich sein? Farmbesitzer und LKW-Fahrer, die Lebensmittel verteilen, kaufen Lebensmittel in Supermärkten, die am Ende einer Kette von Prozessen stehen, deren Rolle nur ein Teil ist. Größere Zyklen in gerichteten Diagrammdarstellungen von Topologien und Designs können wahrscheinlich sinnvoll positive oder negative Rückkopplungen verwenden.

Die künstliche Produktion von Filmen könnte aus Forschungen wie der Cornell U-Arbeit zur Videoerzeugung aus Text stammen - Li, Min, Shen, Carlson und Carin .


0

Rand des Chaos und des maschinellen Lernens; und Vorteile bei der Entscheidungsfindung


Direkte Antwort auf Ihre Frage : -

Rand des Chaos


Erklärung für Laien : -

( https://www.lucd.ai/post/the-edge-of-chaos# !)


Worum geht es in dieser Antwort? : -

Der Rand des Chaos in der Chaostheorie könnte ein wichtiges Thema der Forschung in der künstlichen Intelligenz sein.

Was ist der Rand des Chaos? Es wird angenommen, dass dieses Feld in einer Vielzahl von Systemen existiert. Es hat viele Anwendungen in solchen Bereichen. Dieses Feld ist eine Übergangszone zwischen dem Zusammenspiel von Ordnung und Unordnung.

Ich interessiere mich für die Schnittstelle zwischen KI und Chaostheorie. Der Rand des Chaos dient als potenzielle Topologie, die beim maschinellen Lernen weitgehend unerforscht ist.

Dies ist ein reiches Feld, das viel Potenzial bietet. Es ist sowohl weitgehend unbekannt als auch unterschätzt.

In dieser Antwort werde ich die Vorteile einer solchen Analyse untersuchen. Die Vorteile zeigen sich in der Entscheidungsfindung, beispielsweise die optimale Art und Weise, die Arbeitskräfte in ein Unternehmen zu investieren und zu verwalten.


Technische Explantation : -

"Matrizen, Würfel, Ebenen, Stapel und Hierarchien können wir genau als Topologien bezeichnen. Betrachten Sie die Topologie in diesem Zusammenhang als das übergeordnete geometrische Design eines Lernsystems." ~ Douglas Daseeco, Eröffnungsplakat

Vergleichen Sie das mit diesem Auszug aus der folgenden Zusammenfassung des Papiers: -

"... Durch dynamische Stabilitätsanalyse an verschiedenen Computer-Vision-Modellen finden wir direkte Hinweise darauf, dass eine optimale Leistung eines tiefen neuronalen Netzwerks in der Nähe des Übergangspunkts zwischen stabilen und chaotischen Attraktoren auftritt. ..." Feng, Ling und Choy Heng Lai. - "Optimale Maschinenintelligenz am Rande des Chaos." arXiv-Vorabdruck arXiv: 1909.05176 (2019).

- -

"Der Rand des Chaos ist ein Übergangsraum zwischen Ordnung und Unordnung, von dem angenommen wird, dass er in einer Vielzahl von Systemen existiert. Diese Übergangszone ist eine Region mit begrenzter Instabilität, die ein konstantes dynamisches Zusammenspiel zwischen Ordnung und Unordnung erzeugt.

Obwohl die Idee des Randes des Chaos abstrakt und nicht intuitiv ist, hat sie viele Anwendungen in Bereichen wie Ökologie, Unternehmensführung, Psychologie, Politikwissenschaft und anderen Bereichen der Sozialwissenschaft. Physiker haben gezeigt, dass die Anpassung an den Rand des Chaos in fast allen Systemen mit Feedback erfolgt. "Wikipedia-Mitwirkende." - "Rand des Chaos." Wikipedia, die freie Enzyklopädie . Wikipedia, The Free Encyclopedia, 10. September 2019. Web. 22. September 2019.


Die Vorteile eines solchen Fachgebiets :

"[...] Strategie, Protokoll, Teams, Abteilungen, Hierarchien. Alle sorgfältig organisiert für optimale Leistung.

Zumindest soll es so sein. Wenn wir jedoch die Linse eines Komplexitätstheoretikers auf unser Geschäft anwenden, sehen wir, dass die Dinge etwas komplexer sind. Wir betrachten Organisationen nicht mehr als Organisationen oder Abteilungen als Abteilungen, sondern als komplexe adaptive Systeme, die in den drei Teilen am hilfreichsten verstanden werden:

BESCHÄFTIGUNG

Verwenden mentaler Modelle, um bessere Entscheidungen bei der Arbeit zu treffen Das Berufsleben ist mit schwierigen Entscheidungen übersät. Bin ich bereit für diese Promotion? Welchen meiner Manager sollte ich als Mentor auswählen? Was soll ich zum Mittagessen essen? Es gibt keine narrensichere Methode, um konsequent die beste Vorgehensweise zu wählen - selbst die Besten von uns machen Fehler -, aber mit den richtigen Werkzeugen ist es möglich, die Erfolgschancen zu maximieren.

Erstens Mitarbeiter (in der Komplexität sprechen: heterogene Agenten). Jeder Mitarbeiter hat unterschiedliche und sich weiterentwickelnde Entscheidungsregeln, die sowohl die Umgebung widerspiegeln als auch versuchen, Änderungen zu antizipieren. Zweitens, Mitarbeiter, die miteinander interagieren, und die Strukturen, die diese Interaktionen schaffen - Wissenschaftler nennen dies Entstehung. Schließlich entsteht die übergreifende Struktur, die sich wie ein übergeordnetes System verhält, dessen Eigenschaften und Merkmale sich von denen der zugrunde liegenden Agenten unterscheiden. Dieser letzte Teil ist der Grund, warum wir oft sagen: "Das Ganze ist größer als die Summe seiner Teile."

Angesichts des Wunsches der Manager nach Kontrolle ist Komplexität keine bequeme Realität. Anstatt sich der brutalen Realität des Systems zu stellen, an dessen Aufrechterhaltung sie arbeiten, arbeiten Manager häufig in Silos und schaffen Modelle und Mechanismen, die ein Furnier der Sicherheit auferlegen. Auf diese Weise helfen sie sich und ihren Kollegen, Entscheidungen mit weniger Variablen zu treffen. Das Erreichen der in diesen Modellen festgelegten Ziele führt zu Erfolgsnachweisen - es handelt sich jedoch um einen vereinfachten Erfolg, der möglicherweise nicht im besten Interesse des Gesamtsystems liegt.

Zum Beispiel macht es den Arbeitnehmern klar, dass der Maximierung der Aktionärsrenditen eine strenge Priorität eingeräumt wird: Im Falle eines schwierigen Kompromisses ist die Option, die sich für eine sofortige Rentabilität eignet, die bevorzugte Option. Wir sind uns jedoch alle bewusst, dass die Reduzierung von Ausgaben und Investitionen zur Steigerung der kurzfristigen Margen sich nachteilig auf die langfristige Gesundheit eines Unternehmens auswirken kann. Nur wenn wir die Komplexität berücksichtigen, können wir konkurrierende Werte und Prioritäten (und die Auswirkungen von Entscheidungen auf alle) effektiv ausgleichen. [...] "- Fresno, Blanca González del." Befehl aus dem Chaos: Anwendung der Komplexitätstheorie bei der Arbeit: BBVA. " NEWS BBVA , BBVA, 4. Dezember 2017, < www.bbva.com/de/order-from-chaos-how-to-apply-complexity-theory-at-work/ >.


Weiterführende Literatur : -


Quellen und Referenzen : -


-1

Dies kann nicht zum Thema gehören. Wenn ja, löschen Sie es.

In elektronischen Schaltkreisen haben wir logische Blöcke - Generatoren, Trigger, Speicherzellen, Selektoren, Alus, Fpus, Busse und viele andere Chips. Und davon haben wir Computer, und von der nächsten Ebene haben wir Computernetzwerke ...

Für maschinelles Lernen wir eine ähnliche Organisation der Dinge haben muss, aber wenn wir 64-Bit - Computer haben, können unsere neuronale Netze haben mehr komplexe Ein- / Ausgänge und mehr logische Funktionen als in einer beliebigen Programmiersprache definiert.

Für X Eingangsbits haben wir also X ^ (2 ^ 2) Zustände für ein Ausgangsbit und 2 ^ X Bits zur Auswahl einer benötigten logischen Funktion.

Wir müssen diese Funktionen also konsequent untersuchen und die notwendigen als erste opencv-Filter wie zum Beispiel hervorheben.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.