Ist die Mustererkennungsfähigkeit von CNNs auf die Bildverarbeitung beschränkt?


21

Kann ein Convolutional Neural Network zur Mustererkennung in einem Problembereich verwendet werden, in dem keine Bilder vorhanden sind, beispielsweise durch grafische Darstellung abstrakter Daten? Wäre das immer weniger effizient?

Dieser Entwickler sagt, die aktuelle Entwicklung könnte noch weiter gehen, aber nicht, wenn es eine Grenze außerhalb der Bilderkennung gibt.


1
Ich sehe hier mindestens zwei Fragen. Wie findest du es, dich zu trennen? Außerdem hätte die Frage eine viel höhere Qualität, wenn Sie das, was Sie in der Titelfrage gesucht haben, erweitern könnten.
Eric Platon

@ EricPlaton Verschärfte es ein bisschen. Meine Hauptfrage betrifft die Art der Beziehung zwischen CNNs und Bildern. Was wäre Ihr Vorschlag für die zweite Frage?
Dynrepsys

Vielen Dank, die Frage ist gut für mich (obwohl ich meine Antwort jetzt ~ löschen sollte). Was die zweite Frage betrifft, wie wäre es mit einem Ansatz "Was ist der Haken"? "Ist es immer weniger effizient?" ist immer noch in Ordnung, wenn sich jemand ein Gegenbeispiel einfallen lässt.
Eric Platon

"Kann ein Convolutional Neural Network zur Mustererkennung in einem Problembereich verwendet werden, in dem es keine bereits vorhandenen Bilder gibt, beispielsweise durch grafische Darstellung abstrakter Daten?" Fragen Sie, ob wir Daten als Bild darstellen und eine CNN anwenden können? Sie möchten einen Datensatz mit 100 Features lesen und ihn als 10x10-Bild darstellen?
rcpinto

Antworten:


10

Faltungsnetze (Convolutional Nets, CNN) basieren auf mathematischen Faltungen (z. B. 2D- oder 3D-Faltungen), die üblicherweise für die Signalverarbeitung verwendet werden. Bilder sind eine Art Signal, und Faltung kann gleichermaßen für Schall, Vibrationen usw. verwendet werden. Im Prinzip können CNNs also für jedes Signal und wahrscheinlich auch für mehr Anwendungen finden.

In der Praxis gibt es bereits Arbeiten zu NLP (wie von Matthew Graves erwähnt), bei denen einige Leute Text mit CNNs verarbeiten und nicht mit rekursiven Netzwerken. Einige andere Arbeiten beziehen sich auf die Tonbearbeitung (hier kein Hinweis, aber ich habe noch nicht veröffentlichte Arbeiten im Gange).


Ursprünglicher Inhalt: In Antwort auf die ursprüngliche Titelfrage, die sich jetzt geändert hat. Vielleicht muss man diesen löschen .

Untersuchungen über gegnerische Netzwerke (und verwandte Netzwerke) zeigen, dass selbst tiefe Netzwerke leicht getäuscht werden können , so dass sie einen Hund (oder ein beliebiges Objekt) in scheinbar zufälligem Rauschen sehen, wenn ein Mensch es betrachtet (der Artikel enthält klare Beispiele).

Ein weiteres Problem ist die Generalisierungskraft eines neuronalen Netzwerks. Faltungsnetze haben die Welt mit ihrer Fähigkeit, viel besser als andere Techniken zu verallgemeinern, verblüfft. Wenn das Netzwerk jedoch nur mit Bildern von Katzen gefüttert wird, erkennt es nur Katzen (und sieht wahrscheinlich überall Katzen, wie dies durch die Ergebnisse des gegnerischen Netzwerks der Fall ist). Mit anderen Worten, es fällt selbst CNs schwer, zu weit über das hinaus zu generalisieren, woraus sie gelernt haben.

Die Erkennungsgrenze ist schwer genau zu definieren. Ich würde einfach sagen, dass die Vielfalt der Lerndaten die Grenze überschreitet (ich gehe davon aus, dass weitere Details zu einem geeigneteren Diskussionsort führen sollten).


5

Die einfache Antwort lautet "Nein, sie sind nicht auf Bilder beschränkt": CNNs werden auch für die Verarbeitung natürlicher Sprache verwendet. (Siehe hier für eine Einführung.)

Ich habe noch keine Anwendung auf grafische Daten gesehen, aber ich habe nicht nachgesehen. Es gibt einige offensichtliche Dinge zu versuchen und deshalb bin ich optimistisch, dass es funktionieren würde.


3

Convolutional Neural Network kann nicht nur zur Bilderkennung, sondern auch zur Videoanalyse und -erkennung, zur Verarbeitung natürlicher Sprache, in Spielen (z. B. Go ) oder sogar zur Wirkstoffentdeckung eingesetzt werden, indem die Wechselwirkung zwischen Molekülen und biologischen Proteinen vorausgesagt wird .

Daher kann es für eine Vielzahl von Problemen verwendet werden, indem Faltungsschichten und Unterabtastschichten verwendet werden, die mit vollständig verbundenen Schichten verbunden sind. Sie sind einfacher zu trainieren, da sie weniger Parameter haben als vollständig verbundene Netzwerke mit der gleichen Anzahl an versteckten Einheiten. UFLDL


3

Ein neuronales Faltungsnetzwerk kann überall dort verwendet werden, wo Muster lokal korreliert und übersetzbar sind (wie bei Shiftable). Dies ist der Fall, weil CNNs Filter enthalten, die überall in der Eingabe nach bestimmten lokalen Mustern suchen. Sie finden lokale und übersetzbare Muster in Bildern, Texten, Zeitreihen usw.

Es ist weniger sinnvoll, CNNs zu verwenden, wenn Ihre Daten eher einer Sammlung von Funktionen mit irrelevanter Reihenfolge ähneln. In diesem Fall haben Sie möglicherweise Probleme beim Erkennen von Mustern, die Merkmale enthalten, die in Ihrem Eingabevektor weiter voneinander entfernt sind. Sie werden keine lokalen und übersetzbaren Muster in Ihren Daten finden, wenn Sie die Datenpunkte der Eingabevektoren neu anordnen können, ohne Informationen zu verlieren.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.