Antworten:
Da Sie diese sehr grundlegende Frage stellen, scheint es sich zu lohnen, anzugeben, was maschinelles Lernen selbst ist.
Maschinelles Lernen ist eine Klasse von Algorithmen, die datengesteuert ist, dh im Gegensatz zu "normalen" Algorithmen sind es die Daten, die "sagen", was die "gute Antwort" ist. Beispiel: Ein hypothetischer nicht-maschineller Lernalgorithmus zur Gesichtserkennung in Bildern würde versuchen zu definieren, was ein Gesicht ist (runde hautähnliche Scheibe mit dunklem Bereich, in dem Sie die Augen erwarten usw.). Ein Algorithmus für maschinelles Lernen hätte keine solche codierte Definition, sondern würde "anhand von Beispielen lernen": Sie zeigen mehrere Bilder von Gesichtern und Nichtgesichtern, und ein guter Algorithmus lernt schließlich und kann vorhersagen, ob ein Unsichtbarer vorhanden ist oder nicht Bild ist ein Gesicht.
Dieses spezielle Beispiel der Gesichtserkennung wird überwacht , was bedeutet , dass Ihre Beispiele werden müssen beschriftet oder explizit sagen , welche sind Gesichter und welche nicht.
In einem unbeaufsichtigten Algorithmus sind Ihre Beispiele nicht beschriftet , dh Sie sagen nichts. Natürlich in einem solchen Fall der Algorithmus selbst kann nicht „erfinden“ , was für ein Gesicht, aber es kann versuchen , gruppieren , die Daten in verschiedene Gruppen, zum Beispiel kann es unterscheiden , dass Gesichter von Landschaften sind sehr unterschiedlich, die von Pferden sehr unterschiedlich sind.
Da eine andere Antwort dies erwähnt (allerdings auf falsche Weise): Es gibt "Zwischenformen" der Aufsicht, dh halbüberwachtes und aktives Lernen . Technisch gesehen handelt es sich hierbei um überwachte Methoden, bei denen es eine "intelligente" Möglichkeit gibt, eine große Anzahl von gekennzeichneten Beispielen zu vermeiden. Beim aktiven Lernen entscheidet der Algorithmus selbst, welche Sache Sie beschriften sollen (z. B. kann er sich über eine Landschaft und ein Pferd ziemlich sicher sein, fordert Sie jedoch möglicherweise auf, zu bestätigen, ob ein Gorilla tatsächlich das Bild eines Gesichts ist). Beim halbüberwachten Lernen gibt es zwei verschiedene Algorithmen, die mit den beschrifteten Beispielen beginnen und sich dann gegenseitig "erzählen", wie sie über eine große Anzahl unbeschrifteter Daten denken. Aus dieser "Diskussion" lernen sie.
Überwachtes Lernen ist, wenn die Daten, mit denen Sie Ihren Algorithmus füttern, "markiert" oder "beschriftet" sind, damit Ihre Logik Entscheidungen treffen kann.
Beispiel: Bayes-Spamfilterung, bei der Sie ein Element als Spam markieren müssen, um die Ergebnisse zu verfeinern.
Unbeaufsichtigtes Lernen sind Arten von Algorithmen, die versuchen, Korrelationen ohne externe Eingaben außer den Rohdaten zu finden.
Beispiel: Data Mining-Clustering-Algorithmen.
Anwendungen, bei denen die Trainingsdaten Beispiele der Eingabevektoren zusammen mit ihren entsprechenden Zielvektoren umfassen, werden als überwachte Lernprobleme bezeichnet.
Bei anderen Mustererkennungsproblemen bestehen die Trainingsdaten aus einem Satz von Eingabevektoren x ohne entsprechende Zielwerte. Das Ziel bei solchen unbeaufsichtigten Lernproblemen kann darin bestehen, Gruppen ähnlicher Beispiele in den Daten zu entdecken, wo es als Clustering bezeichnet wird
Mustererkennung und maschinelles Lernen (Bishop, 2006)
Beim überwachten Lernen wird die Eingabe x
mit dem erwarteten Ergebnis y
(dh der Ausgabe, die das Modell erzeugen soll, wenn die Eingabe erfolgt x
) bereitgestellt , das häufig als "Klasse" (oder "Bezeichnung") der entsprechenden Eingabe bezeichnet wird x
.
Beim unbeaufsichtigten Lernen wird die "Klasse" eines Beispiels x
nicht angegeben. Unbeaufsichtigtes Lernen kann daher als Auffinden einer "verborgenen Struktur" in einem unbeschrifteten Datensatz angesehen werden.
Ansätze für überwachtes Lernen umfassen:
Klassifizierung (1R, Naive Bayes, Lernalgorithmus für Entscheidungsbäume wie ID3 CART usw.)
Vorhersage numerischer Werte
Ansätze für unbeaufsichtigtes Lernen umfassen:
Clustering (K-bedeutet, hierarchisches Clustering)
Assoziationsregel lernen
Zum Beispiel wird das Training eines neuronalen Netzwerks sehr oft überwacht überwacht: Sie teilen dem Netzwerk mit, welcher Klasse der Merkmalsvektor entspricht, den Sie füttern.
Clustering ist unbeaufsichtigtes Lernen: Sie lassen den Algorithmus entscheiden, wie Stichproben in Klassen gruppiert werden sollen, die gemeinsame Eigenschaften haben.
Ein weiteres Beispiel für unbeaufsichtigtes Lernen sind Kohonens selbstorganisierende Karten .
Ich kann Ihnen ein Beispiel nennen.
Angenommen, Sie müssen erkennen, welches Fahrzeug ein Auto und welches ein Motorrad ist.
Im Fall des überwachten Lernens muss Ihr Eingabedatensatz (Trainingsdatensatz) gekennzeichnet sein, dh für jedes Eingabeelement in Ihrem Eingabedatensatz (Trainingsdatensatz) sollten Sie angeben, ob es sich um ein Auto oder ein Motorrad handelt.
Im unbeaufsichtigten Lernfall kennzeichnen Sie die Eingaben nicht. Das unbeaufsichtigte Modell gruppiert die Eingabe in Cluster, z. B. basierend auf ähnlichen Merkmalen / Eigenschaften. In diesem Fall gibt es also keine Labels wie "Auto".
Überwachtes Lernen
Das überwachte Lernen basiert auf dem Training einer Datenprobe aus einer Datenquelle mit bereits zugewiesener korrekter Klassifizierung. Solche Techniken werden in Feedforward- oder MultiLayer Perceptron (MLP) -Modellen verwendet. Diese MLP haben drei charakteristische Merkmale:
Diese Eigenschaften lösen zusammen mit dem Lernen durch Training schwierige und vielfältige Probleme. Lernen durch Training in einem überwachten ANN-Modell, auch als Fehler-Backpropagation-Algorithmus bezeichnet. Der Fehlerkorrektur-Lernalgorithmus trainiert das Netzwerk basierend auf den Eingabe-Ausgabe-Abtastwerten und findet ein Fehlersignal, das die Differenz zwischen der berechneten Ausgabe und der gewünschten Ausgabe darstellt, und passt die synaptischen Gewichte der Neuronen an, die proportional zum Produkt des Fehlers sind Signal und die Eingangsinstanz des synaptischen Gewichts. Basierend auf diesem Prinzip erfolgt das Lernen der Fehlerrückübertragung in zwei Durchgängen:
Vorwärtspass:
Hier wird dem Netzwerk ein Eingabevektor präsentiert. Dieses Eingangssignal breitet sich Neuron für Neuron vorwärts durch das Netzwerk aus und tritt am Ausgangsende des Netzwerks als Ausgangssignal aus: y(n) = φ(v(n))
Wo v(n)
ist das induzierte lokale Feld eines Neurons definiert durch v(n) =Σ w(n)y(n).
Die Ausgabe, die an der Ausgangsschicht o (n) berechnet wird, ist verglichen mit der gewünschten Antwort d(n)
und findet den Fehler e(n)
für dieses Neuron. Die synaptischen Gewichte des Netzwerks während dieses Durchlaufs bleiben gleich.
Rückwärtspass:
Das Fehlersignal, das vom Ausgangsneuron dieser Schicht stammt, wird durch das Netzwerk rückwärts übertragen. Dies berechnet den lokalen Gradienten für jedes Neuron in jeder Schicht und ermöglicht es den synaptischen Gewichten des Netzwerks, Änderungen gemäß der Delta-Regel wie folgt zu erfahren:
Δw(n) = η * δ(n) * y(n).
Diese rekursive Berechnung wird fortgesetzt, wobei für jedes Eingabemuster ein Vorwärtsdurchlauf gefolgt von einem Rückwärtsdurchlauf folgt, bis das Netzwerk konvergiert.
Das überwachte Lernparadigma eines ANN ist effizient und findet Lösungen für verschiedene lineare und nichtlineare Probleme wie Klassifizierung, Anlagensteuerung, Vorhersage, Vorhersage, Robotik usw.
Unbeaufsichtigtes Lernen
Selbstorganisierende neuronale Netze lernen mithilfe eines unbeaufsichtigten Lernalgorithmus, um verborgene Muster in unbeschrifteten Eingabedaten zu identifizieren. Dies unbeaufsichtigt bezieht sich auf die Fähigkeit, Informationen zu lernen und zu organisieren, ohne ein Fehlersignal zur Bewertung der möglichen Lösung bereitzustellen. Das Fehlen einer Richtung für den Lernalgorithmus beim unbeaufsichtigten Lernen kann manchmal vorteilhaft sein, da der Algorithmus auf Muster zurückblicken kann, die zuvor nicht berücksichtigt wurden. Die Hauptmerkmale von selbstorganisierenden Karten (SOM) sind:
Die Rechenschicht wird auch als Konkurrenzschicht bezeichnet, da die Neuronen in der Schicht miteinander konkurrieren, um aktiv zu werden. Daher wird dieser Lernalgorithmus als Konkurrenzalgorithmus bezeichnet. Der unbeaufsichtigte Algorithmus in SOM arbeitet in drei Phasen:
Wettbewerbsphase:
Für jedes Eingabemuster x
, das dem Netzwerk präsentiert wird, wird das innere Produkt mit dem synaptischen Gewicht w
berechnet und die Neuronen in der Konkurrenzschicht finden eine Diskriminanzfunktion, die eine Konkurrenz zwischen den Neuronen und dem synaptischen Gewichtsvektor induziert, der in der euklidischen Entfernung nahe am Eingabevektor liegt wird als Gewinner des Wettbewerbs bekannt gegeben. Dieses Neuron wird als am besten passendes Neuron bezeichnet.
i.e. x = arg min ║x - w║.
Kooperationsphase:
Das siegreiche Neuron bestimmt das Zentrum einer topologischen Nachbarschaft h
kooperierender Neuronen. Dies wird durch die laterale Wechselwirkung d
zwischen den kooperativen Neuronen durchgeführt. Diese topologische Nachbarschaft verringert ihre Größe über einen bestimmten Zeitraum.
Anpassungsphase:
ermöglicht es dem siegreichen Neuron und seinen Nachbarschaftsneuronen, ihre individuellen Werte der Diskriminanzfunktion in Bezug auf das Eingabemuster durch geeignete synaptische Gewichtsanpassungen zu erhöhen.
Δw = ηh(x)(x –w).
Bei wiederholter Darstellung der Trainingsmuster tendieren die synaptischen Gewichtsvektoren dazu, der Verteilung der Eingabemuster aufgrund der Nachbarschaftsaktualisierung zu folgen, und somit lernt ANN ohne Supervisor.
Das selbstorganisierende Modell repräsentiert auf natürliche Weise das neurobiologische Verhalten und wird daher in vielen realen Anwendungen wie Clustering, Spracherkennung, Textur-Segmentierung, Vektorkodierung usw. verwendet.
Ich habe die Unterscheidung zwischen unbeaufsichtigtem und überwachtem Lernen immer als willkürlich und etwas verwirrend empfunden. Es gibt keinen wirklichen Unterschied zwischen den beiden Fällen, stattdessen gibt es eine Reihe von Situationen, in denen ein Algorithmus mehr oder weniger "überwacht" werden kann. Die Existenz von halbüberwachtem Lernen ist ein offensichtliches Beispiel dafür, wo die Linie verwischt ist.
Ich neige dazu, Supervision als Feedback an den Algorithmus zu betrachten, welche Lösungen bevorzugt werden sollten. Bei einer herkömmlichen überwachten Einstellung wie der Spam-Erkennung teilen Sie dem Algorithmus mit, dass "im Trainingssatz keine Fehler gemacht werden" . Bei einer herkömmlichen unbeaufsichtigten Einstellung wie Clustering teilen Sie dem Algorithmus mit, dass "Punkte, die nahe beieinander liegen, sich im selben Cluster befinden sollten" . Es ist einfach so, dass die erste Form des Feedbacks viel spezifischer ist als die letztere.
Kurz gesagt, wenn jemand "überwacht" sagt, denken Sie an Klassifizierung, wenn er "unbeaufsichtigt" sagt, denken Sie an Clustering und versuchen Sie, sich darüber hinaus nicht zu viele Sorgen zu machen.
Maschinelles Lernen: Es untersucht das Studium und die Konstruktion von Algorithmen, die aus Daten lernen und Vorhersagen treffen können. Bei solchen Algorithmen wird ein Modell aus Beispieleingaben erstellt, um datengesteuerte Vorhersagen oder Entscheidungen zu treffen, die als Ausgaben ausgedrückt werden, anstatt streng statisch zu folgen Programmanweisungen.
Überwachtes Lernen: Es ist die maschinelle Lernaufgabe, eine Funktion aus gekennzeichneten Trainingsdaten abzuleiten. Die Trainingsdaten bestehen aus einer Reihe von Trainingsbeispielen. Beim überwachten Lernen ist jedes Beispiel ein Paar, das aus einem Eingabeobjekt (typischerweise einem Vektor) und einem gewünschten Ausgabewert (auch als Überwachungssignal bezeichnet) besteht. Ein überwachter Lernalgorithmus analysiert die Trainingsdaten und erzeugt eine abgeleitete Funktion, die zur Abbildung neuer Beispiele verwendet werden kann.
Dem Computer werden Beispieleingaben und ihre gewünschten Ausgaben präsentiert, die von einem "Lehrer" gegeben werden. Ziel ist es, eine allgemeine Regel zu lernen, die Eingaben auf Ausgaben abbildet. Insbesondere verwendet ein überwachter Lernalgorithmus einen bekannten Satz von Eingabedaten und bekannten Antworten auf die Daten (Ausgabe) und trainiert ein Modell, um vernünftige Vorhersagen für die Reaktion auf neue Daten zu generieren.
Unbeaufsichtigtes Lernen: Es ist Lernen ohne Lehrer. Eine grundlegende Sache, die Sie mit Daten tun möchten, ist die Visualisierung. Es ist die Aufgabe des maschinellen Lernens, aus unbeschrifteten Daten eine Funktion zur Beschreibung der verborgenen Struktur abzuleiten. Da die dem Lernenden gegebenen Beispiele nicht gekennzeichnet sind, gibt es kein Fehler- oder Belohnungssignal zur Bewertung einer möglichen Lösung. Dies unterscheidet unbeaufsichtigtes Lernen von überwachtem Lernen. Unüberwachtes Lernen verwendet Verfahren, die versuchen, natürliche Partitionen von Mustern zu finden.
Beim unbeaufsichtigten Lernen gibt es kein Feedback basierend auf den Vorhersageergebnissen, dh es gibt keinen Lehrer, der Sie korrigiert. Unter den unbeaufsichtigten Lernmethoden werden keine gekennzeichneten Beispiele bereitgestellt und es gibt keine Vorstellung von der Ausgabe während des Lernprozesses. Infolgedessen ist es Sache des Lernschemas / -modells, Muster zu finden oder die Gruppen der Eingabedaten zu ermitteln
Sie sollten unbeaufsichtigte Lernmethoden verwenden, wenn Sie eine große Datenmenge zum Trainieren Ihrer Modelle sowie die Bereitschaft und Fähigkeit zum Experimentieren und Erkunden benötigen, und natürlich eine Herausforderung, die mit etablierteren Methoden nicht gut gelöst werden kann. Mit unbeaufsichtigtem Lernen Es ist möglich, größere und komplexere Modelle zu lernen als mit überwachtem Lernen. Hier ist ein gutes Beispiel dafür
.
Betreutes Lernen: Sagen wir, ein Kind geht in den Kindergarten. hier zeigt ihm der lehrer 3 spielzeughaus, ball und auto. Jetzt gibt ihm der Lehrer 10 Spielsachen. Er wird sie basierend auf seinen bisherigen Erfahrungen in 3 Kisten mit Haus, Ball und Auto einteilen. Daher wurde das Kind zuerst von Lehrern beaufsichtigt, um für einige Sätze die richtigen Antworten zu erhalten. dann wurde er an unbekannten Spielzeugen getestet.
Unbeaufsichtigtes Lernen: wieder ein Beispiel für einen Kindergarten. Ein Kind bekommt 10 Spielsachen. er soll ähnliche segmentieren. Basierend auf Merkmalen wie Form, Größe, Farbe, Funktion usw. wird er versuchen, 3 Gruppen dazu zu bringen, A, B, C zu sagen und sie zu gruppieren.
Das Wort "Überwachen" bedeutet, dass Sie die Maschine beaufsichtigen / anweisen, um Antworten zu finden. Sobald es Anweisungen gelernt hat, kann es leicht für neue Fälle vorhersagen.
Unbeaufsichtigt bedeutet, dass es keine Überwachung oder Anweisung gibt, wie Antworten / Etiketten zu finden sind, und dass die Maschine ihre Intelligenz verwendet, um ein Muster in unseren Daten zu finden. Hier wird keine Vorhersage getroffen, sondern nur versucht, Cluster mit ähnlichen Daten zu finden.
Es gibt bereits viele Antworten, die die Unterschiede im Detail erklären. Ich habe diese Gifs in der Codeacademy gefunden und sie helfen mir oft, die Unterschiede effektiv zu erklären.
Beachten Sie, dass die Trainingsbilder hier Beschriftungen haben und dass das Modell die Namen der Bilder lernt.
Beachten Sie, dass hier nur gruppiert (gruppiert) wird und das Modell nichts über ein Bild weiß.
Der Lernalgorithmus eines neuronalen Netzwerks kann entweder überwacht oder unbeaufsichtigt sein.
Ein neuronales Netz soll überwacht lernen, wenn die gewünschte Ausgabe bereits bekannt ist. Beispiel: Musterzuordnung
Neuronale Netze, die unbeaufsichtigt lernen, haben keine solchen Zielausgaben. Es kann nicht bestimmt werden, wie das Ergebnis des Lernprozesses aussehen wird. Während des Lernprozesses werden die Einheiten (Gewichtswerte) eines solchen neuronalen Netzes in Abhängigkeit von gegebenen Eingabewerten innerhalb eines bestimmten Bereichs "angeordnet". Ziel ist es, ähnliche Einheiten in bestimmten Bereichen des Wertebereichs eng zusammen zu gruppieren. Beispiel: Musterklassifizierung
Überwachtes Lernen, gegeben die Daten mit einer Antwort.
Lernen Sie einen Spam-Filter, wenn Sie eine E-Mail mit der Bezeichnung "Spam / Nicht-Spam" erhalten.
Lernen Sie anhand eines Datensatzes von Patienten, bei denen Diabetes diagnostiziert wurde oder nicht, neue Patienten als Diabetes zu klassifizieren oder nicht.
Unbeaufsichtigtes Lernen, angesichts der Daten ohne Antwort, lassen Sie den PC Dinge gruppieren.
Gruppieren Sie anhand einer Reihe von Nachrichtenartikeln im Internet die Artikel zu derselben Geschichte.
Ermitteln Sie anhand einer Datenbank mit benutzerdefinierten Daten automatisch Marktsegmente und gruppieren Sie Kunden in verschiedene Marktsegmente.
Überwachtes Lernen
Dabei wird jedem Eingabemuster, das zum Trainieren des Netzwerks verwendet wird, ein Ausgabemuster zugeordnet, das das Ziel oder das gewünschte Muster ist. Es wird angenommen, dass ein Lehrer während des Lernprozesses anwesend ist, wenn ein Vergleich zwischen der berechneten Ausgabe des Netzwerks und der korrekten erwarteten Ausgabe durchgeführt wird, um den Fehler zu bestimmen. Der Fehler kann dann verwendet werden, um Netzwerkparameter zu ändern, was zu einer Verbesserung der Leistung führt.
Unbeaufsichtigtes Lernen
Bei dieser Lernmethode wird die Zielausgabe dem Netzwerk nicht präsentiert. Es ist, als ob es keinen Lehrer gibt, der das gewünschte Muster präsentiert, und daher lernt das System von selbst, indem es strukturelle Merkmale in den Eingabemustern entdeckt und an diese anpasst.
Überwachtes Lernen : Sie geben verschieden beschriftete Beispieldaten als Eingabe zusammen mit den richtigen Antworten. Dieser Algorithmus lernt daraus und beginnt anhand der darauf folgenden Eingaben mit der Vorhersage korrekter Ergebnisse. Beispiel : E-Mail-Spam-Filter
Unbeaufsichtigtes Lernen : Sie geben nur Daten an und erzählen nichts - wie Etiketten oder richtige Antworten. Der Algorithmus analysiert automatisch Muster in den Daten. Beispiel : Google News
Ich werde versuchen, es einfach zu halten.
Überwachtes Lernen: Bei dieser Lerntechnik erhalten wir einen Datensatz und das System kennt bereits die korrekte Ausgabe des Datensatzes. Hier lernt unser System also, indem es einen eigenen Wert vorhersagt. Anschließend wird eine Genauigkeitsprüfung durchgeführt, indem mithilfe einer Kostenfunktion überprüft wird, wie nahe die Vorhersage an der tatsächlichen Ausgabe lag.
Unbeaufsichtigtes Lernen: Bei diesem Ansatz wissen wir wenig oder gar nicht, wie unser Ergebnis aussehen würde. Stattdessen leiten wir die Struktur aus den Daten ab, bei denen wir den Effekt der Variablen nicht kennen. Wir strukturieren, indem wir die Daten basierend auf der Beziehung zwischen der Variablen in den Daten gruppieren. Hier haben wir kein Feedback, das auf unserer Vorhersage basiert.
Sie haben die Eingabe x und eine Zielausgabe t. Sie trainieren also den Algorithmus, um auf die fehlenden Teile zu verallgemeinern. Es wird überwacht, weil das Ziel gegeben ist. Sie sind der Supervisor, der dem Algorithmus sagt: Für das Beispiel x sollten Sie t ausgeben!
Obwohl Segmentierung, Clustering und Komprimierung normalerweise in dieser Richtung gezählt werden, fällt es mir schwer, eine gute Definition dafür zu finden.
Nehmen wir als Beispiel Auto-Encoder für die Komprimierung . Während Sie nur die Eingabe x angegeben haben, teilt der menschliche Ingenieur dem Algorithmus mit, dass das Ziel auch x ist. In gewissem Sinne unterscheidet sich dies nicht vom überwachten Lernen.
Und für Clustering und Segmentierung bin ich mir nicht sicher, ob es wirklich zur Definition von maschinellem Lernen passt (siehe andere Frage ).
Überwachtes Lernen: Sie haben Daten gekennzeichnet und müssen daraus lernen. zB Hausdaten zusammen mit dem Preis und dann lernen, den Preis vorherzusagen
Unbeaufsichtigtes Lernen: Sie müssen den Trend finden und dann vorhersagen, dass keine vorherigen Bezeichnungen vergeben wurden. zB verschiedene Leute in der Klasse und dann kommt eine neue Person, also zu welcher Gruppe gehört dieser neue Schüler?
Im überwachten Lernen wissen wir, wie die Eingabe und Ausgabe sein sollte. Zum Beispiel bei einer Reihe von Autos. Wir müssen herausfinden, welche rot und welche blau sind.
Während beim unbeaufsichtigten Lernen die Antwort mit sehr wenig oder ohne Ahnung, wie die Ausgabe sein sollte, herausgefunden werden muss. Zum Beispiel könnte ein Lernender in der Lage sein, ein Modell zu erstellen, das erkennt, wann Menschen lächeln, basierend auf der Korrelation von Gesichtsmustern und Wörtern wie "Worüber lächelst du?".
Überwachtes Lernen kann einen neuen Gegenstand basierend auf dem Lernen während des Trainings in eines der trainierten Labels einordnen. Sie müssen eine große Anzahl von Trainingsdatensätzen, Validierungsdatensätzen und Testdatensätzen bereitstellen. Wenn Sie beispielsweise Pixelbildvektoren von Ziffern zusammen mit Trainingsdaten mit Beschriftungen bereitstellen, kann dies die Zahlen identifizieren.
Unbeaufsichtigtes Lernen erfordert keine Trainingsdatensätze. Beim unbeaufsichtigten Lernen können Elemente basierend auf den Unterschieden in den Eingabevektoren in verschiedene Cluster gruppiert werden. Wenn Sie Pixelbildvektoren mit Ziffern bereitstellen und diese in 10 Kategorien einteilen, kann dies der Fall sein. Es kann jedoch beschriftet werden, da Sie keine Schulungsbeschriftungen bereitgestellt haben.
Beim überwachten Lernen haben Sie im Grunde Eingabevariablen (x) und Ausgabevariablen (y) und verwenden einen Algorithmus, um die Zuordnungsfunktion von der Eingabe zur Ausgabe zu lernen. Der Grund, warum wir dies als überwacht bezeichnet haben, ist, dass der Algorithmus aus dem Trainingsdatensatz lernt und iterativ Vorhersagen über die Trainingsdaten macht. Überwacht haben zwei Arten - Klassifizierung und Regression. Klassifizierung ist, wenn die Ausgabevariable eine Kategorie wie Ja / Nein, Wahr / Falsch ist. Regression ist, wenn die Ausgabe reale Werte wie Körpergröße, Temperatur usw. ist.
Unter UN-überwachtem Lernen haben wir nur Eingabedaten (X) und keine Ausgabevariablen. Dies wird als unbeaufsichtigtes Lernen bezeichnet, da es im Gegensatz zum oben genannten überwachten Lernen keine richtigen Antworten und keinen Lehrer gibt. Algorithmen sind ihren eigenen Geräten überlassen, um die interessante Struktur in den Daten zu entdecken und darzustellen.
Arten des unbeaufsichtigten Lernens sind Clustering und Assoziation.
Überwachtes Lernen ist im Grunde eine Technik, bei der die Trainingsdaten, von denen die Maschine lernt, bereits beschriftet sind. Dies ist ein einfacher Klassifikator für gerade ungerade Zahlen, bei dem Sie die Daten bereits während des Trainings klassifiziert haben. Daher werden "LABELED" -Daten verwendet.
Unbeaufsichtigtes Lernen ist im Gegenteil eine Technik, bei der die Maschine selbst die Daten beschriftet. Oder Sie können sagen, dass dies der Fall ist, wenn die Maschine von Grund auf von selbst lernt.
In Simple Supervised Learning handelt es sich um eine Art maschinelles Lernproblem, bei dem wir einige Bezeichnungen haben. Mit diesen Bezeichnungen implementieren wir Algorithmen wie Regression und Klassifizierung. Die Klassifizierung wird angewendet, wenn unsere Ausgabe wie in Form von 0 oder 1 ist, wahr / falsch, ja Nein. und Regression wird angewendet, wenn ein realer Wert ein solches Preishaus darstellt
Unüberwachtes Lernen ist eine Art maschinelles Lernproblem, bei dem wir keine Beschriftungen haben. Dies bedeutet, dass wir nur einige Daten und unstrukturierte Daten haben und die Daten (Gruppierung von Daten) mithilfe verschiedener unbeaufsichtigter Algorithmen gruppieren müssen
Überwachtes maschinelles Lernen
"Der Prozess eines Algorithmus, der aus dem Trainingsdatensatz lernt und die Ausgabe vorhersagt."
Genauigkeit der vorhergesagten Ausgabe direkt proportional zu den Trainingsdaten (Länge)
Beim überwachten Lernen haben Sie Eingabevariablen (x) (Trainingsdatensatz) und eine Ausgabevariable (Y) (Testdatensatz) und verwenden einen Algorithmus, um die Zuordnungsfunktion von der Eingabe zur Ausgabe zu lernen.
Y = f(X)
Haupttypen:
Algorithmen:
Klassifizierungsalgorithmen:
Neural Networks
Naïve Bayes classifiers
Fisher linear discriminant
KNN
Decision Tree
Super Vector Machines
Vorhersagealgorithmen:
Nearest neighbor
Linear Regression,Multi Regression
Anwendungsbereiche:
Spracherkennung
Sagen Sie voraus, ob die Personalabteilung einen bestimmten Kandidaten auswählt oder nicht
Prognostizieren Sie den Börsenkurs
Betreutes Lernen :
Ein überwachter Lernalgorithmus analysiert die Trainingsdaten und erzeugt eine abgeleitete Funktion, die zur Abbildung neuer Beispiele verwendet werden kann.
Problemkategorien:
Regression: Vorhersage der Ergebnisse innerhalb einer kontinuierlichen Ausgabe => Zuordnung von Eingabevariablen zu einer kontinuierlichen Funktion.
Beispiel:
Sagen Sie anhand eines Bildes einer Person ihr Alter voraus
Klassifizierung: Vorhersage der Ergebnisse in einer diskreten Ausgabe => Zuordnung von Eingabevariablen zu diskreten Kategorien
Beispiel:
Ist dieser Zunder krebsartig?
Unbeaufsichtigtes Lernen:
Unbeaufsichtigtes Lernen lernt aus Testdaten, die nicht gekennzeichnet, klassifiziert oder kategorisiert wurden. Unbeaufsichtigtes Lernen identifiziert Gemeinsamkeiten in den Daten und reagiert basierend auf dem Vorhandensein oder Fehlen solcher Gemeinsamkeiten in jedem neuen Datenelement.
Wir können diese Struktur ableiten, indem wir die Daten basierend auf den Beziehungen zwischen den Variablen in den Daten gruppieren.
Es gibt keine Rückmeldung basierend auf den Vorhersageergebnissen.
Problemkategorien:
Clustering: ist die Aufgabe, eine Gruppe von Objekten so zu gruppieren, dass Objekte in derselben Gruppe (als Cluster bezeichnet) einander (in gewissem Sinne) ähnlicher sind als Objekte in anderen Gruppen (Cluster).
Beispiel:
Nehmen Sie eine Sammlung von 1.000.000 verschiedenen Genen und finden Sie eine Möglichkeit, diese Gene automatisch in Gruppen zu gruppieren, die in irgendeiner Weise ähnlich sind oder durch verschiedene Variablen wie Lebensdauer, Standort, Rollen usw. in Beziehung stehen .
Beliebte Anwendungsfälle sind hier aufgelistet.
Unterschied zwischen Klassifizierung und Clustering beim Data Mining?
Verweise:
Überwachtes Lernen
Unbeaufsichtigtes Lernen
Beispiel:
Überwachtes Lernen:
Eine Tasche mit Orange
=> Modell erstellen
Eine gemischte Tüte Apfel und Orange.
=> Bitte klassifizieren
Unbeaufsichtigtes Lernen:
Eine gemischte Tüte Apfel und Orange.
=> Modell erstellen
Noch eine gemischte Tüte
=> Bitte klassifizieren
In einfachen Worten .. :) Es ist mein Verständnis, zögern Sie nicht zu korrigieren. Überwachtes Lernen ist, wir wissen, was wir auf der Grundlage der bereitgestellten Daten vorhersagen. Wir haben also eine Spalte im Datensatz, die vorhergesagt werden muss. Unbeaufsichtigtes Lernen ist, wir versuchen, die Bedeutung aus dem bereitgestellten Datensatz zu extrahieren. Wir haben keine Klarheit darüber, was vorhergesagt werden soll. Die Frage ist also, warum wir das tun? .. :) Die Antwort lautet: Das Ergebnis des unbeaufsichtigten Lernens sind Gruppen / Cluster (ähnliche Daten zusammen). Wenn wir also neue Daten erhalten, verknüpfen wir diese mit dem identifizierten Cluster / der identifizierten Gruppe und verstehen deren Funktionen.
Ich hoffe es hilft dir.
überwachtes Lernen
Beim überwachten Lernen kennen wir die Ausgabe der Roheingabe, dh die Daten sind so gekennzeichnet, dass sie während des Trainings des maschinellen Lernmodells verstehen, was sie in der Ausgabe des Ergebnisses erkennen müssen, und das System während des Trainings dazu führen Erkennen Sie die vorbeschrifteten Objekte auf dieser Basis. Dadurch werden die ähnlichen Objekte erkannt, die wir im Training bereitgestellt haben.
Hier wissen die Algorithmen, wie Daten strukturiert und strukturiert sind. Überwachtes Lernen wird zur Klassifizierung verwendet
Als Beispiel können wir verschiedene Objekte haben, deren Formen quadratisch, kreisförmig oder dreieckig sind. Unsere Aufgabe besteht darin, die gleichen Arten von Formen anzuordnen, für die der beschriftete Datensatz alle Formen beschriftet hat, und wir werden das Modell des maschinellen Lernens für diesen Datensatz weiter trainieren Auf der Grundlage des Trainingsdatensatzes werden die Formen erkannt.
Unbeaufsichtigtes Lernen
Unüberwachtes Lernen ist ein ungeführtes Lernen, bei dem das Endergebnis nicht bekannt ist. Es gruppiert den Datensatz und teilt die Objekte basierend auf ähnlichen Eigenschaften des Objekts in verschiedene Gruppen auf und erkennt die Objekte.
Hier suchen Algorithmen nach dem unterschiedlichen Muster in den Rohdaten und gruppieren darauf basierend die Daten. Unüberwachtes Lernen wird zum Clustering verwendet.
Als Beispiel können wir verschiedene Objekte mit mehreren Formen als Quadrat, Kreis oder Dreieck haben, sodass die Bündel basierend auf den Objekteigenschaften erstellt werden. Wenn ein Objekt vier Seiten hat, wird es als quadratisch betrachtet, und wenn es drei Seiten hat, Dreieck und Wenn keine Seiten als Kreis, hier die Daten nicht beschriftet sind, lernt es selbst, die verschiedenen Formen zu erkennen
Maschinelles Lernen ist ein Bereich, in dem Sie versuchen, Maschinen zu erstellen, um das menschliche Verhalten nachzuahmen.
Sie trainieren Maschinen wie ein Baby. Die Art und Weise, wie Menschen lernen, Merkmale identifizieren, Muster erkennen und sich selbst trainieren, genauso wie Sie Maschinen trainieren, indem Sie Daten mit verschiedenen Merkmalen füttern. Der Maschinenalgorithmus identifiziert das Muster innerhalb der Daten und klassifiziert es in eine bestimmte Kategorie.
Maschinelles Lernen wird grob in zwei Kategorien unterteilt: überwachtes und unbeaufsichtigtes Lernen.
Überwachtes Lernen ist das Konzept, bei dem Sie Eingabevektoren / Daten mit entsprechendem Zielwert (Ausgabe) haben. Andererseits ist unbeaufsichtigtes Lernen das Konzept, bei dem Sie nur Eingabevektoren / Daten ohne entsprechenden Zielwert haben.
Ein Beispiel für überwachtes Lernen ist die Erkennung handgeschriebener Ziffern, bei der Sie ein Bild von Ziffern mit der entsprechenden Ziffer [0-9] haben. Ein Beispiel für unbeaufsichtigtes Lernen ist die Gruppierung von Kunden nach Kaufverhalten.