Was ist der Unterschied zwischen einem Feature und einem Label?


100

Ich folge einem Tutorial über die Grundlagen des maschinellen Lernens und es wird erwähnt, dass etwas ein Feature oder eine Bezeichnung sein kann .

Soweit ich weiß, ist eine Funktion eine Eigenschaft von Daten, die verwendet werden. Ich kann nicht herausfinden, was das Etikett ist, ich kenne die Bedeutung des Wortes, aber ich möchte wissen, was es im Kontext des maschinellen Lernens bedeutet.


Features sind die Felder, die als Eingabe verwendet werden, und Beschriftungen, die als Ausgabe verwendet werden. Überlegen Sie sich als einfaches Beispiel, wie Sie vorhersagen können, ob ein Auto basierend auf Kilometerstand, Jahr usw. verkauft werden soll. Ja / Nein ist das Etikett, während Kilometerstand und Jahr die Merkmale sind.
amcneil206

Antworten:


199

Kurz gesagt, die Funktion wird eingegeben. Label wird ausgegeben. Dies gilt sowohl für Klassifizierungs- als auch für Regressionsprobleme.

Eine Funktion ist eine Spalte der Daten in Ihrem Eingabesatz. Wenn Sie beispielsweise vorhersagen möchten, welche Art von Haustier jemand wählen wird, können Sie unter anderem Alter, Heimatregion, Familieneinkommen usw. eingeben. Das Etikett ist die endgültige Wahl, z. B. Hund, Fisch, Leguan, Stein, etc.

Sobald Sie Ihr Modell trainiert haben, geben Sie ihm neue Eingaben, die diese Funktionen enthalten. Es wird das vorhergesagte "Etikett" (Haustiertyp) für diese Person zurückgegeben.


1
[Alter, Heimatregion, Familieneinkommen] wären also "3 Merkmalsvektoren". Und in Keras wäre Ihr NumPy-Array für Ihr LSTM-Netzwerk [Beispiele, Zeitschritte, 3]?
Naisanza

1
@naisanza: das ist sicherlich eine möglichkeit. Ich kenne Keras nicht, aber diese hochrangige Organisation könnte sicherlich der Beginn einer gültigen Implementierung sein.
Beschneiden Sie den

Ist Feature und Variable dasselbe?
Debadatta

Ich möchte darauf hinweisen, dass "label" auch vom Kontext abhängt; Zum Trainieren eines Modells verwenden Sie beispielsweise "beschriftete" Daten. In diesem Fall ist das Label die Grundwahrheit, mit der Ihre Ausgabedaten verglichen werden.
N.Atanasov

Beeindruckend. Tolle Antwort, danke, das klärt viele Fragen zu diesem Thema.
Andrew Ray

31

Feature:

Im maschinellen Lernen bedeutet Funktion Eigentum Ihrer Trainingsdaten. Oder Sie können einen Spaltennamen in Ihrem Trainingsdatensatz angeben.

Angenommen, dies ist Ihr Trainingsdatensatz

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

Dann ist hier Height, Sexund Agesind die Merkmale.

Etikette:

Die Ausgabe, die Sie nach dem Training von Ihrem Modell erhalten, wird als Etikett bezeichnet.

Angenommen , Sie die oben genannten Daten - Set zu einem gewissen Algorithmus eingespeist und erzeugen ein Modell Geschlecht als männlich oder weiblich, vorherzusagen, in dem obigen Modell Sie Funktionen übergeben , wie age, heightusw.

Nach der Berechnung wird das Geschlecht als männlich oder weiblich zurückgegeben. Das nennt man ein Label


5

Hier kommt ein visuellerer Ansatz, um das Konzept zu erklären. Stellen Sie sich vor, Sie möchten das auf einem Foto gezeigte Tier klassifizieren.

Die möglichen Tierklassen sind zB Katzen oder Vögel. In diesem Fall wäre das Etikett die mögliche Klassenassoziation, z. B. Katze oder Vogel, die Ihr Algorithmus für maschinelles Lernen vorhersagt.

Die Merkmale sind Muster, Farben, Formen, die Teil Ihrer Bilder sind, z. B. Pelz, Federn oder Pixelwerte auf niedrigerer Ebene.

Vogel Etikett: Vogel
Merkmale: Federn

Katze

Etikett: Katze
Merkmale: Pelz


5

Nehmen wir ein Beispiel, in dem wir das Alphabet anhand handgeschriebener Fotos erkennen möchten. Wir geben diese Beispielbilder in das Programm ein und das Programm klassifiziert diese Bilder anhand der Funktionen, die sie erhalten haben.

Ein Beispiel für ein Merkmal in diesem Zusammenhang ist: Der Buchstabe 'C'kann als konkav nach rechts gerichtet betrachtet werden.

Es stellt sich nun die Frage, wie diese Funktionen gespeichert werden sollen. Wir müssen sie benennen. Hier ist die Rolle des Labels, das entsteht. Ein Etikett wird auf solche Merkmale gegeben unterscheiden sie von anderen Funktionen.

Auf diese Weise erhalten wir Beschriftungen als Ausgabe, wenn Features als Eingabe bereitgestellt werden .

Etiketten sind nicht mit unbeaufsichtigtem Lernen verbunden.


4

Voraussetzung: Grundlegende Statistik und Exposition gegenüber ML (Lineare Regression)

Es kann in einem Satz beantwortet werden -

Sie sind gleich, aber ihre Definition ändert sich je nach den Notwendigkeiten.

Erläuterung

Lassen Sie mich meine Aussage erklären. Angenommen, Sie haben einen Datensatz, den Sie zu diesem Zweck berücksichtigen sollten exercise.csv. Jede Spalte im Datensatz wird als Features bezeichnet. Geschlecht, Alter, Größe, Herzfrequenz, Körpertemperatur und Kalorien können eine der verschiedenen Spalten sein. Jede Spalte repräsentiert unterschiedliche Merkmale oder Eigenschaften.

Übung.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Um das Verständnis zu festigen und das Rätsel zu lösen, nehmen wir zwei verschiedene Probleme (Vorhersagefall).

FALL 1: In diesem Fall könnten wir in Betracht ziehen, Geschlecht, Größe und Gewicht zu verwenden, um die während des Trainings verbrannten Kalorien vorherzusagen. Diese Vorhersage (Y) Kalorien hier ist ein Label . Kalorien ist die Spalte, die Sie mithilfe verschiedener Funktionen wie x1: Geschlecht, x2: Größe und x3: Gewicht vorhersagen möchten .

FALL 2: Im zweiten Fall möchten wir möglicherweise die Herzfrequenz vorhersagen, indem wir Geschlecht und Gewicht als Feature verwenden. Hier Heart_Rate ist ein Etikett vorhergesagt unter Verwendung von Funktionen - x1: Geschlecht und x2: Gewicht .

Sobald Sie die obige Erklärung verstanden haben, werden Sie nicht mehr wirklich mit Label und Features verwechselt.


3

Eine kurz erläuterte Funktion wäre die Eingabe, die Sie dem System zugeführt haben, und das Etikett wäre die Ausgabe, die Sie erwarten. Zum Beispiel haben Sie viele Merkmale eines Hundes wie seine Größe, Fellfarbe usw. gefüttert, sodass nach der Berechnung die Rasse des Hundes zurückgegeben wird, den Sie kennen möchten.


0

Angenommen, Sie möchten das Klima vorhersagen, dann sind die historischen Klimadaten, das aktuelle Wetter, die Temperatur, die Windgeschwindigkeit usw. und die Beschriftungen Monate. Die obige Kombination kann Ihnen helfen, Vorhersagen abzuleiten.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.