Wie heißt der Operator, der einen kategorialen Vektor nimmt und ihn mithilfe einer One-Hot-Codierung in die binäre Darstellung umwandelt? Ich frage mich, da ich eine wissenschaftliche Arbeit schreibe und dafür einen richtigen Namen brauche.
Wie heißt der Operator, der einen kategorialen Vektor nimmt und ihn mithilfe einer One-Hot-Codierung in die binäre Darstellung umwandelt? Ich frage mich, da ich eine wissenschaftliche Arbeit schreibe und dafür einen richtigen Namen brauche.
Antworten:
Statistiker bezeichnen One-Hot-Codierung als Dummy-Codierung . Wie andere vorgeschlagen haben (einschließlich Scortchi in den Kommentaren), ist dies kein genaues Synonym, aber dies ist der Begriff, der normalerweise für die 0-1-codierten kategorialen Variablen verwendet wird.
Siehe auch: "Dummy-Variable" versus "Indikatorvariable" für nominelle / kategoriale Daten
Das hängt von Ihrer Zielgruppe ab.
Wie Tim sagte, nennen Statistiker es Dummy-Codierung, und das würde ich erwarten, wenn ich so etwas wie ein Regressionsmodell beschreibe. "Dummy-codierte Variablen wurden hinzugefügt, um den Standort des Geschäfts anzupassen." Ich denke, es eine One-Hot-Codierung zu nennen, würde hier etwas seltsam erscheinen.
Wie ein anderer Tim ebenfalls sagte, ist One-Hot-Codierung in der Literatur zum maschinellen Lernen ziemlich verbreitet. Es impliziert schwach die Existenz von Knoten (wie in einem neuronalen Netzwerk), physischen Drähten (in einem Gerät) oder so etwas, zumindest für mich.
Der Begriff stammt aus der Elektronik. Denken Sie nur, wer würde 1 "heiß" nennen? Nur diejenigen, die mit Elektrizität arbeiten, bei denen "heiß" oder "leben" bedeutet, dass elektrisches Potenzial am Kabel vorhanden ist . "One hot" bezieht sich auf das Schaltungsdesign, bei dem der diskrete elektrische Signalpegel auf einem Draht auf einem Satz von Drähten in heiß / kalt decodiert wird. Ich nehme an, einige Leute mit maschinellem Lernen und EE-Hintergrund fanden die Analogie überzeugend.
In Ökonometrie und Statistik auftreten können , dummy
oder indicator
Variablen, die sehr ähnlich sind , weil diese unterschiedliche Kategorien mit ihren deutlichen Indikatoren darstellen, verwendet. Es gibt jedoch einen subtilen Unterschied. Zum Beispiel machen Sie K-1-Dummies für K-Kategorien, weil die Basiskategorie allen Dummies entspricht, die auf 0 gesetzt sind. Im Gegensatz dazu denke ich, dass Sie in einer Hot-Codierung K-Drähte haben, wobei die Basiskategorie einen eigenen Draht hat ( Variable).
Ich bin statistisch geschult und habe kürzlich von "One-Hot-Codierung" im Bereich maschinelles Lernen / Comp Sci Lit gehört. Ich habe die einhitzige Matrix normalerweise nur als Entwurfsmatrix / Datenmatrix / Entwurfsrahmen bezeichnet.
In den Naturwissenschaften und Ingenieurwissenschaften wird es das (verallgemeinerte) Kronecker-Delta genannt .
Das Kronecker-Delta ist in Sigma / Pi / Einstein / etc. Wirklich nützlich . Notationen, da damit Begriffe bedingt angegeben werden können.
Nur um dies mit gängigen Programmierstrukturen in Verbindung zu bringen, dem Kronecker-Delta condition?1:0
, wo ?:
der bedingte Operator ist .