Vorhersage mehrerer Ziele oder Klassen?


12

Angenommen, ich erstelle ein Vorhersagemodell, in dem ich versuche, mehrere Ereignisse vorherzusagen (z. B. Würfelwurf und Münzwurf). Die meisten Algorithmen, mit denen ich vertraut bin, arbeiten mit nur einem Ziel, daher frage ich mich, ob es einen Standardansatz für solche Dinge gibt.

Ich sehe zwei mögliche Optionen. Der vielleicht naivste Ansatz wäre, sie einfach als zwei verschiedene Probleme zu behandeln und dann die Ergebnisse zu kombinieren. Dies hat jedoch schwerwiegende Nachteile, wenn die beiden Ziele nicht unabhängig sind (und in vielen Fällen sehr abhängig sein können).

Ein vernünftigerer Ansatz für mich wäre es, ein kombiniertes Zielattribut zu erstellen. Im Falle eines Würfels und einer Münze hätten wir also 62=12 Zustände ( (1,H),(1,T),(2,H) usw.). Dies kann jedoch dazu führen, dass die Anzahl der Zustände / Klassen im zusammengesetzten Ziel ziemlich schnell größer wird (was wäre, wenn wir 2 Würfel usw. hätten). Darüber hinaus erscheint dies in dem Fall seltsam, in dem ein Attribut kategorial ist, während das andere numerisch ist (zum Beispiel wenn Temperatur und Niederschlagsart vorhergesagt werden).

Gibt es einen Standardansatz für solche Dinge? Alternativ gibt es Lernalgorithmen, die speziell dafür entwickelt wurden?


Meinst du am Ende deines 2. Absatzes sehr abhängig . Wenn ja, haben Sie sich eine Art Markov-Ketten-Ansatz überlegt, nachdem die erste Variable geschätzt wurde?
Michelle

Hoppla, ich meinte in der Tat abhängig und reparierte es, danke. Ich hatte keinen Markov-Chain-Ansatz in Betracht gezogen, und ich muss mir überlegen, ob das hier Sinn macht. Vielen Dank.
Michael McGowan

Antworten:


5

Dies ist in der Community für maschinelles Lernen als "Multi-Label-Lernen" bekannt. Es gibt verschiedene Ansätze für das Problem, einschließlich derer, die Sie in Ihrer Frage beschreiben. Einige Ressourcen für den Einstieg:


0

Wenn Sie zwei Variablen mit denselben Prädiktoren haben und die Variable B auch die Variable A als Prädiktor hat, sehen Sie möglicherweise ein Optimierungsproblem, bei dem Sie die Schätzungen von A und B gleichzeitig optimieren möchten. Es macht keinen Sinn, eine zu optimieren, wenn Sie dann eine schlechte Schätzung für die zweite erhalten.

Dies wäre ein Operations-Research-Problem und liegt leider außerhalb meines Fachgebiets.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.