Ressourcen zum Erlernen von Techniken mit mehreren Zielen?


11

Ich suche nach Ressourcen (Bücher, Vorlesungsunterlagen usw.) über Techniken, die Daten verarbeiten können, die mehrere Ziele haben (Beispiel: drei abhängige Variablen: 2 diskrete und 1 kontinuierliche).

Hat jemand irgendwelche Ressourcen / Kenntnisse dazu? Ich weiß, dass es dafür möglich ist, neuronale Netze zu verwenden.

Antworten:


6

Zufällige Gesamtstruktur kann ziemlich gut damit umgehen, siehe Wäre eine zufällige Gesamtstruktur mit mehreren Ausgaben möglich / praktisch? oder die Dokumentation von scikit learn . Ich denke, GBM oder jede baumbasierte Methode kann auf ähnliche Weise angepasst werden.

ich(pich- -yich)2ich(y^ich- -yich)2+(x^ich- -xich)2

Wenn Sie eine Ausgabe vom gemischten Typ (Klassifizierung und Regression) haben, müssen Sie für die Angabe der Zielfunktion wahrscheinlich eine Zielfunktion angeben, die einigen Zielen mehr Gewicht verleiht als anderen: Welche Skalierung wenden Sie auf kontinuierliche Antworten an? Welchen Verlust wenden Sie bei Fehlklassifizierungen an?

Was die weitere akademische Lektüre betrifft,

Wikipedia von SVM Structured Learning

Gleichzeitige Nutzung von Ausgabe- und Aufgabenstrukturen für die Regression mehrerer Ausgaben

Die Landmark-Auswahlmethode für die Vorhersage mehrerer Ausgaben (behandelt hochdimensionale abhängige Variablen)


1
Würden Sie angesichts der Multi-Target-Regression, die auch die Beziehungen zwischen den Ys modellieren soll, nicht eine Verlustfunktion wünschen, die die Anpassung dieser Beziehung misst?
Max Ghenis

3

In diesem Dokument werden die aktuellen Methoden, verfügbaren Toolkits sowie die zu testenden Datensätze gut beschrieben.

Ich arbeite zufällig an einem kommerziellen Problem, das eine Regression mit mehreren Zielen erfordert, und fand heraus, dass das Clus-Toolkit eine gute Mischung aus hoher Leistung und Robustheit aufweist

  • Die Dokumentation ist hervorragend
  • Das Toolkit verfügt über verschiedene Methoden zur Klassifizierung und Regression mehrerer Ziele
  • Es unterstützt auch regelbasierte Induktion und Clustering.
  • Die von mir verwendeten Ensemble-Modelle (Bagging, RandomForest) können leicht gelesen und interpretiert werden.

Einige der neueren Methoden (nach 2012) wurden als Erweiterung des Mulan-Toolkits implementiert. Hier ist der Github-Link . Obwohl diese Methoden wie Random Linear Target Combinations eine bessere Leistung als Ensemble-Modelle aufweisen, stellte ich fest, dass das Toolkit nicht so ausgereift ist wie das Clus-Toolkit und daher nicht verwendet wurde.


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.