Als «predictive-models» getaggte Fragen

Vorhersagemodelle sind statistische Modelle, deren Hauptzweck darin besteht, andere Beobachtungen eines Systems optimal vorherzusagen, im Gegensatz zu Modellen, deren Zweck darin besteht, eine bestimmte Hypothese zu testen oder ein Phänomen mechanistisch zu erklären. Vorhersagemodelle legen daher weniger Wert auf Interpretierbarkeit als vielmehr auf Leistung.



3
Visualisierung der Kalibrierung der vorhergesagten Wahrscheinlichkeit eines Modells
Angenommen, ich habe ein Vorhersagemodell, das für jede Klasse eine Wahrscheinlichkeit ergibt. Jetzt erkenne ich, dass es viele Möglichkeiten gibt, ein solches Modell zu bewerten, wenn ich diese Wahrscheinlichkeiten für die Klassifizierung verwenden möchte (Genauigkeit, Erinnerung usw.). Ich erkenne auch, dass eine ROC-Kurve und die Fläche darunter verwendet werden können, …

3
Websites für Vorhersagemodellierungswettbewerbe
Ich nehme an Vorhersagemodellierungswettbewerben auf Kaggle , TunedIt und CrowdAnalytix teil . Ich finde, dass diese Websites ein guter Weg sind, um Statistiken / maschinelles Lernen zu "trainieren". Gibt es noch andere Websites, über die ich Bescheid wissen sollte? Wie stehen Sie alle zu Wettbewerben, bei denen der Ausrichter von …


3
Wie kann man ein Ergebnis mit nur positiven Fällen als Training vorhersagen?
Nehmen wir der Einfachheit halber an, ich arbeite am klassischen Beispiel von Spam- / Nicht-Spam-E-Mails. Ich habe 20000 E-Mails. Davon weiß ich, dass 2000 Spam sind, aber ich habe kein Beispiel für Nicht-Spam-E-Mails. Ich möchte vorhersagen, ob es sich bei den verbleibenden 18000 um Spam handelt oder nicht. Im Idealfall …

2
Datenerweiterungstechniken für allgemeine Datensätze?
In vielen Anwendungen des maschinellen Lernens haben die sogenannten Datenerweiterungsmethoden die Erstellung besserer Modelle ermöglicht. Nehmen Sie zum Beispiel einen Trainingssatz mit Bildern von Katzen und Hunden an. Durch Drehen, Spiegeln, Anpassen des Kontrasts usw. ist es möglich, zusätzliche Bilder aus den Originalbildern zu generieren.100100100 Bei Bildern ist die Datenerweiterung …

2
"Interestingness" -Funktion für StackExchange-Fragen
Diese Frage wurde von Mathematics Stack Exchange migriert, da sie auf Cross Validated beantwortet werden kann. Vor 8 Jahren migriert . Ich versuche, ein Data-Mining-Paket für StackExchange-Sites zusammenzustellen, und insbesondere stecke ich fest, um die "interessantesten" Fragen zu ermitteln. Ich würde gerne die Fragenbewertung verwenden, aber die Verzerrung aufgrund der …

2
Bayesianische Überanpassung
Ich habe viel Zeit in die Entwicklung von Methoden und Software für die Validierung von Vorhersagemodellen im Bereich der traditionellen Statistik investiert. Wenn ich mehr Bayes'sche Ideen in die Praxis umsetze und unterrichte, sehe ich einige wesentliche Unterschiede, die ich berücksichtigen muss. Erstens fordert die Bayes'sche Vorhersagemodellierung den Analysten auf, …

2
Boosting: Warum wird die Lernrate als Regularisierungsparameter bezeichnet?
Der Lernratenparameter ( ) in Gradient Boosting verringert den Beitrag jedes neuen Basismodells - normalerweise eines flachen Baums -, das in der Reihe hinzugefügt wird. Es hat sich gezeigt, dass die Genauigkeit des Testsatzes drastisch erhöht wird, was verständlich ist, da mit kleineren Schritten das Minimum der Verlustfunktion genauer erreicht …

1
Predictive Modeling - Sollten wir uns für gemischte Modelle interessieren?
Müssen wir uns für die prädiktive Modellierung mit statistischen Konzepten wie zufälligen Effekten und der Nichtunabhängigkeit von Beobachtungen (wiederholte Messungen) befassen? Beispielsweise.... Ich habe Daten aus 5 Direktmailing-Kampagnen (die im Laufe eines Jahres durchgeführt wurden) mit verschiedenen Attributen und einer Kaufmarkierung. Idealerweise würde ich all diese Daten zusammen verwenden, um …

2
Wie kann man basierend auf früheren Ereignissen vorhersagen, wann das nächste Ereignis eintritt?
Ich bin ein Gymnasiast und arbeite an einem Computerprogrammierungsprojekt, aber ich habe nicht viel Erfahrung mit Statistik und Modellierung von Daten außerhalb eines High School Statistikkurses, daher bin ich ein bisschen verwirrt. Grundsätzlich habe ich eine ziemlich große Liste (vorausgesetzt, sie ist groß genug, um die Annahmen für statistische Tests …

4
Bestimmen der besten Anpassungskurvenanpassungsfunktion aus linearen, exponentiellen und logarithmischen Funktionen
Kontext: Ausgehend von einer Frage zu Mathematics Stack Exchange (Kann ich ein Programm erstellen) hat jemand eine Reihe von Punkten und möchte eine lineare, exponentielle oder logarithmische Kurve daran anpassen. Die übliche Methode besteht darin, zunächst eine dieser Methoden (die das Modell angibt) auszuwählen und dann die statistischen Berechnungen durchzuführen.x …


1
Stepwise AIC - Gibt es Kontroversen zu diesem Thema?
Ich habe unzählige Beiträge auf dieser Site gelesen, die unglaublich gegen die schrittweise Auswahl von Variablen mit beliebigen Kriterien wie p-Werten, AIC, BIC usw. sind. Ich verstehe, warum diese Verfahren im Allgemeinen ziemlich schlecht für die Auswahl von Variablen sind. Gungs wahrscheinlich berühmter Post hier zeigt deutlich, warum; Letztendlich überprüfen …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.