Als «model» getaggte Fragen

Eine Formalisierung der Beziehungen zwischen stochastisch (zufällig) verwandten Variablen in Form von mathematischen Gleichungen. VERWENDEN SIE DIESEN TAG NICHT SELBST: Geben Sie immer einen genaueren an.

3
Warum ist KNN nicht „modellbasiert“?
ESL Kapitel 2.4 scheint die lineare Regression als "modellbasiert" zu klassifizieren, da sie annimmt , während für k-nächste Nachbarn keine ähnliche Näherung angegeben wird. Aber machen nicht beide Methoden Annahmen über f ( x ) ?f( x ) ≤ x ≤ βf(x)≈x⋅βf(x) \approx x\cdot\betaf( x )f(x)f(x) Später in 2.4 heißt …




4
Kann eine baumbasierte Regression schlechter abschneiden als eine einfache lineare Regression?
Hallo, ich studiere Regressionstechniken. Meine Daten haben 15 Funktionen und 60 Millionen Beispiele (Regressionsaufgabe). Als ich viele bekannte Regressionstechniken ausprobierte (gradientenverstärkter Baum, Entscheidungsbaumregression, AdaBoostRegressor usw.), lief die lineare Regression hervorragend. Unter diesen Algorithmen fast am besten bewertet. Was kann der Grund dafür sein? Da meine Daten so viele Beispiele enthalten, …

2
Anpassung des exponentiellen Zerfalls mit negativen y-Werten
Ich versuche, eine exponentielle Abklingfunktion an y-Werte anzupassen, die bei hohen x-Werten negativ werden, kann meine nlsFunktion jedoch nicht richtig konfigurieren . Ziel Ich interessiere mich für die Steigung der Abklingfunktion (λλ\lambdanach einigen Quellen ). Wie ich diese Steigung erhalte, ist nicht wichtig, aber das Modell sollte so gut wie …
9 r  model  exponential 

1
Wie viel ist zu viel Überanpassung?
Wo ziehen Sie konzeptionell die Grenze zwischen einem Überanpassungsmodell und einem Modell mit angemessener Anpassung? Es ist klar, dass Sie überanpassen, wenn Ihr Modell auf Ihrem Trainingssatz ein paar Prozent besser abschneidet als auf Ihrem Testsatz. Angenommen, ich habe theoretisch ein Modell auf einem Trainingssatz trainiert, dann auf einem Testsatz …

1
Würde es ein Modellauswahlproblem geben, wenn wir Zugriff auf ein Orakel hätten, das uns den genauen Generalisierungsfehler gegeben hätte?
Sei eine Funktion, die bei gegebener Hypothese den Generalisierungsfehler für dieses feste zurückgibt .E.( h )E.(h)\mathcal{E(h)}hhhhhh Ich habe einige Anmerkungen zur Modellauswahl und zum Generalisierungsfehler gelesen und darin stand: "Wenn wir Zugriff auf , gäbe es auch kein Problem bei der Modellauswahl. Wir würden einfach die großen auswählen , um …

1
Beitrag jeder Kovariate zu einer einzelnen Vorhersage in einem logistischen Regressionsmodell
Nehmen wir zum Beispiel an, wir haben ein logistisches Regressionsmodell, das die Wahrscheinlichkeit ausgibt, dass ein Patient eine bestimmte Krankheit entwickelt, die auf vielen Kovariaten basiert. Wir können uns ein Bild von der Größe und Richtung des Effekts jeder Kovariate im Allgemeinen machen, indem wir die Koeffizienten des Modells untersuchen …


1
Wie kann ich feststellen, ob ein statistisches Modell „identifiziert“ ist?
Mein Ökonometrieprofessor verwendete im Unterricht den Begriff "identifiziert". Wir betrachten der Form wobei eine Zufallsvariable und ein zufälliger Fehlerterm ist. Unsere Regressionslinien haben die FormY=β0+β1X+UY=β0+β1X+UY = \beta_0 + \beta_1 X + UXXXUUUY=β0^+β1^XY=β0^+β1^XY = \hat{\beta_0}+\hat{\beta_1}X Er gab die folgende Definition von "identifiziert": β0β0\beta_0 , werden identifiziert, wenn ein Datensatz genügend Informationen …

1
So passen Sie ein stückweise konstantes Modell (oder ein Schrittfunktionsmodell) an und vergleichen es mit dem logistischen Modell in R.
Ich habe x, y-Daten, wobei x die Position (entlang eines Transekts) und y eine kontinuierliche Variable (z. B. Temperatur) ist. x<-c(115,116,117,118,124,125,126,127,128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,144,145,146,147,148,149,150,151) y<-c(68.3864344929207,69.3317985238957,70.5644430507252,68.7245413735345,68.2444929220624,69.2335442981487,68.9683874048675,69.7104166614154,70.6047681836632,71.1807115091657,70.3333333333333,70,69.735105818315,69.6487585375593,70,69.4943374527374,69,70.3590104484011,70.283981899468,68.9087146344906,68.6666666666667,68.5232663969658,68.088410889283,67.567883666713,66.9865494087022,66,66.3333333333333,66.0165138638852,65.6666666666667,65.7465975732667,66.3333333333333,66.6579079386334) Ich möchte ein lineares Modell, ein 4-Parameter-Logistikmodell und eine stückweise konstante Funktion (auch bekannt als Schrittfunktion) mit einem Haltepunkt an diese Daten anpassen und Modelle vergleichen, um festzustellen, …

2
Wie balanciere ich meinen Datensatz?
Ich habe 90% negative Beispiele und 10% positive Beispiele (13.000 Beobachtungen, 90 Variablen). Mein Modell zeigt mir, dass der Fehler bei der Fehlklassifizierung 0,1 beträgt, aber meine Verwirrungsmatrix zeigt mir, dass die Anzahl der TP sehr gering ist. Gibt es eine Möglichkeit, mein positives Beispiel zu übertasten oder meinen Datensatz …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.