Beim maschinellen Lernen wird über Zielfunktion, Kostenfunktion und Verlustfunktion gesprochen. Sind sie nur verschiedene Namen der gleichen Sache? Wann benutzt man sie? Was sind die Unterschiede, wenn sie sich nicht immer auf dasselbe beziehen?
Ich bin daran interessiert, eine möglichst optimale Methode zu finden, um zu bestimmen, wie viele Fächer ich in einem Histogramm verwenden soll. Meine Daten sollten höchstens 30 bis 350 Objekte umfassen. Insbesondere versuche ich, Schwellenwerte (wie Otsus Methode) anzuwenden, von denen "gute" Objekte, von denen ich weniger haben sollte und …
Ich lese The Book of Why von Judea Pearl und es geht mir unter die Haut 1 . Insbesondere scheint es mir, dass er die "klassische" Statistik bedingungslos kritisiert, indem er argumentiert, dass die Statistik niemals in der Lage ist, Kausalzusammenhänge zu untersuchen, dass sie niemals an Kausalzusammenhängen interessiert ist …
Da es sich bei der Wahl um eine einmalige Veranstaltung handelt, kann dieses Experiment nicht wiederholt werden. Was genau bedeutet die Aussage "Hillary hat eine 75% ige Gewinnchance" technisch? Ich suche eine statistisch korrekte Definition, keine intuitive oder konzeptionelle. Ich bin ein Amateur-Statistik-Fan, der versucht, auf diese Frage zu antworten, …
Ich muss die KL-Divergenz zwischen zwei Gaußschen bestimmen. Ich vergleiche meine Ergebnisse mit diesen , aber ich kann ihr Ergebnis nicht reproduzieren. Mein Ergebnis ist offensichtlich falsch, weil die KL für KL nicht 0 ist (p, p). Ich frage mich, wo ich einen Fehler mache und ob jemand ihn erkennen …
Die Website für künstliche Intelligenz definiert das Lernen außerhalb der Politik und innerhalb der Politik wie folgt: "Ein außervertraglicher Lernender lernt den Wert der optimalen Richtlinie unabhängig von den Aktionen des Agenten. Q-Learning ist ein außervertraglicher Lernender. Ein außervertraglicher Lernender lernt den Wert der Richtlinie, die vom Agenten ausgeführt wird, …
Woher wissen Sie, ob Ihre (hochdimensionalen) Daten genügend Clustering aufweisen, sodass Ergebnisse von kmeans oder anderen Clustering-Algorithmen tatsächlich von Bedeutung sind? Wie stark sollte die Varianz innerhalb eines Clusters reduziert werden, damit die tatsächlichen Cluster-Ergebnisse aussagekräftig (und nicht unecht) sind? Sollte Clustering sichtbar sein, wenn eine dimensionsreduzierte Form der Daten …
Ich bin daran interessiert, die Fläche unter der Kurve (AUC) oder die c-Statistik von Hand für ein binäres logistisches Regressionsmodell zu berechnen. Zum Beispiel habe ich im Validierungsdatensatz den wahren Wert für die abhängige Variable, Aufbewahrung (1 = beibehalten; 0 = nicht beibehalten), sowie einen vorhergesagten Aufbewahrungsstatus für jede Beobachtung, …
Ich frage mich, welchen Wert es hat, eine kontinuierliche Prädiktorvariable zu nehmen und sie zu zerlegen (z. B. in Quintile), bevor sie in einem Modell verwendet wird. Es scheint mir, dass wir durch Binning der Variablen Informationen verlieren. Ist dies nur so, dass wir nichtlineare Effekte modellieren können? Wenn wir …
Ich habe eine Anwendung, in der es nützlich wäre, ein verrauschtes Dataset zu gruppieren, bevor Sie nach Untergruppeneffekten in den Clustern suchen. Ich habe mir zuerst PCA angeschaut, aber es werden ca. 30 Komponenten benötigt, um 90% der Variabilität zu erreichen. Wenn Sie also auf nur ein paar PCs gruppieren, …
Ich habe eine nominelle Variable (verschiedene Gesprächsthemen, codiert als topic0 = 0 usw.) und eine Reihe von Skalenvariablen (DV), wie z. B. die Dauer eines Gesprächs. Wie kann ich Korrelationen zwischen Nominal- und Skalenvariablen ableiten?
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
Ich benutze R, um K-bedeutet Clustering zu machen. Ich verwende 14 Variablen, um K-means auszuführen Was ist ein hübscher Weg, um die Ergebnisse von K-means zu zeichnen? Gibt es bereits Implementierungen? Erschweren 14 Variablen das Zeichnen der Ergebnisse? Ich habe etwas namens GGcluster gefunden, das cool aussieht, sich aber noch …
Ich verstehe, dass nicht negativ sein kann, da es das Quadrat von R ist. Ich habe jedoch in SPSS eine einfache lineare Regression mit einer einzelnen unabhängigen Variablen und einer abhängigen Variablen durchgeführt. Meine SPSS-Ausgabe gibt mir einen negativen Wert für . Wenn ich dies von Hand aus R berechnen …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.