Wenn ich den Median einer ausreichend großen Anzahl von Beobachtungen aus derselben Verteilung berechne, gibt der zentrale Grenzwertsatz dann an, dass die Verteilung der Mediane einer Normalverteilung nahekommt? Ich verstehe, dass dies mit den Mitteln einer großen Anzahl von Proben zutrifft, aber gilt dies auch für Mediane? Wenn nicht, wie …
Ich habe eine Weile in R gearbeitet und war mit Dingen wie PCA, SVD, QR-Zerlegungen und vielen solchen linearen Algebra-Ergebnissen konfrontiert (wenn ich die Schätzung gewichteter Regressionen und dergleichen untersuche), also wollte ich wissen, ob jemand eine Empfehlung für eine Ware hat umfassendes Buch zur linearen Algebra, das nicht zu …
Oder eher "wird es sein"? Big Data macht Statistiken und relevantes Wissen umso wichtiger, scheint aber die Stichprobentheorie zu unterschätzen. Ich habe diesen Hype um 'Big Data' gesehen und frage mich, warum ich alles analysieren möchte . Gab es nicht einen Grund, warum "Sampling Theory" entworfen / implementiert / erfunden …
Wir finden die Cluster-Zentren und weisen k verschiedenen Cluster-Klassen Punkte zu. Dies ist ein sehr bekannter Algorithmus, der fast in jedem maschinellen Lernpaket im Netz zu finden ist. Aber der fehlende und wichtigste Teil meiner Meinung nach ist die Wahl eines korrekten k. Was ist der beste Wert dafür? Und …
Ich höre oft, dass Post-hoc-Tests nach einer ANOVA nur verwendet werden können, wenn die ANOVA selbst signifikant war. Bei Post-Hoc-Tests werden jedoch die Werte angepasst, um die globale Typ-I-Fehlerrate bei 5% zu halten, nicht wahr?ppp Warum brauchen wir also zuerst den globalen Test? Wenn wir keinen globalen Test benötigen, ist …
Was ist eine gute Einführung in die Statistik für einen Mathematiker, der sich mit Wahrscheinlichkeiten bereits auskennt? Ich habe zwei unterschiedliche Gründe zu fragen, die durchaus zu unterschiedlichen Vorschlägen führen können: Ich möchte die statistische Motivation hinter vielen Problemen, die von Probabilisten betrachtet werden, besser verstehen. Ich möchte wissen, wie …
Nehmen wir an, Sie sind ein sozialwissenschaftlicher Forscher / Ökonometriker, der versucht, relevante Prädiktoren für die Nachfrage nach einer Dienstleistung zu finden. Sie haben 2 ergebnis- / abhängige Variablen, die den Bedarf beschreiben (unter Verwendung des Dienstes yes / no und der Anzahl der Fälle). Sie haben 10 Prädiktor- / …
Ich habe dies zuvor bei StackOverflow gefragt, aber es scheint, als wäre es hier angemessener, da es auf SO keine Antworten gab. Es ist eine Art Schnittstelle zwischen Statistik und Programmierung. Ich muss Code schreiben, um PCA (Principal Component Analysis) durchzuführen. Ich habe die bekannten Algorithmen durchgesehen und diese implementiert …
Eine Frage suchte zuvor nach Empfehlungen für Lehrbücher zur mathematischen Statistik Kennt jemand eine gute Online- Videovorlesung über mathematische Statistik ? Die nächsten, die ich gefunden habe, sind: Maschinelles lernen Ökonometrie UPDATE: Bei einigen der unten aufgeführten Vorschläge handelt es sich um gute Videos vom Typ Statistik 101. Ich frage …
In einigen Fällen scheint es möglich zu sein, ähnliche Ergebnisse wie bei einem neuronalen Netzwerk mit einer multivariaten linearen Regression zu erzielen, und die multivariate lineare Regression ist superschnell und einfach. Unter welchen Umständen können neuronale Netze bessere Ergebnisse liefern als multivariate lineare Regression?
Ich habe viel über PCA gelesen, einschließlich verschiedener Tutorials und Fragen (wie diese , diese , diese und diese ). Das geometrische Problem, das PCA zu optimieren versucht, ist mir klar: PCA versucht, die erste Hauptkomponente durch Minimierung des Rekonstruktionsfehlers (Projektionsfehlers) zu finden, wodurch gleichzeitig die Varianz der projizierten Daten …
Mir scheint, dass eine Hold-out-Validierung nutzlos ist. Das heißt, die Aufteilung des Originaldatensatzes in zwei Teile (Training und Testen) und die Verwendung der Testergebnisse als Verallgemeinerungsmaßnahme ist etwas nutzlos. Die K-fache Kreuzvalidierung scheint bessere Annäherungen an die Generalisierung zu liefern (da sie in jedem Punkt trainiert und testet). Warum sollten …
Ich habe aus meinem Lehrbuch gelesen, dass nicht garantiert, dass X und Y unabhängig sind. Aber wenn sie unabhängig sind, muss ihre Kovarianz 0 sein. Ich konnte mir noch kein richtiges Beispiel vorstellen; könnte jemand eine besorgen?cov(X,Y)=0cov(X,Y)=0\text{cov}(X,Y)=0
Beim statistischen Lernen wird implizit oder explizit immer davon ausgegangen, dass die Trainingsmenge aus Eingabe- / Antworttupeln besteht , die unabhängig voneinander aus derselben gemeinsamen Verteilung gezogen werden mitD ={ X , y }D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNN( Xich, yich)(Xich,yich)({\bf{X}}_i,y_i) P ( X ,y)P(X,y)\mathbb{P}({\bf{X}},y) p ( X , …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.