Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

3
Zufallszahl-Set.seed (N) in R [duplizieren]
Diese Frage hat hier bereits eine Antwort: Was genau ist ein Startwert in einem Zufallszahlengenerator? 3 Antworten Mir ist klar, dass man set.seed()in R für die Erzeugung von Pseudozufallszahlen verwendet. Mir ist auch klar, dass man mit der gleichen Nummer, wie bei set.seed(123)Versicherungen, Ergebnisse reproduzieren kann. Was ich aber nicht …

4
Unterschied zwischen Vorhersage und Vorhersage?
Ich habe mich gefragt, welcher Unterschied und welche Beziehung zwischen Vorhersage und Vorhersage besteht. Besonders in Zeitreihen und Regressionen? Habe ich zum Beispiel Recht, dass: In Zeitreihen scheint Prognose zu bedeuten, zukünftige Werte anhand vergangener Werte einer Zeitreihe zu schätzen. In der Regression scheint Vorhersage zu bedeuten, einen Wert zu …

3
Testen der Bootstrap vs. Permutation Hypothese
Es gibt verschiedene gängige Resampling-Techniken, die in der Praxis häufig verwendet werden, z. B. Bootstrapping, Permutationstest, Jackknife usw. In zahlreichen Artikeln und Büchern werden diese Techniken erläutert, z. B. Philip I Good (2010) Permutation, Parametric und Bootstrap Tests von Hypothesen Meine Frage ist, welche Resampling-Technik hat an Popularität gewonnen und …


5
Validierungsübergreifende Zeitreihenanalyse
Ich habe das Caret-Paket in R verwendet, um Vorhersagemodelle für Klassifizierung und Regression zu erstellen. Caret bietet eine einheitliche Oberfläche, um Modell-Hyperparameter durch Cross-Validierung oder Boot-Strapping zu optimieren. Wenn Sie beispielsweise ein einfaches Modell für die Klassifizierung der nächsten Nachbarn erstellen, wie viele Nachbarn sollten Sie verwenden? 2? 10? 100? …




1
Warum wird Mantels Test Morans vorgezogen?
Mantels Test wird häufig in biologischen Studien verwendet , um die Korrelation zwischen der räumlichen Verteilung von Tieren (Position im Raum) und beispielsweise ihrer genetischen Verwandtschaft, Aggressionsrate oder einem anderen Attribut zu untersuchen. Viele gute Fachzeitschriften verwenden es ( PNAS, Tierverhalten, Molekulare Ökologie ... ). Ich habe einige Muster hergestellt, …



2
Wer hat die stochastische Gefällestufe erfunden?
Ich versuche die Geschichte des Gradientenabstiegs und des stochastischen Gradientenabstiegs zu verstehen . Gradientenabfallsaktualisierung wurde erfunden Cauchy in 1847. Méthode Générale pour la résolution des Systèmes d'GLEICHUNGEN simultanées . S. 536–538 Weitere Informationen finden Sie hier . Seitdem haben sich Gradientenabstiegsmethoden weiterentwickelt und ich bin mit ihrer Geschichte nicht vertraut. …


1
Was ist der Unterschied zwischen Metropolis Hastings, Gibbs, Importance und Rejection Sampling?
Ich habe versucht, MCMC-Methoden zu erlernen und bin auf Stichproben von Metropolis Hastings, Gibbs, Wichtigkeit und Ablehnung gestoßen. Während einige dieser Unterschiede offensichtlich sind, dh wie Gibbs ein Sonderfall von Metropolis Hastings ist, wenn wir die vollständigen Bedingungen haben, sind die anderen weniger offensichtlich, wenn wir MH in einem Gibbs-Sampler …

6
Wie haben Wissenschaftler die Form der Normalverteilungswahrscheinlichkeitsdichtefunktion herausgefunden?
Dies ist wahrscheinlich eine Amateurfrage, aber ich bin daran interessiert, wie die Wissenschaftler auf die Form der Normalverteilungswahrscheinlichkeitsdichtefunktion gekommen sind. Was mich im Grunde stört, ist, dass es für jemanden vielleicht intuitiver ist, wenn die Wahrscheinlichkeitsfunktion normalverteilter Daten eher die Form eines gleichschenkligen Dreiecks als eine Glockenkurve hat, und wie …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.