Unter welchen Umständen möchten oder möchten Sie eine Variable vor der Modellanpassung skalieren oder standardisieren? Und welche Vor- / Nachteile hat die Skalierung einer Variablen?
Al Rahimi hat kürzlich in NIPS 2017 einen sehr provokanten Vortrag gehalten, in dem er das aktuelle maschinelle Lernen mit Alchemie vergleicht. Eine seiner Behauptungen ist, dass wir zu theoretischen Entwicklungen zurückkehren müssen, um einfache Theoreme zu haben, die grundlegende Ergebnisse beweisen. Als er das sagte, fing ich an, nach …
Was sind die Hauptideen, dh Konzepte, die mit dem Bayes-Theorem zusammenhängen ? Ich frage nicht nach Ableitungen der komplexen mathematischen Notation.
Mein Vater ist Mathematikbegeisterter, interessiert sich aber nicht besonders für Statistik. Es wäre ordentlich zu versuchen , einige der wunderbaren Teile der Statistik zu veranschaulichen, und das CLT ist ein erstklassiger Kandidat. Wie würden Sie die mathematische Schönheit und Wirkung des zentralen Grenzwertsatzes einem Nicht-Statistiker vermitteln?
Ich denke darüber aus einer sehr einfachen Perspektive mit minimalen Anforderungen nach. Was sind die wichtigsten Theorien, die ein (nicht akademischer) Statistiker in der Branche regelmäßig kennen, verstehen und anwenden sollte? Ein großer Gedanke ist das Gesetz der großen Zahlen . Was ist für die Anwendung der statistischen Theorie auf …
Ich habe einen maschinellen Lernwettbewerb durchgeführt, bei dem RMSLE (Root Mean Squared Logarithmic Error) verwendet wird, um die Leistung zu bewerten und den Verkaufspreis einer Gerätekategorie vorherzusagen. Das Problem ist, dass ich nicht sicher bin, wie ich den Erfolg meines Endergebnisses interpretieren soll. Wenn ich zum Beispiel einen Effektivwert von …
Siehe auch eine ähnliche Frage zu stats.SE . Bei Boosting- Algorithmen wie AdaBoost und LPBoost ist bekannt, dass die zu kombinierenden "schwachen" Lernenden nur bessere Leistungen erbringen müssen als der Zufall, um nützlich zu sein. Die verwendeten Klassifizierer können schwach sein (dh eine erhebliche Fehlerrate aufweisen), aber solange ihre Leistung …
Ich bin gerade auf diese Arbeit gestoßen , in der beschrieben wird, wie die Wiederholbarkeit (auch bekannt als Zuverlässigkeit, auch bekannt als Intraclass-Korrelation) einer Messung über Mixed-Effects-Modellierung berechnet wird. Der R-Code wäre: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = …
Der bekannteste Algorithmus für Banditen ist der Upper Confidence Bound (UCB), der diese Klasse von Algorithmen bekannt gemacht hat. Seitdem gehe ich davon aus, dass es jetzt bessere Algorithmen gibt. Was ist der derzeit beste Algorithmus (in Bezug auf empirische Leistung oder theoretische Grenzen)? Ist dieser Algorithmus in gewissem Sinne …
Ich habe mich gefragt, warum es so wichtig ist, prinzipielles / theoretisches maschinelles Lernen zu haben. Aus einer persönlichen Perspektive als Mensch kann ich verstehen, warum prinzipielles maschinelles Lernen wichtig wäre: Menschen mögen es zu verstehen, was sie tun, wir finden Schönheit und Befriedigung zu verstehen. Aus theoretischer Sicht macht …
In den meisten Ressourcen zu den Regeln für die richtige Bewertung werden verschiedene Bewertungsregeln wie Protokollverlust, Brier-Punktzahl oder sphärische Bewertung erwähnt. Häufig geben sie jedoch keine Orientierungshilfe zu den Unterschieden zwischen ihnen. (Anlage A: Wikipedia .) Die Auswahl des Modells, das die logarithmische Bewertung maximiert, entspricht der Auswahl des Maximum-Likelihood-Modells, …
Was bedeutet es zu sagen, dass "die Varianz ein verzerrter Schätzer ist"? Was bedeutet es, eine voreingenommene Schätzung durch eine einfache Formel in eine unvoreingenommene Schätzung umzuwandeln? Was genau macht diese Konvertierung? Was ist der praktische Nutzen dieser Konvertierung? Konvertieren Sie diese Werte, wenn Sie bestimmte Arten von Statistiken verwenden?
Konkret suche ich Referenzen (Papiere, Bücher), die den Fluch der Dimensionalität konsequent aufzeigen und erklären. Diese Frage stellte sich, nachdem ich dieses Whitepaper von Lafferty und Wasserman gelesen hatte . Im dritten Absatz erwähnen sie eine "bekannte" Gleichung, die impliziert, dass die beste Konvergenzrate ; Wenn jemand darauf eingehen kann …
Ich möchte mehr über nichtparametrische Bayesianische (und verwandte) Techniken erfahren. Mein Hintergrund liegt in der Informatik, und obwohl ich noch nie einen Kurs in Maß- oder Wahrscheinlichkeitstheorie belegt habe, habe ich nur ein begrenztes Maß an formaler Ausbildung in Wahrscheinlichkeits- und Statistikwissenschaften erhalten. Kann mir jemand eine lesbare Einführung in …
Ich habe mich gefragt, ob jemand weiß oder ob es eine Anwendung in der Statistik gibt, bei der eine starke Konsistenz eines Schätzers anstelle einer schwachen Konsistenz erforderlich ist. Das heißt, eine starke Konsistenz ist für die Anwendung wesentlich und die Anwendung würde bei einer schwachen Konsistenz nicht funktionieren.
Meist theoretische Frage. Gibt es Beispiele für nicht normale Verteilungen, deren erste vier Momente denen der Normalverteilung entsprechen? Könnten sie theoretisch existieren?
Ich habe diesen Thread durchgelesen und es sieht für mich so aus, als könnte man sagen: Statistik = Induktion? Wahrscheinlichkeit = Abzug? Aber ich frage mich, ob es vielleicht weitere Details zu dem Vergleich gibt, die mir fehlen. Ist Statistik zum Beispiel gleich Induktion oder ist es nur ein besonderer …
Diese Frage wurde durch zwei kürzlich von mir durchgeführte Interaktionen inspiriert, eine hier im Lebenslauf und die andere bei economics.se. Dort hatte ich eine Antwort auf das bekannte "Envelope Paradox" gepostet (wohlgemerkt nicht als die "richtige Antwort", sondern als die Antwort, die sich aus bestimmten Annahmen über die Struktur der …
Welche theoretischen Herangehensweisen an die Kausalität sollte ich als angewandter Statistiker / Ökonometriker kennen? Ich kenne die (ein bisschen) Neyman-Rubin-Kausalmodell (und Roy , Haavelmo usw.) Pearl's Arbeit über Kausalität Granger-Kausalität (wenn auch weniger behandlungsorientiert) Welche Konzepte vermisse ich oder sollte ich darauf achten? Verwandte: Welche Theorien sind Grundlagen für Kausalität …
Ich habe einige grundlegende Methoden gefunden, um die Komplexität neuronaler Netze zu messen: Naiv und informell: Zählen Sie die Anzahl der Neuronen, verborgenen Neuronen, Schichten oder verborgenen Schichten VC-Dimension (Eduardo D. Sontag [1998] "VC-Dimension neuronaler Netze" [ pdf ].) Ein körniger und asymptotischer Rechenaufwand wird durch Äquivalenz zu gemessenTC0dTCd0TC^0_d . …
Gibt es gute Bücher, die wichtige Konzepte der Wahrscheinlichkeitstheorie wie Wahrscheinlichkeitsverteilungsfunktionen und kumulative Verteilungsfunktionen erklären? Vermeiden Sie es, auf Bücher wie "Mathematical Statistics and Data Analysis" von John Rice zu verweisen, die mit einfachen Permutationskonzepten beginnen und dann plötzlich (im 2. Kapitel) einen Sprung machen, indem Sie Kenntnisse in reeller …
Permutationstests (auch Randomisierungstest, Re-Randomisierungstest oder exakter Test genannt) sind sehr nützlich und nützlich, wenn die zum Beispiel erforderliche Annahme einer Normalverteilung t-testnicht erfüllt ist und wenn die Transformation der Werte durch Rangfolge der Werte erfolgt Ein nicht parametrischer Test Mann-Whitney-U-testwürde dazu führen, dass mehr Informationen verloren gehen. Eine einzige Annahme, …
Betrachten Sie Jaynes 'Lösung des Bertrand-Paradoxons nach dem Prinzip der Gleichgültigkeit . Warum trifft ein ähnliches Argument auf das Borel-Kolmogorov-Paradoxon nicht zu ? Ist etwas falsch daran zu argumentieren, dass das Drehen der Kugel die resultierende Verteilung, die durch den gewählten Begrenzungsprozess erreicht wird, nicht beeinflussen sollte, da das Problem …
Kontext : Ich möchte eine Linie in einem Streudiagramm zeichnen, die nicht parametrisch erscheint, daher verwende ich geom_smooth()in ggplotin R. Es gibt automatisch geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the …
Ich habe gerade über künstliche neuronale Netze in Courseras Kurs Maschinelles Lernen gesprochen und möchte gerne mehr über die dahinter stehende Theorie erfahren. Ich finde die Motivation, dass sie die Biologie imitieren, etwas unbefriedigend. Auf der Oberfläche scheint es, dass wir auf jeder Ebene Kovariaten durch eine lineare Kombination ersetzen. …
Stellen Sie sich vor, ein Forscher untersucht einen Datensatz und führt 1000 verschiedene Regressionen durch und findet eine interessante Beziehung zwischen ihnen. Stellen Sie sich nun vor, ein anderer Forscher mit denselben Daten führt nur eine Regression aus, und es stellt sich heraus, dass der andere Forscher 1000 Regressionen durchgeführt …
Ich habe mich mit theoretischen Rahmenbedingungen für die Methodenauswahl befasst (Anmerkung: nicht Modellauswahl) und nur sehr wenig systematische, mathematisch motivierte Arbeit gefunden. Mit "Methodenauswahl" meine ich einen Rahmen zur Unterscheidung der geeigneten (oder besser, optimalen) Methode in Bezug auf ein Problem oder einen Problemtyp. Was ich gefunden habe, ist substanziell, …
Ich stand vor einer Interviewfrage für einen Job, bei dem der Interviewer mich fragte, ob Ihr für ein Preiselastizitätsmodell sehr niedrig ist (zwischen 5 und 10%). Wie würden Sie diese Frage lösen?R2R2R^2 Ich konnte mir nichts anderes vorstellen als die Tatsache, dass ich eine Regressionsdiagnose durchführen werde, um zu sehen, …
Ich versuche, ein R-Skript zu schreiben, um die wiederholte Interpretation eines 95% -Konfidenzintervalls zu simulieren. Ich habe festgestellt, dass es den Anteil der Zeiten überschätzt, in denen der wahre Populationswert eines Anteils im 95% -KI der Stichprobe enthalten ist. Kein großer Unterschied - ungefähr 96% gegenüber 95%, aber das hat …
Ich bin auf diesen Satz gestoßen, als ich einen Artikel auf sciencemag.org gelesen habe . Am Ende wurden nur Antworten von 7600 Forschern aus 12 Ländern berücksichtigt, da die verbleibenden Daten nicht als statistisch signifikant angesehen wurden. Ist dies ein angemessener Weg, um Forschung zu betreiben? Ergebnisse weglassen, weil sie …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.