Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

10
Warum ist die Summe zweier Zufallsvariablen eine Faltung?
Für lange Zeit habe ich nicht verstanden , warum die „Summe“ von zwei Zufallsvariablen ist ihre Faltung , während eine Mischung Dichtefunktion Summe von und istf(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); die arithmetische Summe und nicht ihre Faltung. Der genaue Ausdruck "die Summe von zwei Zufallsvariablen" erscheint in Google 146.000 mal und ist wie folgt …



1
Wenn ich eine zufällige symmetrische Matrix generiere, wie hoch ist die Wahrscheinlichkeit, dass sie positiv ist?
Ich hatte eine seltsame Frage, als ich einige konvexe Optimierungen ausprobierte. Die Frage ist: Angenommen, ich generiere zufällig (z. B. Standardnormalverteilung) eine Symmetriematrix (z. B. generiere ich eine obere Dreiecksmatrix und fülle die untere Hälfte aus, um sicherzustellen, dass sie symmetrisch ist) ? Gibt es sowieso die Wahrscheinlichkeit zu berechnen?N× …

3
Warum konzentriert sich das Testen grundlegender Hypothesen auf den Mittelwert und nicht auf den Median?
In Grundkursen zur Statistik für Studenten werden den Studenten (normalerweise?) Hypothesentests für den Mittelwert einer Grundgesamtheit beigebracht. Warum liegt der Fokus auf dem Mittelwert und nicht auf dem Median? Ich vermute, dass es aufgrund des zentralen Grenzwertsatzes einfacher ist, den Mittelwert zu testen, aber ich würde gerne einige gebildete Erklärungen …

3
Warum deutet das Auffinden kleiner Effekte in großen Studien auf eine Publikationsverzerrung hin?
In mehreren methodologischen Arbeiten (z. B. Egger et al. 1997a, 1997b) wird die Publikationsverzerrung anhand von Metaanalysen unter Verwendung von Trichterdiagrammen wie dem folgenden diskutiert. In der Veröffentlichung von 1997b heißt es weiter: "Wenn ein Publikationsbias vorliegt, ist zu erwarten, dass von den veröffentlichten Studien die größten die geringsten Auswirkungen …

6
Gibt es Beispiele dafür, wo der zentrale Grenzwertsatz nicht gilt?
Wikipedia sagt - In der Wahrscheinlichkeitstheorie legt der zentrale Grenzwertsatz (Central Limit Theorem, CLT) fest, dass in den meisten Situationen , wenn unabhängige Zufallsvariablen addiert werden, ihre ordnungsgemäß normalisierte Summe zu einer Normalverteilung tendiert (informell eine "Glockenkurve"), selbst wenn die ursprünglichen Variablen selbst keine sind normal verteilt... Wenn "in den …



2
Wurden generative kontradiktorische Netzwerke von Jürgen Schmidhuber eingeführt?
Ich habe auf https://en.wikipedia.org/wiki/Generative_adversarial_networks gelesen : [Generative Adversarial Networks] wurden 2014 von Ian Goodfellow et al. Eingeführt. aber Jürgen Schmidhuber Ansprüche ähnliche Arbeiten früher in dieser Richtung durchgeführt haben ( zum Beispiel gibt es einige Diskussionen um NIPS 2016 während der generativen kontradiktorischen Netzwerk Tutorial: https://channel9.msdn.com/Events/Neural-Information-Processing-Systems- Konferenz / Neuronale Informationsverarbeitungssystemkonferenz-NIPS-2016 …

4
Warum Regularisierung in der Polynomregression verwenden, anstatt den Grad zu senken?
Wenn Sie beispielsweise eine Regression durchführen, müssen häufig zwei Hyperparameter ausgewählt werden: die Kapazität der Funktion (z. B. der größte Exponent eines Polynoms) und der Grad der Regularisierung. Was mich verwirrt, ist, warum nicht einfach eine Funktion mit geringer Kapazität wählen und dann jegliche Regularisierung ignorieren? Auf diese Weise wird …


2
Werden nicht stark korrelierte Variablen in zufälliger Gesamtstruktur Genauigkeit und Feature-Auswahl verzerren?
Nach meinem Verständnis verursachen stark korrelierte Variablen keine Multikollinearitätsprobleme im Random Forest-Modell (Bitte korrigieren Sie mich, wenn ich falsch liege). Wenn ich jedoch zu viele Variablen habe, die ähnliche Informationen enthalten, wird das Modell in dieser Menge zu stark gewichtet als in den anderen? Beispielsweise gibt es zwei Informationssätze (A, …

2
Was sagt uns die Entropie?
Ich lese über Entropie und kann mir nur schwer vorstellen, was es im kontinuierlichen Fall bedeutet. Die Wiki-Seite besagt Folgendes: Die Wahrscheinlichkeitsverteilung der Ereignisse bildet zusammen mit der Informationsmenge jedes Ereignisses eine Zufallsvariable, deren Erwartungswert die durchschnittliche Informationsmenge oder Entropie ist, die durch diese Verteilung erzeugt wird. Wenn ich also …
32 entropy 


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.