In letzter Zeit habe ich viel über die Unterschiede zwischen der Fisher-Methode zum Testen von Hypothesen und der Neyman-Pearson-Denkschule gelesen. Meine Frage ist, für einen Moment philosophische Einwände zu ignorieren; Wann sollten wir den Fisher-Ansatz der statistischen Modellierung anwenden und wann sollten wir die Neyman-Pearson-Methode von Signifikanzniveaus usw. anwenden? Gibt …
Inspiriert von einem Kommentar zu dieser Frage : Was halten wir in einem Prior für "uninformativ" - und welche Informationen sind in einem vermeintlich uninformativen Prior noch enthalten? Im Allgemeinen sehe ich den Prior in einer Analyse, bei der es sich entweder um eine Analyse vom Typ eines Frequentisten handelt, …
Ich frage mich, wie man Genauigkeits- und Rückrufmaße für die Multiklassen-Multilabel-Klassifizierung berechnet, dh eine Klassifizierung, bei der es mehr als zwei Labels gibt und bei der jede Instanz mehrere Labels haben kann.
Im Rahmen eines sozialwissenschaftlichen Forschungsvorschlags wurde mir folgende Frage gestellt: Ich bin immer um 100 + m (wobei m die Anzahl der Prädiktoren ist) gegangen, wenn ich die minimale Stichprobengröße für die multiple Regression bestimmt habe. Ist das angebracht Ich bekomme oft ähnliche Fragen, oft mit anderen Faustregeln. Ich habe …
Hintergrund : Ich habe keine formelle Ausbildung in Bayes'scher Statistik (obwohl ich sehr daran interessiert bin, mehr zu lernen), aber ich weiß genug - glaube ich - um zu verstehen, warum viele das Gefühl haben, sie seien häufigen Statistiken vorzuziehen. Sogar die Studenten der Einführungsklasse Statistik (in den Sozialwissenschaften), die …
Ich habe irgendwo gesehen, dass klassische Entfernungen (wie die euklidische Entfernung) schwach diskriminierend werden, wenn wir mehrdimensionale und spärliche Daten haben. Warum? Haben Sie ein Beispiel für zwei spärliche Datenvektoren, bei denen die euklidische Distanz nicht gut funktioniert? In diesem Fall welche Ähnlichkeit sollten wir verwenden?
Die Wartezeiten für die Poissonverteilung sind eine Exponentialverteilung mit dem Parameter Lambda. Aber ich verstehe es nicht. Poisson modelliert beispielsweise die Anzahl der Ankünfte pro Zeiteinheit. In welcher Beziehung steht dies zur Exponentialverteilung? Nehmen wir an, die Wahrscheinlichkeit von k Ankünften in einer Zeiteinheit ist P (k) (modelliert durch Poisson) …
Was sind die üblichen Annahmen für eine lineare Regression? Umfassen sie: eine lineare Beziehung zwischen der unabhängigen und abhängigen Variablen unabhängige Fehler Normalverteilung von Fehlern Homoskedastizität Gibt es noch andere?
Shannons Entropie ist das Negativ der Summe der Wahrscheinlichkeiten jedes Ergebnisses multipliziert mit dem Logarithmus der Wahrscheinlichkeiten für jedes Ergebnis. Welchen Zweck erfüllt der Logarithmus in dieser Gleichung? Eine intuitive oder visuelle Antwort (im Gegensatz zu einer zutiefst mathematischen Antwort) erhält Bonuspunkte!
Firstregressionskoeffizientenschätzung β R sind die Werte , die die Minimierungβ^Rβ^R\hat{\beta}^R RSS+λ∑j=1pβ2j.RSS+λ∑j=1pβj2. \text{RSS} + \lambda \sum_{j=1}^p\beta_j^2. Meine Fragen sind: Wenn , dann sehen wir, dass sich der obige Ausdruck auf das übliche RSS reduziert. Was ist, wenn λ → ∞ ? Ich verstehe das Lehrbuch Erklärung des Verhaltens der Koeffizienten nicht.λ=0λ=0\lambda …
Es scheint, dass Data Mining und maschinelles Lernen so populär wurden, dass mittlerweile fast jeder CS-Student über Klassifikatoren, Clustering, statistische NLPs usw. Bescheid weiß. Meine Frage lautet: Welche Fähigkeiten könnte ein Data Miner erlernen, die ihn von den anderen unterscheiden? Ihn zu einer Person zu machen, die nicht so leicht …
In Andrew Ngs Kurs über maschinelles Lernen führt er in die lineare und logistische Regression ein und zeigt, wie die Modellparameter mithilfe des Gradientenabfalls und der Newton-Methode angepasst werden. Ich weiß, dass Gradientenabstieg in einigen Anwendungen des maschinellen Lernens (z. B. Backpropogation) nützlich sein kann, aber im allgemeineren Fall gibt …
Wie kann ich doppelte Zeilen aus diesem Beispieldatenrahmen entfernen? A 1 A 1 A 2 B 4 B 1 B 1 C 2 C 2 Ich möchte die Duplikate entfernen, die auf beiden Spalten basieren: A 1 A 2 B 4 B 1 C 2 Ordnung ist nicht wichtig.
Die Frage: Gibt es gute Beispiele für reproduzierbare Forschung mit R, die online frei verfügbar sind? Ideales Beispiel: Im Einzelnen würden ideale Beispiele Folgendes bereitstellen: Die Rohdaten (und idealerweise Metadaten, die die Daten erklären), Alle R-Codes, einschließlich Datenimport, -verarbeitung, -analysen und -ausgabe, Sweave oder ein anderer Ansatz zum Verknüpfen der …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.