Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

2
Wann (und warum) sollten Sie das Protokoll einer Verteilung (von Zahlen) aufnehmen?
Angenommen, ich habe einige historische Daten, z. B. vergangene Aktienkurse, Flugpreisschwankungen, vergangene Finanzdaten des Unternehmens ... Jetzt kommt jemand (oder eine Formel) und sagt "Lass uns das Protokoll der Distribution nehmen / benutzen" und hier ist, wohin ich gehe WARUM ? Fragen: WARUM sollte man überhaupt das Verteilungsprotokoll führen? WAS …

4
Wie man einen QQ-Plot interpretiert
Ich arbeite mit einem kleinen Datensatz (21 Beobachtungen) und habe den folgenden normalen QQ-Plot in R: Was kann ich angesichts der Tatsache, dass die Darstellung keine Normalität unterstützt, auf die zugrunde liegende Verteilung schließen? Es scheint mir, dass eine Verteilung, die mehr nach rechts geneigt ist, besser passt, stimmt das? …

9
Warum die plötzliche Faszination für Tensoren?
In letzter Zeit ist mir aufgefallen, dass viele Leute Tensoräquivalente vieler Methoden entwickeln (Tensorfaktorisierung, Tensorkerne, Tensoren für Themenmodellierung usw.). Ich frage mich, warum die Welt plötzlich von Tensoren fasziniert ist. Gibt es kürzlich erschienene Artikel / Standardergebnisse, die besonders überraschend sind und dies bewirkten? Ist es rechnerisch viel billiger als …

3
Wann sollte ich Lasso vs Ridge verwenden?
Angenommen, ich möchte eine große Anzahl von Parametern schätzen und einige davon benachteiligen, weil ich der Meinung bin, dass sie im Vergleich zu den anderen nur geringe Auswirkungen haben sollten. Wie entscheide ich mich für ein Strafschema? Wann ist eine Kammregression angemessener? Wann sollte ich Lasso verwenden?





3
Rs lmer Spickzettel
In diesem Forum wird viel darüber diskutiert, wie verschiedene hierarchische Modelle richtig angegeben werden können lmer. Ich dachte, es wäre großartig, alle Informationen an einem Ort zu haben. Ein paar Fragen zum Starten: So legen Sie mehrere Ebenen fest, in denen eine Gruppe in der anderen verschachtelt ist: (1|group1:group2)oder (1+group1|group2)? …

3
ROC vs Precision-and-Recall-Kurven
Ich verstehe die formalen Unterschiede zwischen ihnen, was ich wissen möchte, ist, wenn es relevanter ist, eins gegen das andere zu verwenden. Bieten sie immer einen ergänzenden Einblick in die Leistung eines bestimmten Klassifizierungs- / Erkennungssystems? Wann ist es sinnvoll, sie beide beispielsweise in einer Zeitung zu veröffentlichen? statt nur …


2
Generativ vs. diskriminativ
Ich weiß, dass generativ "basierend auf P(x,y)P(x,y)P(x,y) " und diskriminativ "basierend auf P(y|x)P(y|x)P(y|x) " bedeutet, aber ich bin in mehreren Punkten verwirrt: Wikipedia (+ viele andere Zugriffe im Web) stuft Dinge wie SVMs und Entscheidungsbäume als diskriminierend ein. Aber diese haben nicht einmal probabilistische Interpretationen. Was heißt hier diskriminierend? Ist …




Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.