Als «discrete-data» getaggte Fragen

Bezieht sich auf Daten, die aus einer Distribution generiert wurden, die über einen zählbaren Probenraum verfügt. Das diskrete Daten-Tag kann kategoriale Daten umfassen, ob nominal (z. B. die Verteilung der Rasse in einer Stichprobe von Personen) oder ordinal (z. B. sozioökonomischer Status) oder eine tatsächliche diskrete Zufallsvariable, wie z. B. eine Reihe von Ereigniszählungen (z. B. die Anzahl der Fehler auf einer Textseite). Diskrete Daten müssen jedoch nicht unbedingt ganzzahlig sein.




4
Vorhersage mit kontinuierlichen und kategorialen Funktionen
Einige Vorhersagemodelltechniken sind eher für den Umgang mit kontinuierlichen Prädiktoren ausgelegt, während andere für den Umgang mit kategorialen oder diskreten Variablen besser geeignet sind. Natürlich gibt es Techniken, um einen Typ in einen anderen umzuwandeln (Diskretisierung, Dummy-Variablen usw.). Gibt es jedoch Vorhersagemodelltechniken, mit denen beide Eingabetypen gleichzeitig verarbeitet werden können, …

1
Kolmogorov-Smirnov mit diskreten Daten: Was ist die richtige Verwendung von dgof :: ks.test in R?
Anfängerfragen: Ich möchte testen, ob zwei diskrete Datensätze von derselben Verteilung stammen. Ein Kolmogorov-Smirnov-Test wurde mir vorgeschlagen. Conover ( Praktische nichtparametrische Statistik , 3d) scheint zu sagen, dass der Kolmogorov-Smirnov-Test für diesen Zweck verwendet werden kann, aber sein Verhalten ist bei diskreten Verteilungen "konservativ", und ich bin nicht sicher, was …


1
Löschen Sie eine der Spalten, wenn Sie One-Hot-Codierung verwenden
Ich verstehe, dass maschinelles Lernen ein Problem darstellen kann, wenn Ihr Dataset stark korrelierte Features aufweist, da diese dieselben Informationen effektiv codieren. Kürzlich hat jemand darauf hingewiesen, dass Sie beim einmaligen Codieren einer kategorialen Variablen korrelierte Features erhalten, sodass Sie eine davon als "Referenz" ablegen sollten. Wenn Sie beispielsweise das …

2
Anomalieerkennung mit Dummy-Funktionen (und anderen diskreten / kategorialen Funktionen)
tl; dr Was ist die empfohlene Methode zum Umgang mit discreteDaten bei der Erkennung von Anomalien? Was ist die empfohlene Methode zum Umgang mit categoricalDaten bei der Erkennung von Anomalien? Diese Antwort schlägt vor, diskrete Daten zu verwenden, um nur die Ergebnisse zu filtern. Vielleicht den Kategoriewert durch die prozentuale …

1
Grundlegende Fragen zur zeitdiskreten Überlebensanalyse
Ich versuche, mithilfe eines logistischen Regressionsmodells eine diskrete Zeitüberlebensanalyse durchzuführen, und bin nicht sicher, ob ich den Prozess vollständig verstehe. Ich würde mich sehr über Unterstützung bei ein paar grundlegenden Fragen freuen. Hier ist der Aufbau: Ich sehe die Mitgliedschaft in einer Gruppe innerhalb eines Zeitfensters von fünf Jahren. Jedes …

2
Wie passt man eine diskrete Verteilung an, um Daten zu zählen?
Ich habe das folgende Histogramm der Zähldaten. Und ich würde gerne eine diskrete Verteilung hinzufügen. Ich bin mir nicht sicher, wie ich das anstellen soll. Soll ich dem Histogramm zuerst eine diskrete Verteilung überlagern, z. B. eine negative Binomialverteilung, damit ich die Parameter der diskreten Verteilung erhalte, und dann einen …

1
Hamilton-Monte-Carlo und diskrete Parameterräume
Ich habe gerade angefangen, Modelle in Stan zu bauen . Um mich mit dem Tool vertraut zu machen, arbeite ich mich durch einige der Übungen in Bayesian Data Analysis (2nd ed.). Die Waterbuck-Übung setzt voraus, dass die Daten , wobei ( N , θ ) unbekannt ist. Da Hamilton-Monte-Carlo keine …

3
Wahrscheinlichkeitsformel für eine multivariate Bernoulli-Verteilung
Ich benötige eine Formel für die Wahrscheinlichkeit eines Ereignisses in einer n-variablen Bernoulli-Verteilung mit gegebenen Wahrscheinlichkeiten für ein einzelnes Element und für Paare von Elementen . Entsprechend könnte ich Mittelwert und Kovarianz von angeben .X∈{0,1}nX∈{0,1}nX\in\{0,1\}^nP(Xi=1)=piP(Xi=1)=piP(X_i=1)=p_iP(Xi=1∧Xj=1)=pijP(Xi=1∧Xj=1)=pijP(X_i=1 \wedge X_j=1)=p_{ij}XXX Ich habe bereits erfahren, dass es viele Verteilungen mit den Eigenschaften gibt, genauso …

3
Eigenschaften einer diskreten Zufallsvariablen
Mein Statistikkurs hat mir nur beigebracht, dass eine diskrete Zufallsvariable eine endliche Anzahl von Optionen hat ... das hatte ich nicht bemerkt. Ich hätte gedacht, wie eine Reihe von ganzen Zahlen könnte es unendlich sein. Das Googeln und Überprüfen mehrerer Webseiten, darunter einige aus Universitätskursen, hat dies nicht ausdrücklich bestätigt. …

3
Visualisieren Sie die bivariate Binomialverteilung
Frage: Wie sieht eine bivariate Binomialverteilung im dreidimensionalen Raum aus? Unten ist die spezifische Funktion, die ich für verschiedene Werte der Parameter visualisieren möchte; nämlich , p 1 und p 2 .nnnp1p1p_{1}p2p2p_{2} f(x1,x2)=n!x1!x2!px11px22,x1+x2=n,p1+p2=1.f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.f(x_{1},x_{2}) = \frac{n!}{x_{1}!x_{2}!}p_{1}^{x_{1}}p_{2}^{x_{2}}, \qquad x_{1}+x_{2}=n, \quad p_{1}+p_{2}=1. Beachten Sie, dass es zwei Einschränkungen gibt. und p 1 + …

2
Optimales Binning in Bezug auf eine bestimmte Antwortvariable
Ich suche nach einer optimalen Binning-Methode (Diskretisierung) einer kontinuierlichen Variablen in Bezug auf eine gegebene Antwort- (Ziel-) Binärvariable und mit einer maximalen Anzahl von Intervallen als Parameter. Beispiel: Ich habe eine Reihe von Beobachtungen von Personen mit den Variablen "height" (fortlaufende Zahl) und "has_back_pains" (binär). Ich möchte die Höhe in …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.