Eine der Voraussetzungen für eine logistische Regression ist die Linearität des Logits. Sobald ich mein Modell zum Laufen gebracht habe, teste ich es mit dem Box-Tidwell-Test auf Nichtlinearität. Einer meiner kontinuierlichen Prädiktoren (X) wurde positiv auf Nichtlinearität getestet. Was soll ich als nächstes tun? Da dies einen Verstoß gegen die …
Ich weiß, dass für die stetige Variable P[X=x]=0P[X=x]=0P[X=x]=0 . Aber ich kann mir nicht vorstellen, dass wenn P[X=x]=0P[X=x]=0P[X=x]=0 , es unendlich viele mögliche xxx . Und warum werden ihre Wahrscheinlichkeiten unendlich klein?
Sammeln von Metriken zu k Objektennnnkkk Angenommen, ich sammle Metriken über k Objekte. Ich suche nach gültigen Möglichkeiten, um die k Objekte zu vergleichen , damit sie "eingestuft" werden können. Ich denke, dass dies ein ausgetretener Boden ist (Sportstatistiken wie die gesamte Quarterback-Bewertung usw.), aber ich bin mit diesem Bereich …
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
Könnten Sie mir etwas Klarheit über Data Mining und Algorithmen für künstliche Intelligenz geben? Auf welcher mathematischen Basis haben sie gearbeitet? Können Sie mir einen mathematischen Ansatz geben, um diese Art von Algorithmen zu verstehen?
Argumentieren Bayesianer jemals, dass ihr Ansatz den frequentistischen Ansatz verallgemeinert, weil man nicht-informative Prioritäten verwenden und daher eine typische frequentistische Modellstruktur wiederherstellen kann? Kann mich jemand an einen Ort verweisen, an dem ich über dieses Argument lesen kann, wenn es tatsächlich verwendet wird? EDIT: Diese Frage ist vielleicht nicht genau …
Gibt es einen guten veröffentlichten Expository-Bericht mit mathematischen Details zu den verschiedenen Ansätzen, die für das Behrens-Fisher-Problem verwendet wurden?
Kann mir jemand sagen, wie man die Modellierung von Aktualität, Häufigkeit und Geldwert (RFM) sowie die Modellierung des Kundenwerts in R durchführt? Kann mir jemand Literatur dazu geben?
Diese Frage zeigt, wie schwierig es für einen Menschen ist, Statistiken und Wahrscheinlichkeiten selbst zu beherrschen, wenn man sich mit schwach entwickelten Ressourcen wie Wikipedia auseinandersetzt. Mir ist der Gedanke gekommen, dass Berater von Statistikern, und es gibt hier einige, routinemäßig vor der Herausforderung stehen, einem Kunden bestimmte Konzepte und …
Ich interessiere mich sehr für das Potenzial der statistischen Analyse zur Simulation / Vorhersage / Funktionsschätzung usw. Ich weiß jedoch nicht viel darüber und meine mathematischen Kenntnisse sind noch recht begrenzt - ich bin ein Junior-Student in Software-Engineering. Ich bin auf der Suche nach einem Buch, das mir den Einstieg …
Kontext: Ich bin ein Psychologie-Doktorand. Wie bei vielen Doktoranden der Psychologie weiß ich, wie man mit statistischer Software verschiedene statistische Analysen durchführt, bis hin zu Techniken wie PCA, Klassifikationsbäumen und Clusteranalyse. Aber es ist nicht wirklich befriedigend, denn obwohl ich erklären kann, warum ich eine Analyse durchgeführt habe und was …
Dies wurde durch eine effiziente lineare Online-Regression inspiriert , die ich sehr interessant fand. Gibt es Texte oder Ressourcen, die für statistische Berechnungen in großem Maßstab vorgesehen sind, bei denen die Datenmengen zu groß sind, um in den Hauptspeicher zu passen, und die möglicherweise zu unterschiedlich sind, um eine effektive …
Gibt es gute Artikel oder Bücher, die sich mit der Verwendung von Koordinatenabstieg für L1 (Lasso) und / oder elastischer Netzregulierung für lineare Regressionsprobleme befassen?
Kann jemand einige Bücher empfehlen, die als Standardreferenzen für klassische (frequentistische) Statistiken gelten? IE, ziemlich umfassend und auch schon eine Weile da, so dass Tippfehler und Fehler in Formeln eine Chance hatten, überprüft und korrigiert zu werden
Ich arbeite an einem kleinen Textkorpus (200 Millionen), den ich mit einer Clusteranalyse untersuchen möchte. Welche Bücher oder Artikel zu diesem Thema würden Sie empfehlen?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.