Als «computational-statistics» getaggte Fragen

Bezieht sich auf die Schnittstelle von Statistik und Computer; die Verwendung von Algorithmen und Software für statistische Zwecke.

1
Lösung des Lasso-Problems in geschlossener Form, wenn die Datenmatrix diagonal ist
\newcommand{\diag}{\operatorname{diag}} Wir haben das Problem: mit der Annahme, dass: \ sum_ {i = 1} ^ nx_ix_i ^ T = \ diag (\ sigma_1 ^ 2, ..., \ sigma_d ^ 2).minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),\min_{w\in\mathbb{R}^{d}}\left( \frac{1}{n}\sum_{i=1}^{n} \left( \langle w,x_{i}\rangle-y_{i} \right)^{2} +2\lambda||w||_1\right),∑i=1nxixTi=diag(σ21,...,σ2d).∑i=1nxixiT=diag⁡(σ12,...,σd2).\sum_{i=1}^nx_ix_i^T=\diag(\sigma_1^2,...,\sigma_d^2). Gibt es in diesem Fall eine geschlossene Lösung? Ich habe folgendes: (XTX)−1=diag(σ−21,...,σ−2d),(XTX)−1=diag⁡(σ1−2,...,σd−2),(X^TX)^{-1}=\diag\left(\sigma_1^{-2},...,\sigma_d^{-2}\right), und daher …

7
Statistiktheorie und -anwendungen sinnvoll nutzen
Ich habe vor kurzem meinen Master in medizinischer und biologischer Modellierung abgeschlossen, begleitet von Ingenieurmathematik als Hintergrund. Obwohl mein Ausbildungsprogramm eine beträchtliche Anzahl von Kursen in mathematischer Statistik (siehe unten für eine Liste) enthielt, die ich mit ziemlich hohen Noten absolvierte, habe ich es häufig völlig verloren, sowohl auf Theorie …

1
Wie kann ich die Recheneffizienz optimieren, wenn ich ein komplexes Modell wiederholt an einen großen Datensatz anpasse?
Ich habe Leistungsprobleme mit dem MCMCglmmPaket in R, um ein Modell mit gemischten Effekten auszuführen. Der Code sieht folgendermaßen aus: MC1<-MCMCglmm(bull~1,random=~school,data=dt,family="categorical" , prior=list(R=list(V=1,fix=1), G=list(G1=list(V=1, nu=0))) , slice=T, nitt=iter, ,burnin=burn, verbose=F) Die Daten enthalten rund 20.000 Beobachtungen, die in rund 200 Schulen zusammengefasst sind. Ich habe alle nicht verwendeten Variablen aus …

4
Ausreißererkennung in Zeitreihen: Wie können Fehlalarme reduziert werden?
Ich versuche, die Erkennung von Ausreißern in Zeitreihen zu automatisieren, und habe eine Modifikation der hier von Rob Hyndman vorgeschlagenen Lösung verwendet . Angenommen, ich messe die täglichen Besuche einer Website aus verschiedenen Ländern. In einigen Ländern, in denen die täglichen Besuche einige Hundert oder Tausende betragen, scheint meine Methode …


1
Was ist dieser „maximale Korrelationskoeffizient“?
Eine typische Bildverarbeitungsstatistik ist die Verwendung von Haralick-Texturmerkmalen (14). Ich wundere mich über das 14. dieser Merkmale: Bei gegebener Adjazenzkarte (die wir einfach als empirische Verteilung von zwei ganzen Zahlen i , j < 256 betrachten können ) ist sie definiert als: die Quadratwurzel des zweiten Eigenwerts von Q , …

1
Eine vergleichbare Kontrollgruppe für eine Behandlungsgruppe finden?
Ich habe eine Behandlungsgruppe der Größe 30 (30 Schulen in Kalifornien), die eine ergänzende Mathe-Software verwendet hat. In einer einfachen Analyse möchte ich das durchschnittliche Mathematikwachstum der Schüler zwischen unserer Behandlungsgruppe und einer vergleichbaren Kontrollgruppe vergleichen. Es gibt viele Schulen in Kalifornien, die die Software nicht verwendet haben. Ich möchte, …


3
Ist es in R (oder allgemein) möglich, Regressionskoeffizienten als bestimmtes Vorzeichen zu erzwingen?
Ich arbeite mit einigen Daten aus der realen Welt und die Regressionsmodelle liefern einige kontraintuitive Ergebnisse. Normalerweise vertraue ich der Statistik, aber in Wirklichkeit können einige dieser Dinge nicht wahr sein. Das Hauptproblem, das ich sehe, ist, dass eine Zunahme einer Variablen eine Zunahme der Antwort verursacht, wenn sie tatsächlich …

1
Schnelle Berechnung / Schätzung eines linearen Systems mit niedrigem Rang
Lineare Gleichungssysteme sind in der Computerstatistik allgegenwärtig. Ein spezielles System, auf das ich gestoßen bin (z. B. in der Faktoranalyse), ist das System Ax=bAx=bAx=b wobei Hier ist eine Diagonalmatrix mit einer streng positiven Diagonale, ist eine (mit ) symmetrische positive semidefinitive Matrix und ist eine beliebige Matrix. Wir werden gebeten, …

4
Statistische Software testen
Welche Techniken / Ansätze sind beim Testen statistischer Software nützlich? Ich interessiere mich besonders für Programme, die parametrische Schätzungen mit maximaler Wahrscheinlichkeit durchführen. Der Vergleich von Ergebnissen mit denen aus anderen Programmen oder veröffentlichten Quellen ist nicht immer möglich, da die meiste Zeit, wenn ich ein eigenes Programm schreibe, die …




4
Warum ist ein Gefälle erforderlich?
Wenn wir die Kostenfunktion differenzieren und Parameter finden können, indem wir Gleichungen lösen, die durch partielle Differenzierung in Bezug auf jeden Parameter erhalten wurden, und herausfinden, wo die Kostenfunktion minimal ist. Ich denke auch, dass es möglich ist, mehrere Orte zu finden, an denen die Ableitungen Null sind, wodurch wir …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.