Stellen Sie sicher, dass Ihre Frage mit STATISTIK, MASCHINENLERNEN oder DATENANALYSE zusammenhängt und sich nicht nur auf Programmierung, Support oder Fehler bezieht. Fügen Sie zusätzliche Tags hinzu, die sich auf statistische Probleme beziehen.
Ich habe kürzlich einen Beitrag von R-Bloggern gelesen, der mit diesem Blogbeitrag von John Myles White über eine neue Sprache namens Julia verlinkt ist . Julia nutzt einen Just-in-Time-Compiler, der unglaublich schnelle Laufzeiten liefert und die gleiche Größenordnung der Geschwindigkeit wie C / C ++ aufweist (die gleiche Reihenfolge , …
Welche wertvollen Open-Source-Projekte für die statistische Analyse sind derzeit verfügbar? Bearbeiten: Wie von Sharpie hervorgehoben, kann wertvoll bedeuten, Ihnen dabei zu helfen, Dinge schneller oder billiger zu erledigen.
Ich bin ein Doktorand der Wirtschaftswissenschaften, der kürzlich von anderen sehr bekannten statistischen Paketen auf R umgestellt hat (ich habe hauptsächlich SPSS verwendet). Mein kleines Problem im Moment ist, dass ich der einzige R-User in meiner Klasse bin. Meine Klassenkameraden benutzen Stata und Gauss und einer meiner Professoren sagte sogar, …
Hat jemand Erfahrung mit Software (am besten kostenlos, am besten Open Source), die ein Bild von Daten aufnimmt, die auf kartesischen Koordinaten aufgezeichnet sind (ein normaler, alltäglicher Plot), und die Koordinaten der Punkte extrahiert, die in der Grafik aufgezeichnet sind? Dies ist im Wesentlichen ein Data-Mining-Problem und ein umgekehrtes Datenvisualisierungsproblem.
In vielen Tutorials oder Handbüchern scheint die Erzählung zu implizieren, dass R und Python als komplementäre Komponenten des Analyseprozesses nebeneinander existieren. Für mein ungeübtes Auge scheint es jedoch so, als ob beide Sprachen das Gleiche tun. Meine Frage ist also, ob es wirklich spezialisierte Nischen für die beiden Sprachen gibt …
Es scheint, dass viele Leute (einschließlich mir) gerne explorative Datenanalysen in Excel durchführen. Einige Einschränkungen, wie z. B. die Anzahl der Zeilen, die in einer Tabelle zulässig sind, sind problematisch, machen es jedoch in den meisten Fällen nicht unmöglich, Excel zum Herumspielen von Daten zu verwenden. Ein Artikel von McCullough …
Kürzlich bin ich auf Tableau gestoßen und habe versucht, die Daten aus der Datenbank und der CSV-Datei zu visualisieren. Die Benutzeroberfläche ermöglicht es dem Benutzer, zeitliche und räumliche Daten zu visualisieren und Diagramme in einem Augenblick zu erstellen. Ein solches Tool ist sehr nützlich, da es ermöglicht, die Daten grafisch …
Ich werde eine Umgebung im BUGS-Stil ausprobieren, um Bayes'sche Modelle zu schätzen. Gibt es wichtige Vorteile bei der Auswahl zwischen OpenBugs oder JAGS? Wird das eine in absehbarer Zeit das andere ersetzen? Ich werde den ausgewählten Gibbs-Sampler mit R verwenden. Ich habe noch keine spezifische Anwendung, sondern entscheide, welche ich …
Soll ich zum Zeichnen mit R ggplot2 oder ggvis lernen? Ich möchte nicht unbedingt beides lernen, wenn einer von ihnen in irgendeiner Hinsicht überlegen ist. Warum erstellt die R-Community immer wieder neue Pakete mit überlappenden Funktionen? In dem einleitenden Blogpost wird kein Wort darüber verloren, warum ggvis erstellt wird, da …
Ich verstehe, dass diese Frage recht weit gefasst ist, aber ich frage mich, was die entscheidenden Punkte für die Entscheidung sein sollten, ein neues Paket für R zu erstellen (oder nicht). Um genauer zu sein, möchte ich hinzufügen, dass es bei der Frage nicht um die Gründe geht Verwenden Sie …
Ich bin gerade auf diese Arbeit gestoßen , in der beschrieben wird, wie die Wiederholbarkeit (auch bekannt als Zuverlässigkeit, auch bekannt als Intraclass-Korrelation) einer Messung über Mixed-Effects-Modellierung berechnet wird. Der R-Code wäre: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = …
Derzeit muss ich ungefähr 20 Millionen Datensätze analysieren und Vorhersagemodelle erstellen. Bisher habe ich Statistica, SPSS, RapidMiner und R ausprobiert. Unter diesen scheint Statistica am besten für das Data Mining geeignet zu sein, und die RapidMiner-Benutzeroberfläche ist ebenfalls sehr praktisch, aber es scheint, dass Statistica, RapidMiner und SPSS nur für …
Ich habe einen bestimmten MCMC-Algorithmus, den ich nach C / C ++ portieren möchte. Ein Großteil der teuren Berechnung erfolgt in C bereits über Cython, aber ich möchte, dass der gesamte Sampler in einer kompilierten Sprache geschrieben wird, damit ich nur Wrapper für Python / R / Matlab / whatever …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.