Als «r» getaggte Fragen

R ist eine kostenlose Open-Source-Programmiersprache und Softwareumgebung für statistisches Rechnen, Bioinformatik, Visualisierung und allgemeines Rechnen. Bitte geben Sie minimale und reproduzierbare Beispiele zusammen mit der gewünschten Ausgabe an. Verwenden Sie "dput ()" für Daten und geben Sie alle Nicht-Basispakete mit "library ()" - Aufrufen an. Betten Sie keine Bilder für Daten oder Code ein, sondern verwenden Sie stattdessen eingerückte Codeblöcke. Verwenden Sie für statistische Fragen https://stats.stackexchange.com.

1
So schwenken Sie den Datenrahmen, der aus einer Spalte mit Abschnitt und Unterabschnitt besteht. In R.
Ich habe einen unten genannten Datenrahmen: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", "RE", "RE", …



1
Benchmarking der Beispielfunktion in R.
Ich habe das Benchmarking durchgeführt sample Funktion in R verglichen und mit ihr verglichen igraph:sample_seqund auf ein seltsames Ergebnis gestoßen. Wenn ich so etwas wie: library(microbenchmark) library(igraph) set.seed(1234) N <- 55^4 M <- 500 (mbm <- microbenchmark(v1 = {sample(N,M)}, v2 = {igraph::sample_seq(1,N,M)}, times=50)) Ich bekomme ein Ergebnis wie dieses: Unit: …
11 r  random 


3
Verwenden Sie gganimate, um eine Histogrammbeobachtung durch Beobachtung zu erstellen? Muss für größere Datensätze arbeiten (~ n = 5000)
Das Kopfgeld läuft morgen ab . Antworten auf diese Frage erhalten eine Prämie von +200 . max sucht nach einer Antwort von einer seriösen Quelle . Ich möchte Punkte aus einer Normalverteilung abtasten und dann nacheinander mit dem gganimatePaket ein Punktdiagramm erstellen, bis der letzte Frame das vollständige Punktdiagramm zeigt. …

6
doppelte Zeilen in r identifizieren und markieren
Ich möchte doppelte Zeilen anhand von 2 Spalten identifizieren und markieren. Ich möchte für jedes Duplikat eine eindeutige Kennung erstellen, damit ich nicht nur weiß, dass die Zeile ein Duplikat ist, sondern auch, mit welcher Zeile es sich um ein Duplikat handelt. Ich habe einen Datenrahmen, der wie folgt aussieht, …
11 r  dataframe 



5
Holen Sie sich alle Funktionen
In R source()lade ich einige Funktionen: source("functions.R") Ist es möglich, die Liste aller in dieser Datei definierten Funktionen abzurufen? Als Funktionsnamen. (Vielleicht source()kann es selbst irgendwie zurückgeben?). PS: Der letzte Ausweg wäre, das source()zweite Mal aufzurufen local({ source(); })und dann ls()Innen- und Filterfunktionen auszuführen, aber das ist zu kompliziert - …
11 r 

6
Zusammenführen von Datenrahmen basierend auf mehreren Spalten und Schwellenwerten
Ich habe zwei data.frames mit mehreren gemeinsamen Spalten (hier: date, city, ctry, und ( other_) number). Ich möchte sie jetzt in den obigen Spalten zusammenführen, aber einen gewissen Unterschied tolerieren: threshold.numbers <- 3 threshold.date <- 5 # in days Wenn der Unterschied zwischen den dateEinträgen > threshold.date(in Tagen) oder ist …
11 r  dataframe 

2
Erstellen einer mehrspaltigen Facettenfunktion
Ich versuche, eine facet_multi_col()Funktion zu erstellen , die der facet_col()Funktion in ähnelt ggforce- die ein Facettenlayout mit einem Leerzeichenargument ermöglicht (das in nicht verfügbar ist)facet_wrap() ) -, jedoch über mehrere Spalten. Wie im letzten Diagramm unten (erstellt mit grid.arrange()) möchte ich nicht, dass die Facetten notwendigerweise über Zeilen hinweg ausgerichtet …

1
gganimate Handlung, in der Punkte bleiben und Linie verblasst
Hier ist ein reproduzierbares Beispiel eines statischen Diagramms, das ich animieren möchte (ich möchte zeigen, wie sich ein MCMC-Sampler verhält). library(tidyverse) library(gganimate) set.seed(1234) plot_data <- tibble(x=cumsum(rnorm(100)), y=cumsum(rnorm(100)), time=1:length(x)) ggplot(data=plot_data, aes(x=y, y=x)) + geom_point() + geom_line() Was ich sehen möchte, ist, dass die Punkte sichtbar sind, wenn sie gezeichnet und danach …


1
R: Implementierung meines eigenen Algorithmus zur Erhöhung des Gradienten
Ich versuche, meinen eigenen Algorithmus zur Erhöhung des Gradienten zu schreiben. Ich verstehe , gibt es bestehende Pakete wie gbmund xgboost,aber ich wollte verstehen , wie der Algorithmus funktioniert durch meine eigenen zu schreiben. Ich verwende den irisDatensatz und mein Ergebnis ist Sepal.Length(kontinuierlich). Meine Verlustfunktion ist mean(1/2*(y-yhat)^2)(im Grunde der mittlere …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.