Als «machine-learning» getaggte Fragen

Algorithmen für maschinelles Lernen erstellen ein Modell der Trainingsdaten. Der Begriff "maschinelles Lernen" ist vage definiert; Es umfasst das, was auch als statistisches Lernen, Bestärkungslernen, unbeaufsichtigtes Lernen usw. bezeichnet wird. Fügen Sie immer einen spezifischeren Tag hinzu.

2
Warum Adaboost mit Entscheidungsbäumen?
Ich habe ein wenig über das Verbessern von Algorithmen für Klassifizierungsaufgaben und insbesondere von Adaboost gelesen. Ich verstehe, dass der Zweck von Adaboost darin besteht, mehrere "schwache Lernende" aufzunehmen und durch eine Reihe von Iterationen von Trainingsdaten die Klassifizierer dazu zu bringen, Klassen vorherzusagen, bei denen die Modelle wiederholt Fehler …

2
Wie wähle ich die Trainings-, Kreuzvalidierungs- und Testsatzgrößen für kleine Daten mit Stichprobengröße aus?
Angenommen, ich habe eine kleine Stichprobengröße, z. B. N = 100, und zwei Klassen. Wie soll ich die Trainings-, Kreuzvalidierungs- und Testsatzgrößen für maschinelles Lernen auswählen? Ich würde intuitiv auswählen Trainingsset Größe als 50 Kreuzvalidierungssatz Größe 25 und Testgröße als 25. Aber wahrscheinlich macht das mehr oder weniger Sinn. Wie …

2
Was sind gute Metriken, um die Qualität einer PCA-Anpassung zu bewerten und die Anzahl der Komponenten auszuwählen?
Was ist eine gute Metrik zur Bewertung der Qualität der Hauptkomponentenanalyse (PCA)? Ich habe diesen Algorithmus an einem Datensatz durchgeführt. Mein Ziel war es, die Anzahl der Funktionen zu reduzieren (die Informationen waren sehr redundant). Ich weiß, dass der Prozentsatz der aufbewahrten Varianz ein guter Indikator dafür ist, wie viele …


2
Anomalieerkennung: Welcher Algorithmus soll verwendet werden?
Kontext: Ich entwickle ein System, das klinische Daten analysiert, um unplausible Daten herauszufiltern, bei denen es sich möglicherweise um Tippfehler handelt. Was ich bisher gemacht habe: Um die Plausibilität zu quantifizieren, habe ich bisher versucht, die Daten zu normalisieren und dann einen Plausibilitätswert für Punkt p basierend auf seiner Entfernung …

1
Bewertung der Leistung eines Regressionsmodells mithilfe von Trainings- und Testsätzen?
Ich höre oft von der Bewertung der Leistung eines Klassifizierungsmodells, indem ich den Testsatz aushalte und ein Modell auf dem Trainingssatz trainiere. Erstellen Sie dann zwei Vektoren, einen für die vorhergesagten Werte und einen für die wahren Werte. Ein Vergleich ermöglicht es offensichtlich, die Leistung des Modells anhand seiner Vorhersagekraft …

1
Vergleich von CPH, beschleunigtem Ausfallzeitmodell oder neuronalen Netzen zur Überlebensanalyse
Ich bin neu in der Überlebensanalyse und habe kürzlich erfahren, dass es verschiedene Möglichkeiten gibt, dies bei einem bestimmten Ziel zu tun. Ich interessiere mich für die tatsächliche Umsetzung und Angemessenheit dieser Methoden. Mir wurden die traditionellen Cox-Proportional-Hazards- , Accelerated-Failure-Time-Modelle und neuronalen Netze (Multilayer-Perzeptron) als Methoden vorgestellt, um das Überleben …

2
in Bezug auf die bedingte Unabhängigkeit und ihre grafische Darstellung
Beim Studium der Kovarianzauswahl habe ich einmal das folgende Beispiel gelesen. In Bezug auf das folgende Modell: Seine Kovarianzmatrix und inverse Kovarianzmatrix sind wie folgt angegeben: Ich verstehe nicht, warum die Unabhängigkeit von und y hier durch die inverse Kovarianz bestimmt wird?xxxyyy Welche mathematische Logik liegt dieser Beziehung zugrunde? Außerdem …

1
Entscheidungsbäume Variable (Feature) Skalierung und Variable (Feature) Normalisierung (Tuning) in welchen Implementierungen erforderlich?
In vielen Algorithmen für maschinelles Lernen ist die Feature-Skalierung (auch bekannt als variable Skalierung, Normalisierung) ein häufiger Vorverarbeitungsschritt. Wikipedia - Feature-Skalierung - Diese Frage war knapp. Frage 41704 - Wie und warum funktionieren Normalisierung und Feature-Skalierung? Ich habe zwei Fragen speziell in Bezug auf Entscheidungsbäume: Gibt es Implementierungen von Entscheidungsbäumen, …

6
Flexible und unflexible Modelle beim maschinellen Lernen
Ich stieß auf eine einfache Frage zum Vergleich flexibler Modelle (dh Splines) mit unflexiblen Modellen (z. B. lineare Regression) unter verschiedenen Szenarien. Die Frage ist: Erwarten wir im Allgemeinen, dass die Leistung einer flexiblen statistischen Lernmethode besser oder schlechter abschneidet als eine unflexible Methode, wenn: Die Anzahl der Prädiktoren ppp …

4
Konvergenz der Gewichte neuronaler Netze
Ich kam zu einer Situation, in der die Gewichte meines neuronalen Netzwerks auch nach 500 Iterationen nicht konvergieren. Mein neuronales Netzwerk enthält 1 Eingangsschicht, 1 versteckte Schicht und 1 Ausgangsschicht. Sie sind ungefähr 230 Knoten in der Eingabeebene, 9 Knoten in der verborgenen Ebene und 1 Ausgabeknoten in der Ausgabeschicht. …

3
So erhalten Sie das Konfidenzintervall für die Änderung des Populations-R-Quadrats
Als einfaches Beispiel wird angenommen, dass es zwei lineare Regressionsmodelle gibt Modell 1 hat drei Prädiktoren x1a, x2bundx2c Modell 2 hat drei Prädiktoren aus Modell 1 und zwei zusätzliche Prädiktoren x2aundx2b Es gibt eine Populationsregressionsgleichung, bei der die erklärte Populationsvarianz für Modell 1 für Modell 2 . Die durch Modell …

1
Wie baue ich einen innovativen Ausreißer bei Beobachtung 48 in mein ARIMA-Modell ein?
Ich arbeite an einem Datensatz. Nachdem ich einige Modellidentifikationstechniken angewendet hatte, kam ich mit einem ARIMA (0,2,1) -Modell heraus. Ich habe die detectIOFunktion im Paket TSAin R verwendet, um bei der 48. Beobachtung meines ursprünglichen Datensatzes einen innovativen Ausreißer (IO) zu erkennen . Wie kann ich diesen Ausreißer in mein …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 


1
Statistiken für maschinelles Lernen, Papiere zum Starten?
Ich habe einen Hintergrund in Computerprogrammierung und elementarer Zahlentheorie, aber kein wirkliches Statistik-Training und habe kürzlich "entdeckt", dass die erstaunliche Welt einer ganzen Reihe von Techniken tatsächlich eine statistische Welt ist. Es scheint, dass Matrixfaktorisierungen, Matrixvervollständigung, hochdimensionale Tensoren, Einbettungen, Dichteschätzung, Bayes'sche Inferenz, Markov-Partitionen, Eigenvektorberechnung und PageRank hochgradig statistische Techniken sind …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.