Als «pca» getaggte Fragen

Die Hauptkomponentenanalyse (PCA) ist eine lineare Dimensionsreduktionstechnik. Es reduziert ein multivariates Dataset auf einen kleineren Satz konstruierter Variablen, wobei so viele Informationen (so viel Varianz) wie möglich erhalten bleiben. Diese Variablen, Hauptkomponenten genannt, sind lineare Kombinationen der Eingangsvariablen.

3
PCA-, ICA- und Laplace-Eigenkarten
Ich interessiere mich sehr für die Laplace-Eigenkartenmethode. Derzeit verwende ich es zur Dimensionsreduzierung für meine medizinischen Datensätze. Bei der Verwendung der Methode bin ich jedoch auf ein Problem gestoßen. Zum Beispiel habe ich einige Daten (Spektren-Signale), ich kann PCA (oder ICA) verwenden, um einige PCs und ICs zu erhalten. Das …
9 pca  ica 

2
Warum ist das Ausmaß der Varianz, das von meinem 1. PC erklärt wird, so nahe an der durchschnittlichen paarweisen Korrelation?
Welche Beziehung besteht zwischen der ersten Hauptkomponente (n) und der durchschnittlichen Korrelation in der Korrelationsmatrix? Zum Beispiel beobachte ich in einer empirischen Anwendung, dass die durchschnittliche Korrelation fast gleich dem Verhältnis der Varianz der ersten Hauptkomponente (erster Eigenwert) zur Gesamtvarianz (Summe aller Eigenwerte) ist. Gibt es eine mathematische Beziehung? Unten …

1
Wie kann man beobachtete mit erwarteten Ereignissen vergleichen?
Angenommen, ich habe eine Stichprobe von Häufigkeiten von 4 möglichen Ereignissen: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 und ich habe die erwarteten Wahrscheinlichkeiten, dass meine Ereignisse eintreten: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Mit der Summe der beobachteten …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
Wann wählen Sie PCA vs. LSA / LSI
Frage: Gibt es allgemeine Richtlinien in Bezug auf die Eingabedateneigenschaften, anhand derer zwischen der Anwendung von PCA und LSA / LSI entschieden werden kann? Kurze Zusammenfassung von PCA vs. LSA / LSI: Die Hauptkomponentenanalyse (PCA) und die latente semantische Analyse (LSA) oder die latente semantische Indexierung (LSI) sind insofern ähnlich, …

1
Wie sind die Ergebnisse der Dimensionsreduktion / mehrdimensionalen Skalierung zu interpretieren?
Ich habe sowohl eine SVD-Zerlegung als auch eine mehrdimensionale Skalierung einer 6-dimensionalen Datenmatrix durchgeführt, um die Struktur der Daten besser zu verstehen. Leider sind alle Singularwerte in derselben Größenordnung, was bedeutet, dass die Dimensionalität der Daten tatsächlich 6 beträgt. Ich möchte jedoch die Werte der Singularvektoren interpretieren können. Zum Beispiel …

2
Wie finde ich Beziehungen zwischen verschiedenen Arten von Ereignissen (definiert durch ihre 2D-Position)?
Ich habe einen Datensatz mit Ereignissen, die im selben Zeitraum aufgetreten sind. Jedes Ereignis hat einen Typ (es gibt nur wenige verschiedene Typen, weniger als zehn) und einen Ort, der als 2D-Punkt dargestellt wird. Ich möchte prüfen, ob eine Korrelation zwischen Ereignistypen oder zwischen Typ und Ort besteht. Beispielsweise treten …




1
CCA durchführen vs. eine abhängige Variable mit PCA erstellen und dann Regression durchführen
Bei zwei mehrdimensionalen Datensätzen, und , führen einige Personen eine multivariable Analyse durch, indem sie mithilfe der Hauptkomponentenanalyse (PCA) eine ersatzabhängige Variable erstellen. Das heißt, führen Sie PCA auf Set aus, nehmen Sie Scores entlang der ersten Komponente und führen Sie eine multiple Regression dieser Scores auf : . (Ich …

3
Muss die auf neuronalen Netzen basierende Klassifizierung reduziert werden?
Ich verwende einen auf neuronalen Netzen basierenden Klassifizierer, um eine Klassifizierung für meine Daten in n-dimensional durchzuführen. Dann dachte ich, es wäre vielleicht eine gute Idee, zuerst eine Dimensionsreduzierung wie PCA für meine Daten durchzuführen und dann die PCA-Ergebnisse in den Klassifikator zu schreiben (ich behalte 3 PCs). Die Klassifizierung …

3
Wie werden Hauptkomponenten als Prädiktoren in GLM verwendet?
Wie würde ich die Ausgabe einer Hauptkomponentenanalyse (PCA) in einem verallgemeinerten linearen Modell (GLM) verwenden, vorausgesetzt, die PCA wird für die Variablenauswahl für das GLM verwendet? Erläuterung: Ich möchte PCA verwenden, um die Verwendung korrelierter Variablen im GLM zu vermeiden. PCA gibt mir jedoch Ausgaben wie .2*variable1+.5*variable3usw. Ich bin es …




Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.