Dies erinnert mich an die Krebsdiagnostik, bei der alte Genexpressionssignaturen durch neuere ersetzt werden, die natürlich besser sein sollen. Aber wie kann man zeigen, dass sie besser sind?
Hier einige Vorschläge zum Vergleich der Wiederholbarkeit der Methoden.
1. Verwenden Sie die Co-Trägheitsanalyse (CIA).
CIA sollte mehr beworben werden, leider ist es nicht weit verbreitet (zum Beispiel keine Wikipedia-Seite). CIA ist eine Zwei-Tabellen-Methode, die nach dem gleichen Prinzip wie die kanonische Analyse (CA) arbeitet, bei der nach einem Paar linearer Scores mit maximaler Korrelation zwischen zwei Sätzen mehrdimensionaler Messungen gesucht wird. Der Vorteil gegenüber CA besteht darin, dass Sie dies auch dann tun können, wenn Sie mehr Dimensionen als Beobachtungen haben. Sie können beide Methoden an denselben Stichproben messen, um zwei gekoppelte Tabellen mit 30 Spalten undnBeobachtungen. Das erste Paar von Hauptkomponenten sollte stark korreliert sein (wenn Methoden wirklich dasselbe messen). Wenn Methode B besser ist, sollte die Restvarianz kleiner sein als die Restvarianz von Methode A. Mit diesem Ansatz sprechen Sie sowohl die Übereinstimmung der Methoden als auch deren Nichtübereinstimmung an, die Sie als Rauschen interpretieren.
2. Verwenden Sie einen Abstand .
Sie können den euklidischen Abstand in 30 Dimensionen zwischen dem Test und dem erneuten Test verwenden, um die Wiederholbarkeit einer Methode zu messen. Sie generieren für jede Methode eine Stichprobe dieser Punktzahl und können die Stichproben mit dem Wilcoxon-Test vergleichen.
3. Verwenden Sie die nachgeschaltete Anwendung.
Sie erhalten wahrscheinlich diese Fingerabdrücke, um eine Entscheidung zu treffen oder Patienten oder biologisches Material zu klassifizieren. Sie können die Übereinstimmungen und Meinungsverschiedenheiten zwischen Tests und erneuten Tests für beide Methoden zählen und mit dem Wilcoxon-Test vergleichen.
Methode 3 ist die einfachste, aber auch die bodenständigste. Selbst für hochdimensionale Eingaben sind Entscheidungen normalerweise recht einfach. Und wie komplex unser Problem auch sein mag, denken Sie daran, dass Statistik die Wissenschaft der Entscheidung ist.
Bezüglich der Frage in Ihrem Kommentar.
Wie wäre es mit einer robusten Methode zur Reduzierung der Dimensionalität, um die multivariaten Daten auf eine einzige Dimension zu reduzieren und zu analysieren?
Eine Verringerung der Dimensionalität, wie robust sie auch sein mag, ist mit einem Varianzverlust verbunden. Wenn es eine Möglichkeit gibt, Ihren multivariaten Fingerabdruck in eine einzige Partitur umzuwandeln, die fast die gesamte Varianz erfasst, ist dies bei weitem das Beste. Aber warum ist der Fingerabdruck dann überhaupt multivariat?
Aus dem Kontext des OP ging ich davon aus, dass der Fingerabdruck genau deshalb multivariat ist , weil es schwierig ist, seine Dimensionalität weiter zu reduzieren, ohne Informationen zu verlieren. In diesem Fall muss ihre Wiederholbarkeit für eine einzelne Punktzahl kein guter Indikator für die allgemeine Wiederholbarkeit sein, da Sie möglicherweise den größten Teil der Varianz vernachlässigen (im schlimmsten Fall nahe 29/30).