Ich habe einen Datensatz, der nominell 16-dimensional ist. Ich habe ungefähr 100 Proben in einem Fall und ungefähr 20.000 in einem anderen. Basierend auf verschiedenen explorativen Analysen, die ich mit PCA und Wärmekarten durchgeführt habe, bin ich überzeugt, dass die wahre Dimensionalität (dh die Anzahl der Dimensionen, die zum Erfassen des größten Teils des "Signals" erforderlich sind) bei etwa 4 liegt. Ich möchte eine Folie erstellen dieser Effekt für eine Präsentation. Die "konventionelle Weisheit" über diese Daten, die ich widerlegen möchte, ist, dass die wahre Dimensionalität eins oder zwei ist.
Was ist eine gute, einfache Visualisierung, um die wahre Dimensionalität eines Datensatzes zu zeigen? Vorzugsweise sollte es für Personen verständlich sein, die einen statistischen Hintergrund haben, aber keine "echten" Statistiker sind.