Gibt es ein Standardverfahren (so dass man es als Referenz anführen könnte), um die Teilmenge der Datenpunkte aus einem größeren Pool mit der stärksten Korrelation (entlang nur zwei Dimensionen) auszuwählen?
Angenommen, Sie haben 100 Datenpunkte. Sie möchten eine Teilmenge von 40 Punkten mit der größtmöglichen Korrelation entlang der X- und Y-Dimensionen.
Mir ist klar, dass das Schreiben von Code dafür relativ einfach ist, aber ich frage mich, ob es eine Quelle gibt, die ich dafür zitieren kann.