Ich habe vier numerische Variablen. Alle von ihnen sind ein Maß für die Bodenqualität. Je höher die Variable, desto höher die Qualität. Der Bereich für alle von ihnen ist unterschiedlich:
Var1 von 1 bis 10
Var2 von 1000 bis 2000
Var3 von 150 bis 300
Var4 von 0 bis 5
Ich muss vier Variablen zu einem einzigen Bodenqualitäts-Score kombinieren, der die Reihenfolge erfolgreich einordnet.
Meine Idee ist sehr einfach. Standardisiere alle vier Variablen, fasse sie zusammen und was immer du bekommst, ist die Punktzahl, die nach Rang geordnet werden sollte. Haben Sie Probleme bei der Anwendung dieses Ansatzes? Gibt es einen anderen (besseren) Ansatz, den Sie empfehlen würden?
Vielen Dank
Bearbeiten:
Danke Leute. Es wurde viel über "Fachwissen" diskutiert ... Landwirtschaftliches Zeug ... Während ich mehr Statistiken erwartete. In Bezug auf die Technik, die ich verwenden werde ... Es wird wahrscheinlich einfache Z-Score-Summierung + logistische Regression als Experiment sein. Da die überwiegende Mehrheit der Proben eine schlechte Qualität von 90% aufweist, werde ich 3 Qualitätskategorien zu einer kombinieren und im Grunde genommen ein binäres Problem haben (eine gewisse Qualität im Vergleich zu einer Nichtqualität). Ich töte zwei Fliegen mit einer Klappe. Ich erhöhe meine Stichprobe in Bezug auf die Ereignisrate und setze Experten ein, um sie zu veranlassen, meine Stichproben zu klassifizieren. Von Experten klassifizierte Samples werden dann verwendet, um das Log-Reg-Modell so anzupassen, dass die Übereinstimmung / Diskordanz mit den Experten maximiert wird. Wie klingt das für Sie?