Ich habe es mit einem Problem der überwachten binären Klassifizierung zu tun. Ich möchte das GBM-Paket verwenden, um Personen als nicht infiziert / infiziert zu klassifizieren. Ich habe 15-mal mehr nicht infizierte als infizierte Personen.
Ich habe mich gefragt, ob GBM-Modelle unter unausgeglichenen Klassengrößen leiden? Ich habe keine Referenzen gefunden, die diese Frage beantworten.
Ich habe versucht, die Gewichte anzupassen, indem ich den nicht infizierten Personen ein Gewicht von 1 und den infizierten Personen ein Gewicht von 15 zuwies, aber ich habe schlechte Ergebnisse erzielt.