Ich versuche, einen akademischen Artikel zu verstehen, den ich über die logistische Regression für Marketing-Zuschreibungen lese - http://www.turn.com.akadns.net/sites/default/files/whitepapers/TURN_Tech_WP_Data-driven_Multi-touch_Attribution_Models.pdf
Insbesondere dieser Absatz:
Schritt 1. Für einen bestimmten Datensatz einen Anteil (ps) aller Stichprobenbeobachtungen und einen Anteil (pc) aller Kovariaten abtasten. Passen Sie ein logistisches Regressionsmodell an die abgetasteten Kovariaten und die abgetasteten Daten an. Notieren Sie die geschätzten Koeffizienten - wir empfehlen, ps und pc so zu wählen, dass Werte um 0,5 angenommen werden, wenn sowohl die Variabilität als auch die Genauigkeit von Bedeutung sind
Kann jemand bitte erklären, was dies in (hoffentlich) einfachem Englisch bedeutet? Nach meinem Verständnis besteht die Idee darin, die logistische Regression für 0,5 zufällige Teilmengen der Stichprobendaten fortzusetzen und dann alle logarithmischen ungeraden Koeffizienten zu mitteln, die einen Auswahlschwellenwert von 0,5 erfüllen.
Völlig optionale Bonuspunkte 1 : Nebenbei bemerkt, ähnelt diese Implementierung der Idee einer randomisierten logistischen Regression in Scikit Learn für Python? Wenn nicht, was ist der Unterschied? http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.RandomizedLogisticRegression.html
Vollständig optionale Bonuspunkte 2 : Gibt es eine Möglichkeit, geordnete Effekte in ein verpacktes logistisches Regressionsmodell einzubeziehen (z. B. die Reihenfolge, in der die Prädiktorvariablen, in diesem Fall Werbung, angezeigt wurden - dies betrifft jedoch zweitens die Hauptfrage).
sklearn.ensemble.BaggingClassifier
erreichen, was die Autoren getan haben. BaggingClassifier