Ich habe einen Hintergrund in Computerprogrammierung und elementarer Zahlentheorie, aber kein wirkliches Statistik-Training und habe kürzlich "entdeckt", dass die erstaunliche Welt einer ganzen Reihe von Techniken tatsächlich eine statistische Welt ist. Es scheint, dass Matrixfaktorisierungen, Matrixvervollständigung, hochdimensionale Tensoren, Einbettungen, Dichteschätzung, Bayes'sche Inferenz, Markov-Partitionen, Eigenvektorberechnung und PageRank hochgradig statistische Techniken sind und dass die Algorithmen für maschinelles Lernen, die solche Dinge verwenden, viele Statistiken verwenden .
Mein Ziel ist es, Artikel zu lesen, in denen solche Dinge diskutiert werden, und die Algorithmen zu implementieren oder zu erstellen, während ich die verwendete Notation, "Beweise" und statistische Argumente verstehe. Ich denke, das Schwierigste ist, allen Beweisen zu folgen, die Matrizen beinhalten.
Mit welchen grundlegenden Papieren kann ich anfangen? Oder ein gutes Lehrbuch mit Übungen, die es wert sind, durchgearbeitet zu werden?
Einige Papiere, die ich vollständig verstehen möchte, sind:
- Genaue Matrixvervollständigung durch konvexe Optimierung, Candes, Recht, 2008
- Die schnelle Cauchy-Transformation und schnellere robuste lineare Regression, Clarkson et al., 2013
- Zufällige Projektionen für Support Vector Machines, Paul et al., 2013
- Hochdimensionale Wahrscheinlichkeitsschätzung mit Deep-Density-Modellen, Rippel, Adams, 2013
- Erhalten fehlerminimierender Schätzungen und universeller eintragsbedingter Fehlergrenzen für die Vervollständigung einer Matrix mit niedrigem Rang, Király, Theran, 2013