Ich arbeite im Bereich Data Mining und habe nur sehr wenig formale Ausbildung in Statistik absolviert. In letzter Zeit habe ich viele Arbeiten gelesen, die sich auf Bayes'sche Paradigmen für Lernen und Bergbau konzentrieren, was ich sehr interessant finde.
Meine Frage ist (in mehreren Teilen), ob es angesichts eines Problems einen allgemeinen Rahmen gibt, anhand dessen es möglich ist, ein statistisches Modell zu erstellen. Was tun Sie als Erstes, wenn Sie einen Datensatz erhalten, von dem Sie den zugrunde liegenden Prozess modellieren möchten? Gibt es gute Bücher / Tutorials, die diesen Prozess erklären, oder ist es eine Frage der Erfahrung? Steht bei der Erstellung Ihres Modells die Schlussfolgerung im Vordergrund oder möchten Sie zunächst die Daten beschreiben, bevor Sie sich Gedanken darüber machen, wie Sie sie für die Berechnung verwenden sollen?
Jeder Einblick wäre sehr dankbar! Vielen Dank.