Ich bin ein Anfänger in Statistik (habe nur einen College-Kurs belegt), aber ich habe einen Hintergrund in Programmierung.
Ich habe gerade angefangen, mit einer Bayes'schen Klassifikatorbibliothek für Ruby zu spielen, und ich suche nach Ideen für zu analysierende Dinge.
Im Moment spiele ich mit der Tweet-Kategorisierung herum, aber hast du irgendwelche Ideen?
Noch wichtiger ist, wie kann ich herausfinden, welche Datentypen sich für eine naive Bayes'sche Klassifizierung eignen.
Vielen Dank.