Naive Bayes geht offenbar unterschiedlich mit fehlenden Daten um, je nachdem, ob sie in Trainings- oder Test- / Klassifizierungsinstanzen vorhanden sind.
Bei der Klassifizierung von Instanzen wird das Attribut mit dem fehlenden Wert einfach nicht in die Wahrscheinlichkeitsberechnung einbezogen ( http://www.inf.ed.ac.uk/teaching/courses/iaml/slides/naive-2x2.pdf ).
Im Training "ist die Instanz [mit den fehlenden Daten] nicht in der Häufigkeitszählung für die Kombination von Attributwert und Klasse enthalten." ( http://www.csee.wvu.edu/~timm/cs591o/old/BasicMethods.html )
Bedeutet das, dass bestimmte Trainingsaufzeichnungen einfach nicht in der Trainingsphase enthalten sind? Oder bedeutet es etwas anderes?