Wir haben also das Potenzial für eine Anwendung für maschinelles Lernen, die ziemlich gut in die traditionelle Problemdomäne passt, die durch Klassifizierer gelöst wird, dh wir haben eine Reihe von Attributen, die ein Element und einen "Bucket" beschreiben, in dem sie landen. Anstatt jedoch Modelle zu erstellen Bei Wahrscheinlichkeiten wie in Naive Bayes oder ähnlichen Klassifikatoren möchten wir, dass unsere Ausgabe eine Reihe von ungefähr für Menschen lesbaren Regeln ist, die von einem Endbenutzer überprüft und geändert werden können.
Das Lernen von Assoziationsregeln sieht aus wie die Familie von Algorithmen, die diese Art von Problem löst, aber diese Algorithmen scheinen sich auf die Identifizierung gängiger Merkmalskombinationen zu konzentrieren und enthalten nicht das Konzept eines endgültigen Buckets, auf das diese Merkmale hinweisen könnten. Zum Beispiel sieht unser Datensatz ungefähr so aus:
Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big, steel } => { truck }
Item C { 2-door, small, steel } => { coupe }
Ich möchte nur die Regeln, die besagen: "Wenn es groß und zweitürig ist, ist es ein Lastwagen", nicht die Regeln, die besagen: "Wenn es ein Viertürer ist, ist es auch klein."
Eine Problemumgehung, die ich mir vorstellen kann, besteht darin, einfach Algorithmen zum Lernen von Assoziationsregeln zu verwenden und die Regeln zu ignorieren, die keinen End-Bucket beinhalten, aber das scheint ein bisschen hackig zu sein. Habe ich da draußen eine Familie von Algorithmen verpasst? Oder gehe ich das Problem zunächst falsch an?