Das spezifische Klassifizierungsverhalten hängt von der bestimmten Modellform ab, die einer Klassifizierungsmethode zugrunde liegt. Die genaue Reaktion eines Modells auf zusätzliche Objektklassen kann in bestimmten Fällen mathematisch abgeleitet werden, obwohl dies kompliziert sein kann. Da Sie keine Details zu einer bestimmten Methode angegeben haben, gehe ich davon aus, dass Sie mehr an der allgemeinen Reaktion von Klassifizierungsmodellen auf das Hinzufügen oder Entfernen von Objektklassen interessiert sind . Um dies zu beantworten, werde ich intuitiv erklären, was Sie in einem rationalen Modell dieser Art von Situation erwarten sollten. In dem Maße, in dem das Modell unter allgemeinen Bedingungen von diesem intuitiven Ergebnis abweicht, betrachte ich dies als Mangel. Daher betrachte ich die folgenden Antworten als Desiderat für ein Objektvorhersagesystem.
Vorhersage in einem Modell mit beliebigen Objektklassen: Um die Analyse dieses Problems zu erleichtern, nehmen wir an, Sie haben Bilder von Straßenschildern (oder irgendetwas anderem), die jeweils als einzelne von Typen vorliegen. Lassen Sie ohne Verlust der Allgemeinheit die wahren Typen der Objekte sein, die Sie klassifizieren möchten , wobei die wahren Objekttypen sind. Angenommen, Sie legen ein Erkennungssystem fest, das jedes Bild in Typen in der endlichen Menge , wobei wir feststellen, dass Beschriftungen enthalten kann, die sich inN.mθ1, . . . ,θN.∈ M.≡ { 1 , 2 , . . . , m }M.S.⊂ N.S.M.Es kann jedoch auch Werte enthalten, die nicht in diesem Satz enthalten sind (dh, Ihr Erkennungssystem versucht möglicherweise, Objekttypen zu finden, die nicht vorhanden sind).
Ein Erkennungssystem dieser Art betrachtet Bilddaten von jedem der Bilder und verwendet diese Daten, um jedes Bild basierend auf den zulässigen Typen im Modell in einen geschätzten Typ zu klassifizieren. Im Allgemeinen kann dies durch die folgenden Komponenten beschrieben werden:
Datax1,...,xNModel TypesSEstimatesθ^1,...,θ^N∈S
Die Wahrscheinlichkeit einer korrekten Klassifizierung von Bild für ein Modell mit den Typen ist:iS
pi(S)≡P(θ^i=θi|x,S)=∑s∈M ∩ SP(θ^i=s|x,S)I(θi=s).
Die Elemente der letzteren Summierung unterliegen der Wahrscheinlichkeitsbeschränkung:
∑s∈M ∩ SP(θ^i=s|x,S)=1.
Wenn nun dann ist , da der wahre Objekttyp nicht im Modell enthalten ist. Wenn also Elemente von nicht in , kann dies dazu führen, dass diese fehlenden Elementtypen nicht korrekt identifiziert werden können. Wenn wir dagegen ein Element aus der Menge , ist ceteris paribusθi∉Spi(S)=0MSSDies erhöht die Wahrscheinlichkeit der Vorhersage der verbleibenden Objekttypen, da die Wahrscheinlichkeiten der Vorhersagen eins ergeben müssen. Daher erhöht der Ausschluss eines Objekttyps tendenziell die Vorhersagewahrscheinlichkeiten für andere Objekttypen, wodurch sich die Wahrscheinlichkeit einer korrekten Vorhersage für echte Objekttypen in .S
Eine detailliertere Analyse müsste die Verbindung zwischen den Daten und den Objektvorhersagen herstellen. Wir werden hier nicht näher auf dieses Thema eingehen, da das jeweilige Modell nicht spezifiziert ist. Allerdings können wir es als eine allgemeine Eigenschaft von Vorhersagemodellen nehmen , dass sie größere Schwierigkeiten zu haben , neigen dazu , Objekttypen differenzieren , die aussehen ähnlich und neigen dazu , weniger zu haben , schwer Objekttypen differenzieren , die aussehen unähnlich . Daher erhöht der Ausschluss eines Objekttyps aus der Menge tendenziell die Wahrscheinlichkeit der Vorhersage anderer Objekttypen in dieser Menge, die diesem ausgeschlossenen Objekt ähnlich sehen, in Fällen, in denen die Daten einem dieser Typen förderlich sind .xS
Die obige Darstellung soll einige allgemeine Hinweise geben, in denen die Wahrscheinlichkeitsbeschränkung bei Vorhersagen und die Art und Weise, wie sich dies auf die Wahrscheinlichkeit einer korrekten Vorhersage auswirkt, hervorgehoben werden. Dies führt zu den folgenden allgemeinen Prinzipien eines rational konstruierten Klassifikationsmodells. Ceteris paribus sollte Folgendes (zumindest ungefähr) gelten:
Wenn ein echter Objekttyp aus dem Klassifizierungsmodell ausgeschlossen wird, verringert dies die Wahrscheinlichkeit einer korrekten Vorhersage dieses Objekttyps auf Null, erhöht jedoch tendenziell die Wahrscheinlichkeit einer korrekten Vorhersage für andere Objekttypen (insbesondere Objekttypen, die so aussehen ausgeschlossener Typ);
Wenn dem Klassifizierungsmodell ein echter Objekttyp hinzugefügt wird, kann das Modell eine Wahrscheinlichkeit ungleich Null für eine korrekte Vorhersage dieses Objekttyps aufweisen, verringert jedoch tendenziell die Wahrscheinlichkeit einer korrekten Vorhersage für andere Objekttypen (insbesondere für Objekte) Typen, die wie der hinzugefügte Typ aussehen);
Wenn ein falscher Objekttyp aus dem Klassifizierungsmodell ausgeschlossen wird, erhöht dies tendenziell die Wahrscheinlichkeit einer korrekten Vorhersage für alle echten Objekttypen (insbesondere Objekttypen, die wie dieser ausgeschlossene Typ aussehen). und
Wenn dem Klassifizierungsmodell ein falscher Objekttyp hinzugefügt wird, verringert dies tendenziell die Wahrscheinlichkeit einer korrekten Vorhersage für alle echten Objekttypen (insbesondere Objekttypen, die dem hinzugefügten Typ ähneln).
Diese allgemeinen Prinzipien können in bestimmten Modellen einige pathologische Ausnahmen aufweisen, wenn zwischen Bildern eine komplexe Multikollinearität besteht. Sie sollten jedoch als allgemeine Regeln gelten, die in gut erzogenen Modellen unter allgemeinen Bedingungen auftreten werden.