Ähnlichkeitsmaß basierend auf mehreren Klassen aus einer hierarchischen Taxonomie?


7

Könnte jemand ein gutes Ähnlichkeitsmaß für Objekte mit mehreren Klassen empfehlen, bei denen jede Klasse Teil einer Hierarchie ist?

Nehmen wir zum Beispiel an, die Klassen sehen folgendermaßen aus:

1 Produce
  1.1 Eggs
    1.1.1 Duck eggs
    1.1.2 Chicken eggs
  1.2 Milk
    1.2.1 Cow milk
    1.2.2 Goat milk
2 Baked goods
  2.1 Cakes
    2.1.1 Cheesecake
    2.1.2 Chocolate

Ein Objekt kann auf jeder Ebene mit Elementen von oben markiert werden, z.

Omelette: eggs, milk (1.1, 1.2)
Duck egg omelette: duck eggs, milk (1.1.1, 1.2)
Goat milk chocolate cheesecake: goat milk, cheesecake, chocolate (1.2.2, 2.1.1, 2.1.2)
Beef: produce (1)

Wenn die Klassen nicht Teil einer Hierarchie wären, würde ich wahrscheinlich die Kosinusähnlichkeit (oder ein Äquivalent) zwischen Klassen, die einem Objekt zugewiesen sind, untersuchen, aber ich möchte die Tatsache nutzen, dass verschiedene Klassen auch dieselben Eltern haben einen gewissen Ähnlichkeitswert haben (z. B. hat Rindfleisch im obigen Beispiel eine geringe Ähnlichkeit mit Omelett, da beide Produkte der Klasse '1 produzieren').

Wenn es hilft, hat die Hierarchie ~ 200k Klassen mit einer maximalen Tiefe von 5.

Antworten:


9

Ich habe zwar nicht genug Fachwissen, um Sie bei der Auswahl des besten Ähnlichkeitsmaßes zu beraten , aber ich habe einige davon in verschiedenen Veröffentlichungen gesehen. Die folgende Sammlung von Forschungsarbeiten wird Ihnen hoffentlich dabei helfen, das optimale Maß für Ihre Forschung zu bestimmen. Bitte beachten Sie, dass ich absichtlich Artikel aufgenommen habe, die sowohl frequentistische als auch bayesianische Ansätze zur hierarchischen Klassifizierung einschließlich Klasseninformationen verwenden, um eine umfassendere Berichterstattung zu ermöglichen.

Frequentistischer Ansatz:

Bayesianischer Ansatz:


1
Vielen Dank für diese Links, es stellte sich heraus, dass der zweite Down fast genau das war, wonach ich gesucht habe.
Dave Challis

1
@ DaveChallis: Es war mir ein Vergnügen! Freut mich helfen zu können.
Aleksandr Blekh
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.