Was ist der Sinn von grafischen Modellen?


8

Ich habe den Tag damit verbracht, etwas über das bnlearn-Paket in R zu lernen, nur um festzustellen, dass Bayes'sche Modelle nicht mit ungerichteten Graphen funktionieren. Ich versuche, etwas über das Markov Random Field Network zu lernen, und bisher konnte ich nur die grafische Struktur mit einem grafischen LASSO erstellen.

In gerichteten Graphen scheint es zwei Stufen zu geben: "strukturelles Lernen", das mit einer Methode durchgeführt wird, und "Parameterlernen", das mit einer anderen Methode durchgeführt wird. Meiner Meinung nach gibt das Parameterlernen Auskunft über die Kantengewichte zwischen den einzelnen Variablen (Features) in Ihrem Modell. Meine Frage ist ... na und? Was machen Sie mit einem Diagramm mit Kantengewichten?

Was kann ich daraus lernen, wenn ich einen Datensatz habe, der Beobachtungen nach Merkmalen enthält, und die Knoten meines Diagramms die Merkmale dieses Datensatzes sind (die aus dem grafischen LASSO stammen, das versucht, die Umkehrung der Kovarianzmatrix zu emulieren)? Kann ich Kohorten meiner Daten (getrennt durch den Zielklassenwert) vergleichen und den Knoten eine Art p-Wert-Analyse zuweisen? Ich denke, ich bin verwirrt über das Gesamtbild der grafischen Modelle.

Antworten:


5

Der Wert und die Kraft grafischer Modelle bedingter probabilistischer Beziehungen besteht darin, dass sie Informationen über die Kausalstruktur und die Inferenzstruktur des Systems vermitteln. Zum Beispiel, regen oder Regner verursachen nasse Gehwege, aber nasse Gehwege können nicht Ursache regen oder Sprinkler Sprühen. Wenn Ihre Beweise "Regen" und "keine Sprinkler" sind, können Sie auf bestimmte Dinge schließen. Wenn Ihr Beweis "nasser Bürgersteig" ist, können Sie andere Dinge schließen. Was Sie ableiten können und was nicht, hängt von der Struktur des Diagramms ab.

Ihr Beispiel für "einen Datensatz, bei dem es sich um Beobachtungen nach Merkmalen handelt" ist möglicherweise für einen Wahrscheinlichkeitsgraphen gut geeignet oder nicht. Das Hinzufügen von Ideen / Methoden wie "p-Werten" wird Sie nur verwirren, denke ich. (P-Werte gelten für das Testen häufiger Hypothesen.) Metaphorisch kombinieren Sie Äpfel, Orangen und Gürteltiere.

Ich schlage vor, dass Sie sich Vorlesungen von Judea Pearl ( https://www.youtube.com/watch?v=zHjdd--W6o4 , https://www.youtube.com/watch?v=IiXvpPyhMw8 ) sowie solche Tutorial-Vorlesungen ansehen : https://www.youtube.com/watch?v=YvdpnqMRmfk , https://www.youtube.com/watch?v=Xhdpk9HZQuo .


Ah, okay! Also habe ich mir beide angesehen und festgestellt, dass alle gerichteten Diagramme einen Ergebnisknoten enthalten, und dies ist für mich sinnvoll (dass es eine gerichtete Beziehung zwischen Merkmalen und dem Ergebnis gibt und zwischen Merkmalen, die lineare Kombinationen anderer Merkmale usw. Sind ). Meine Frage ist nun ... wie integriert man Zielknoten (Ergebnisknoten) in grafische Modelle? Die inverse Kovarianzmethode für strukturelles Lernen, die von Markov-RFs verwendet wird, enthält nicht den Zielknoten (Ergebnisklasse) - nur die Merkmalsvektoren des Trainingssatzes usw.
und ist

Markov-RFs beschreiben also die Beziehungen zwischen den Merkmalen, nicht jedoch die Beziehung der Merkmale zur Vorhersageklassenvariablen. Was können Sie also wirklich schließen, außer vielleicht, welche Merkmale im Vergleich zu anderen am einflussreichsten sind?
Areyoujokingme
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.