Ich verstehe, wo der E-Schritt im Algorithmus stattfindet (wie im Abschnitt "Mathematik" unten erläutert). Meiner Meinung nach ist der Schlüsseleinfallsreichtum des Algorithmus die Verwendung der Jensen-Ungleichung, um eine Untergrenze für die Log-Wahrscheinlichkeit zu erstellen. In diesem Sinne Expectation
wird einfach genommen, um die logarithmische Wahrscheinlichkeit neu zu formulieren, um in Jensens Ungleichung zu passen (dh für die konkave Funktion.)
Gibt es einen Grund, warum der E-Schritt so genannt wird? Gibt es eine Bedeutung für das, was wir erwarten (dh ? Ich habe das Gefühl, dass mir eine Intuition fehlt, warum die Erwartung so zentral ist, anstatt einfach nur ein Nebeneffekt der Erwartung zu sein Verwendung von Jensens Ungleichung.
EDIT: Ein Tutorial sagt:
Der Name 'E-Schritt' kommt von der Tatsache, dass man normalerweise nicht die Wahrscheinlichkeitsverteilung über Abschlüsse explizit bilden muss, sondern nur 'erwartete' ausreichende Statistiken über diese Abschlüsse berechnen muss.
Was bedeutet es "man muss die Wahrscheinlichkeitsverteilung über Vervollständigungen normalerweise nicht explizit bilden"? Wie würde diese Wahrscheinlichkeitsverteilung aussehen?
Anhang: E-Schritt im EM-Algorithmus