Was ist eine Markov-Kette und wie kann sie zur Erzeugung künstlicher Intelligenz verwendet werden?


7

Ich glaube, eine Markov-Kette ist eine Folge von Ereignissen, bei denen jedes nachfolgende Ereignis wahrscheinlich vom aktuellen Ereignis abhängt. Was sind Beispiele für die Anwendung einer Markov-Kette und kann damit künstliche Intelligenz erzeugt werden? Wäre ein genetischer Algorithmus ein Beispiel für eine Markov-Kette, da jede Generation vom Zustand der vorherigen Generation abhängt?

Antworten:


9

Ein Markov-Modell enthält die Wahrscheinlichkeit des Übergangs in jeden Zustand unter Berücksichtigung des aktuellen Zustands. "Jeder Zustand" kann nur ein Punkt sein - ob es zum Beispiel an einem bestimmten Tag geregnet hat - oder es kann wie mehrere Dinge aussehen - wie ein Wortpaar. Sie haben wahrscheinlich automatisch generierten seltsamen Text gesehen, der fast Sinn macht, wie Garkov (die Ausgabe eines Markov-Modells, das auf den Garfield-Comics basiert). In diesem Artikel über Coding Horror werden auch die Anwendungen von Markov-Techniken auf den PageRank von Google erwähnt.

Markov-Modelle sind wirklich nur dann leistungsstark, wenn sie viel Input haben, mit dem sie arbeiten können. Wenn eine Maschine viel englischen Text durchschaut, erhält sie eine ziemlich gute Vorstellung davon, welche Wörter im Allgemeinen nach anderen Wörtern kommen. Oder nachdem Sie die Standorthistorie einer Person durchgesehen haben, können Sie herausfinden, wohin diese Person von einem bestimmten Ort aus als nächstes gehen wird. Eine ständige Aktualisierung des "Eingabekorpus", wenn mehr Daten empfangen werden, würde es der Maschine ermöglichen, die Wahrscheinlichkeiten aller Zustandsübergänge abzustimmen.

Genetische Algorithmen sind ziemlich unterschiedliche Dinge. Sie erstellen Funktionen, indem sie Teile von Funktionen mischen und sehen, wie gut jede Funktion bei einer bestimmten Aufgabe ist. Ein untergeordneter Algorithmus hängt von seinen Eltern ab, aber Markov-Modelle sind hauptsächlich daran interessiert, vorherzusagen, was als nächstes in einer Sequenz kommen wird, und keinen neuen Codeabschnitt zu erstellen. Je nachdem, wie einfach das "Alphabet" ist, können Sie möglicherweise ein Markov-Modell verwenden, um eine Kandidatenfunktion auszuspucken. Sie könnten den Übergängen in erfolgreichen Algorithmen sogar dann mehr Gewicht beimessen.


1

(Dies war als Kommentar gedacht, stellte sich aber immer länger heraus)

Ein paar Punkte, um auf Bens Antwort einzugehen :

  • Es ist möglich, verschiedene Modelle (aus vorhandenen Daten!) Zu generieren und dann nach dem Modell zu suchen, das am besten zu neuen Daten passt (z . B. mit knn ). Beispiel:
    • Staaten = { schlafen , essen , gehen , arbeiten }
    • Modell 1: Die wahrscheinlichste Sequenz an Wochentagen, sagen wir: Schlaf → Schlaf → Essen → Gehen → Arbeiten → Arbeiten → Essen → Gehen → Schlafen → Schlafen → Schlafen
    • Modell 2: Wahrscheinlichste Sequenz am Wochenende, einige: Schlaf → Schlaf → Essen → Gehen → Essen → Gehen → Schlafen → Schlafen
    • Neue Daten kommen an: Aus welcher Sequenz stammt sie mit größerer Wahrscheinlichkeit? Modell 1 prüfen, Modell 2 prüfen. Welches passt besser? → Zuweisen
  • Beachten Sie, dass das vorherige Beispiel zu stark vereinfacht ist. Beachten Sie auch, dass dort eine Zeiteinheit benötigt wird (außer z. B. Buchstaben / Wörter).
  • Sie können Markov-Modelle verschachteln . Das bedeutet, dass Sie ein Modell (eine Reihe von Wahrscheinlichkeiten für alle Zustände) in einer "niedrigeren Skala" generieren und es dann in einem abstrakteren Modell verwenden. Beispielsweise können Sie Ihr Tagesmodell auf einen Monat oder ein Jahr verschachteln (z. B. um Feiertage einzuschließen).

Auch sehen Sie diesen Link für eine schöne Einführung und einige Beiträge in crossvalidated .


Was die Frage betrifft, ob künstliche Intelligenz mit solchen Methoden erzeugt werden kann, wäre meine persönliche (einfache) Antwort Nein , da sie nur Daten und Wahrscheinlichkeiten in Beziehung setzen und somit eher zum Zweig Statistik und maschinelles Lernen gehören.

Eine längere Antwort muss die schwache vs. starke KI-Frage berücksichtigen .

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.