Aufbau von Wahrscheinlichkeitsverteilungsfunktionen aus Beobachtung

7

Es gibt N Spieler und M Objekte, jedes der Objekte hat einen Wert. Jeder Spieler hat eine Strategie bei der Auswahl eines Objekts. In jeder Runde, in der ein Spieler ein Objekt auswählt, können viele Spieler dasselbe Objekt auswählen. Der Wert jedes Objekts wird jedoch gleichmäßig auf jeden Spieler aufgeteilt, der es ausgewählt hat. Pro Spiel gibt es 9000 Runden (Auswahlmöglichkeiten). Unser Ziel ist es, die Werte zu maximieren, die wir am Ende des Spiels sammeln.

Frage: Wie kann ich für jedes Spiel eine Wahrscheinlichkeitsverteilungsfunktion erstellen, vorausgesetzt, ihre Entscheidungen sind Zufallsvariablen?

Aktueller Ansatz: Mein aktueller Ansatz besteht darin, die Häufigkeit zu zählen, mit der ein Spieler ein bestimmtes Objekt auswählt und durch die Gesamtzahl der Runden dividiert. Dies würde eine Wahrscheinlichkeit ergeben, dass ein Spieler dieses bestimmte Objekt wahrscheinlich auswählt.

Problem: Da jeder Spieler aggressiv spielt und versucht, so unvorhersehbar wie möglich zu sein (Rauschen), sind die Wahrscheinlichkeitsverteilungsfunktionen nach meinem derzeitigen Ansatz nicht genau (9000 Runden scheinen nicht genügend Daten zu sein). Gibt es eine bessere Möglichkeit, diese Verteilungsfunktionen zu erstellen?

Hinweis: Ich habe irgendwo gelesen, dass (Bayes-Modell und HMM) besser sind als Frequenzzählungen, aber ich bin nicht sicher, wie ich es an diese Situation anpassen soll.

machine-learning probability-theory modelling

— Mike G.
quelle

2

Können Sie etwas über die Distributionen annehmen ? Alle mir bekannten Methoden setzen ein parametrisches Modell voraus und trainieren die Parameter anhand der Daten. Einige Modelle sind allgemeiner als andere (und einige Leute überspringen die Annahmen und trainieren jedes Modell, von dem bekannt ist, dass es ohnehin brauchbare Ergebnisse liefert), aber ohne jede Annahme bezweifle ich, dass Sie viel tun können (auf rigorose Weise).

— Raphael

@Raphael Sie können davon ausgehen, dass Spieler den höchsten Wert bevorzugen, den sie erhalten können, nachdem sie das Objekt unter den Personen aufgeteilt haben, die es ausgewählt haben. Können Sie eine Antwort mit Ihrer Idee posten?

— Mike G

1

Ich bin mir nicht sicher, ob ich richtig verstehe, was die Frage ist oder aus welchen Beobachtungen die (experimentellen) Verteilungen geschätzt werden sollen .

Das Problem einer Verteilungsschätzung hängt mehr mit der Statistik als mit der Informatik zusammen, obwohl es auch in diesem Bereich relevant sein kann.

Es gibt verschiedene Methoden, die zwei Hauptansätze verwenden:

Parametrisierte Modelle einer Wahrscheinlichkeitsverteilung, bei denen man (unter der Annahme von Vorkenntnissen) ein vordefiniertes Modell (oder eine Form oder Funktion) der Verteilung (z. B. einen Gaußschen ) mit einigen freien Parametern in Abhängigkeit von Daten (Beobachtungen) verwendet und diese Parameter (z durch Maximum Likelihood oder EM-Algorithmus oder Maximum Entropy etc ..). Auch wenn die Form der Prob-Verteilung nicht bekannt ist, kann diese Methode für Approximationen wie Gauusian Mixture Models verwendet werden . Diese Methode erzeugt glatte (und normalerweise robuste ) geschätzte Verteilungen, vorausgesetzt, die vorherige Form liegt nahe am zugrunde liegenden Prob. Verteilung.
Nicht parametrisierte Modelle, schätzen die gesamte PD (einschließlich ihrer Form) direkt aus den Daten. Methoden in dieser Kategorie sind Parzen-Fenster und Kernel-Schätzung . Diese Methode kann aus der parametrisierten Schätzung besser abgeleitet werden, vorausgesetzt, die Form des zugrunde liegenden PDF ist völlig unbekannt oder nicht trivial oder in gewissem Sinne unregelmäßig.

Alle vorherigen Methoden sind rechnerisch effizient (obwohl nicht unbedingt polynomisch). Dies ist wie die Funktionsweise des Simplex-Algorithmus, obwohl es keine Polynomzeit ist, ist es in vielen praktischen Situationen effizient.

— Nikos M.
quelle

1

Ich denke, Sie verwenden den falschen Ansatz. Ich schlage vor, Sie verwenden die Spieltheorie, um Ihr optimales Spiel herauszufinden.

Beginnen Sie mit dem Sonderfall von $N=2$ ;; Jeder Spieler hat $M$ Entscheidungen, so haben wir eine $M\times M$ Auszahlungsmatrix. Die Auszahlungsmatrix ist einfach zu definieren. Die optimale Strategie ist (im Allgemeinen) eine randomisierte Strategie. Es gibt Standardmethoden zur Berechnung der optimalen Strategie unter Berücksichtigung der Auszahlungsmatrix. Dann können Sie die optimale Strategie spielen. So für $N=2$ Das Lösen dieses Spiels ist einfach.

Zum $N>2$ Die Spieltheorie wird etwas komplizierter, aber ich denke, ähnliche Ideen stellen immer noch einen besseren Ansatz für dieses Problem dar, als zu versuchen, die Verteilung zu schätzen, die jeder Spieler in der Vergangenheit gewählt hat. Schließlich ist die Vergangenheit nicht unbedingt repräsentativ für das zukünftige Spiel. Spieler können ihre Auswahl im Laufe der Zeit ändern, sodass die Verteilung ihrer Auswahl zu Beginn des Spiels möglicherweise nicht repräsentativ für die Verteilung ihrer Auswahl zu einem späteren Zeitpunkt im Spiel ist.

— DW
quelle