Cross-Posting meiner Frage von Mathoverflow , um einige Statistiken spezifische Hilfe zu finden.
Ich studiere einen physikalischen Prozess, der Daten generiert, die gut in zwei Dimensionen mit nicht negativen Werten projizieren. Jeder Prozess hat eine (projizierte) Spur von- - Punkte - siehe Bild unten.
Die Beispielspuren sind blau, ein problematischer Spurtyp wurde von Hand in Grün gezeichnet, und ein bedenklicher Bereich ist in Rot gezeichnet:
Jede Spur ist das Ergebnis eines unabhängigen Experiments. Zwanzig Millionen Experimente wurden über mehrere Jahre durchgeführt, aber von diesen zeigen nur zweitausend das Merkmal, das wir als Spur zeichnen. Wir beschäftigen uns nur mit den Experimenten, die eine Spur erzeugen, daher besteht unser Datensatz aus (ungefähr) zweitausend Spuren.
Es ist möglich, dass ein Track in die betroffene Region gelangt, und wir erwarten dies in der Größenordnung von im Tracks dazu. Die Schätzung dieser Zahl ist die vorliegende Frage:
Wie können wir die Wahrscheinlichkeit berechnen, dass eine beliebige Spur in die betreffende Region gelangt?
Es ist nicht möglich, Experimente schnell genug durchzuführen, um festzustellen, wie oft Spuren generiert werden, die in den betreffenden Bereich gelangen. Daher müssen wir aus den verfügbaren Daten extrapolieren.
Wir haben zum Beispiel gepasst Werte angegeben Dies behandelt Daten wie die grüne Spur jedoch nicht ausreichend - es scheint notwendig zu sein, ein Modell zu haben, das beide Dimensionen umfasst.
Wir haben den Mindestabstand von jeder Strecke zur betreffenden Region angepasst, sind jedoch nicht davon überzeugt, dass dies zu einem vertretbaren Ergebnis führt.
1) Gibt es eine bekannte Möglichkeit, eine Verteilung für die Extrapolation an diese Art von Daten anzupassen?
-oder-
2) Gibt es eine offensichtliche Möglichkeit, diese Daten zu verwenden, um ein Modell zum Generieren von Spuren zu erstellen? Verwenden Sie beispielsweise die Hauptkomponentenanalyse auf den Spuren als Punkte in einem großen Raum und passen Sie dann eine Verteilung (Pearson?) An die auf diese Komponenten projizierten Spuren an.