Warum haben Statistiker Zufallsmatrizen definiert?


18

Ich habe vor einem Jahrzehnt Mathematik studiert, habe also einen mathematischen und statistischen Hintergrund, aber diese Frage bringt mich um.

Diese Frage ist für mich immer noch etwas philosophisch. Warum haben Statistiker alle möglichen Techniken entwickelt, um mit Zufallsmatrizen zu arbeiten? Ich meine, hat ein zufälliger Vektor das Problem nicht gelöst? Wenn nicht, was ist der Mittelwert der verschiedenen Spalten einer Zufallsmatrix? Anderson (2003, Wiley) betrachtet einen Zufallsvektor als Sonderfall einer Zufallsmatrix mit nur einer Spalte.

Ich sehe keinen Sinn darin, zufällige Matrizen zu haben (und ich bin sicher, das liegt daran, dass ich nichts weiß). Aber ertrage es mit mir. Stellen Sie sich vor, ich habe ein Modell mit 20 Zufallsvariablen. Wenn ich die gemeinsame Wahrscheinlichkeitsfunktion berechnen möchte, warum sollte ich sie als Matrix anstelle eines Vektors darstellen?

Was vermisse ich?

ps: Es tut mir leid für die schlecht getaggte Frage, aber es gab keine Tags für die Zufallsmatrix und ich kann noch keinen erstellen!

Bearbeiten: Matrix in Matrizen im Titel geändert


1
Ich denke, Sie können sich das konzeptionell als zufälligen Vektor vorstellen, der neu angeordnet wurde, sodass es eine Matrix ist.
Matthew Gunn

2
Möglicherweise relevant: en.wikipedia.org/wiki/Random_projection .
DSAXTON

9
Sie können sich auch fragen, warum Matrizen von Interesse sind. Es ist völlig natürlich, jede Matrix, die zur Darstellung eines in der realen Welt beobachteten oder gemessenen Phänomens verwendet wird, als zufällig anzusehen. Dies führt zu einer Vielzahl möglicher Typen und Modelle für Zufallsmatrizen, von Adjazenzmatrizen für Zufallsgraphen bis hin zu Stichproben-Kovarianzmatrizen und mehr.
whuber

2
@Aksakal Ich denke, der Punkt des OP ist, wann es nützlich ist, etwas als Zufallsmatrizen zu analysieren. zB bei der Bildklassifizierung wandeln Sie Ihre Bildmatrizen normalerweise in Vektoren um. Es gibt keine Matrixanalyse. Der Kommentar von whuber ist also die beste Antwort: Eine Kovarianzmatrix muss z. B. positiv und semidefinit sein. Wenn Sie zufällige Kovarianzmatrizen simulieren möchten, ist es einfacher, mit einer Matrixspezifikation als mit einem Vektor zu arbeiten.
Seanv507

2
Zufallsmatrizen sind nur ein Sonderfall von Zufallstensoren.
Anony-Mousse -Reinstate Monica

Antworten:


23

Es hängt davon ab, auf welchem ​​Gebiet Sie tätig sind, aber einer der ersten großen Vorstöße für das Studium von Zufallsmatrizen kam aus der Atomphysik und wurde von Wigner entwickelt. Eine kurze Übersicht finden Sie hier . Insbesondere die Eigenwerte (die in der Atomphysik die Energieniveaus darstellen) von Zufallsmatrizen erzeugten Tonnen von Interesse, da die Korrelationen zwischen den Eigenwerten Einblicke in das Emissionsspektrum von Kernzerfallsprozessen gaben.

In jüngerer Zeit gab es ein großes Wiederaufleben auf diesem Gebiet, mit dem Aufkommen der Tracy-Widom- Verteilung / en für die größten Eigenwerte von Zufallsmatrizen, zusammen mit erstaunlichen Verbindungen zu scheinbar nicht verwandten Gebieten, wie Kacheltheorie , statistische Physik, integrierbar Systeme , KPZ-Phänomene , zufällige Kombinatorik und sogar die Riemann-Hypothese . Weitere Beispiele finden Sie hier .

Für bodenständigere Beispiele ist die Frage nach einer Matrix von Zeilenvektoren natürlich, wie ihre PCA-Komponenten aussehen könnten. Sie können heuristische Schätzungen dafür erhalten, indem Sie annehmen, dass die Daten aus einer gewissen Verteilung stammen, und dann die Kovarianzmatrix-Eigenwerte betrachten, die aus der Zufallsmatrix- Universalität vorhergesagt werden : ungeachtet (innerhalb des Grundes) der Verteilung Ihrer Vektoren, der einschränkenden Verteilung von Eigenwerte nähern sich immer einer Menge bekannter Klassen. Sie können sich dies als eine Art CLT für Zufallsmatrizen vorstellen. In diesem Dokument finden Sie Beispiele.


Danke für deine Antwort. Ich vermutete, dass dies mit einigen mathematischen Techniken zusammenhängen könnte. Aber jetzt macht alles Sinn, die Physik hat sich immer um Mathematik gekümmert und umgekehrt.
Eduardo

Wigners Papier war Mitte der 1950er Jahre, Wisharts Papier Ende der 1920er Jahre. Es ist schwer zu behaupten, dass Wigner meiner Meinung nach den ersten großen Schub gegeben hat.
Aksakal

13

Sie scheinen mit der Anwendung von Zufallsvektoren vertraut zu sein. Ich beschäftige mich zum Beispiel jeden Tag mit dieser Art von Zufallsvektoren: Zinssätzen verschiedener Tenöre. Federal Reserve Bank hat H15-Serie , siehe Schatzwechsel 4-wöchig, 3-monatig, 6-monatig und 1-jährig. Sie können sich diese 4 Raten als einen Vektor mit 4 Elementen vorstellen. Es ist auch zufällig, schauen Sie sich die historischen Werte auf der Grafik unten an.

Bildbeschreibung hier eingeben

Wie bei allen Zufallszahlen könnten wir uns fragen: Was ist die Kovarianz zwischen ihnen? Jetzt erhalten Sie eine 4x4-Kovarianzmatrix. Wenn Sie die Daten für einen Monat pro Tag schätzen, erhalten Sie jedes Jahr 12 verschiedene Kovarianzmatrizen, wenn Sie möchten, dass sie sich nicht überschneiden. Die Muster-Kovarianzmatrix von Zufallsreihen ist selbst ein zufälliges Objekt, siehe Wisharts Aufsatz "DIE GENERALISIERTE PRODUKTMOMENTVERTEILUNG IN PROBEN AUS EINER NORMALEN MULTIVARIATEN BEVÖLKERUNG". hier . Es gibt eine Distribution, die nach ihm benannt ist.

Dies ist ein Weg, um zu zufälligen Matrizen zu gelangen. Es ist kein Wunder, dass die Zufallsmatrixtheorie (RMT) im Finanzwesen verwendet wird, wie Sie jetzt sehen können.


1
Sie erwähnen die Schätzung anhand von "Ein-Monats-Daten", meinen Sie "Ein-Monats-Tagesdaten"?
John

1
@ John, in diesem Beispiel ja, täglich. Einige Zeitreihen werden jedoch innerhalb eines Tages gemessen, z. B. die Aktienkurse. Wenn Sie ein Aktienportfolio haben, können Sie Intraday-Kovarianzmatrizen mit sehr hohen Frequenzen erhalten.
Aksakal

3
+1. Hier umschreiben, aber ich denke, ein Weg, um Zufallsmatrizen zu motivieren, besteht darin, dass wir uns in diesen Fällen oft für die Beziehung zwischen (nicht nur innerhalb von) Zufallsvektoren interessieren . Dies motiviert natürlich zum Nachdenken über Matrizen anstelle von Vektoren.
Cliff AB

@Aksakal Die von Ihnen angegebenen Daten werden sowohl monatlich als auch täglich übermittelt. Ich fand es verwirrend, bevor Sie den Beitrag überarbeitet haben, da es keinen Sinn macht, eine Kovarianzmatrix mit monatlichen Daten zu schätzen.
John

@ John, Sie könnten die Kovarianzmatrix auf monatlichen oder wöchentlichen Daten schätzen, die sich überlappen oder nicht überlappen usw. Es gibt keinen richtigen Weg, dies zu tun.
Aksakal

8

In der theoretischen Physik spielen Zufallsmatrizen eine wichtige Rolle, um universelle Merkmale von Energiespektren von Systemen mit bestimmten Symmetrien zu verstehen.

Mein Hintergrund in der theoretischen Physik mag dazu führen, dass ich hier eine leicht voreingenommene Sichtweise präsentiere, aber ich würde sogar so weit gehen, dass die Popularität der Zufallsmatrixtheorie (RMT) von ihrer erfolgreichen Anwendung in der Physik herrührt.

Ohne zu sehr ins Detail zu gehen, können zum Beispiel Energiespektren in der Quantenmechanik erhalten werden, indem Eigenwerte des Hamiltonschen Systems berechnet werden - was als Hermitsche Matrix ausgedrückt werden kann. Oft sind Physiker nicht an bestimmten Systemen interessiert, sondern möchten wissen, welche allgemeinen Eigenschaften Quantensysteme mit chaotischen Eigenschaften haben, was dazu führt, dass die Werte der hermitischen Hamilton-Matrix den Matrixraum bei Variation der Energie oder anderer Parameter ergodisch ausfüllen ( zB Randbedingungen). Dies motiviert dazu, eine Klasse physikalischer Systeme als zufällige Matrizen zu behandeln und die durchschnittlichen Eigenschaften dieser Systeme zu betrachten. Ich empfehle Literatur über die Bohigas-Gianonni-Schmidt-Vermutung, wenn Sie in diese Tiefe eintauchen möchten.

Kurz gesagt, man kann zum Beispiel zeigen, dass sich Energieniveaus von Systemen mit Zeitumkehrsymmetrie universell anders verhalten als Energieniveaus von Systemen ohne Zeitumkehrsymmetrie (was zum Beispiel passiert, wenn Sie ein Magnetfeld hinzufügen). Eine in der Tat recht kurze Berechnung unter Verwendung von Gaußschen Zufallsmatrizen kann zeigen, dass die Energieniveaus in beiden Systemen tendenziell unterschiedlich nahe beieinander liegen.

Diese Ergebnisse können erweitert werden und helfen, auch andere Symmetrien zu verstehen, die einen großen Einfluss auf verschiedene Bereiche hatten, wie z. B. auch die Teilchenphysik oder die Theorie des mesoskopischen Transports und später sogar auf den Finanzmärkten.


1
aus diesem Grund habe ich die Physik verlassen :) zu viel "Hirnschaden"
Aksakal

Statistiker wie Wishart standen vor den Atomphysikern.
kjetil b halvorsen

5

Eine lineare Karte ist eine Karte zwischen Vektorräumen. Angenommen, Sie haben eine lineare Karte und haben Basen für die Domänen- und Bereichsräume ausgewählt. Dann können Sie eine Matrix schreiben, die die lineare Karte codiert. Wenn Sie zufällige lineare Abbildungen zwischen diesen beiden Räumen berücksichtigen möchten, sollten Sie eine Theorie der Zufallsmatrizen aufstellen. Die Zufallsprojektion ist ein einfaches Beispiel dafür.

Es gibt auch Matrix / Tensor-Objekte in der Physik. Der viskose Spannungstensor ist ein solcher (unter einem wahren Zoo). In nahezu homogenen viskoelastischen Materialien kann es nützlich sein, die Dehnungen (elastisch, viskos usw.) und damit die Spannungen punktweise als zufälligen Tensor mit geringer Varianz zu modellieren. Obwohl es einen "linearen Map" -Sinn für diese Belastung / Beanspruchung gibt, ist es ehrlicher, diese Anwendung von Zufallsmatrizen als Randomisierung von etwas zu beschreiben, das bereits eine Matrix war.


4

Die kompressive Abtastung als Anwendung in der Bildverarbeitung beruht auf Zufallsmatrizen als kombinierte Messungen eines 2D-Signals. Spezifische Eigenschaften dieser Matrizen, nämlich die Kohärenz , sind für diese Matrizen definiert und spielen in der Theorie eine Rolle.

Grob vereinfacht stellt sich heraus, dass Sie durch Minimierung der L1-Norm eines bestimmten Produkts einer Gaußschen Matrix und eines spärlichen Eingangssignals viel mehr Informationen wiederherstellen können, als Sie vielleicht erwarten.

Die bemerkenswerteste frühe Forschung auf diesem Gebiet, die ich kenne, ist die Arbeit der Rice University: http://dsp.rice.edu/research/compressive-sensing/random-matrices

Die Theorie der Matrixprodukte als "Messung eines Signals" reicht mindestens bis in den Zweiten Weltkrieg zurück. Wie mir ein ehemaliger Professor erzählte, war es unerschwinglich, jeden Soldaten einzeln auf Syphilis zu testen. Das systematische Zusammenmischen dieser Proben (indem Teile jeder Blutprobe zusammengemischt und getestet werden) würde die Anzahl der durchzuführenden Tests verringern. Dies könnte als zufälliger binärer Vektor, multipliziert mit einer dünnen Matrix, modelliert werden.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.