Wie kann ich überprüfen, ob zwei Signale gemeinsam normalverteilt sind?


10

Wie auf dieser Wikipedia-Seite erläutert , sind zwei Zufallsvariablen X und Y statistisch unabhängig, wenn sie nicht korreliert und gemeinsam normalverteilt sind.

Ich weiß, wie man prüft, ob X und Y korreliert sind, habe aber keine Ahnung, wie man prüft, ob sie gemeinsam normalverteilt sind. Ich kenne kaum Statistiken (ich habe vor ein paar Wochen erfahren, was eine Normalverteilung ist), daher würden einige erklärende Antworten (und möglicherweise einige Links zu Tutorials) wirklich helfen.

Meine Frage lautet also: Wenn zwei Signale eine endliche Anzahl von N-mal abgetastet werden, wie kann ich überprüfen, ob die beiden Signalabtastungen gemeinsam normalverteilt sind?

Zum Beispiel: Die folgenden Bilder zeigen die geschätzte gemeinsame Verteilung von zwei Signalen, s1 und s2, wobei:

x=0.2:0.2:34;
s1 = x*sawtooth(x); %Sawtooth
s2 = randn(size(x,2)); %Gaussian

Geben Sie hier die Bildbeschreibung ein Geben Sie hier die Bildbeschreibung ein

Das gemeinsame PDF wurde mit diesem 2D-Kernel-Dichteschätzer geschätzt .

Aus den Bildern ist leicht ersichtlich, dass das gemeinsame PDF eine hügelartige Form hat, die ungefähr am Ursprung zentriert ist. Ich glaube, dass dies ein Hinweis darauf ist, dass sie tatsächlich gemeinsam normal verteilt sind. Ich möchte jedoch eine Möglichkeit, dies mathematisch zu überprüfen. Gibt es eine Formel, die verwendet werden kann?

Vielen Dank.


Dies ist eine Simulation , wo Sie beginnen mit Signalen , die nicht gemeinsam normal sind durch Aufbau und Ihre statistischen Verfahren scheinen zeigen, dass man einigermaßen sicher sein, dass die Signale sind in der Tat gemeinsam normal. Sollten Sie also prüfen, ob (a) die statistische Methode anwendbar war oder richtig angewendet oder richtig interpretiert wurde, oder (b) Ihre Signalerzeugungsmethode zu Signalen führt, die tatsächlich gemeinsam normal sind, obwohl dies auf den ersten Blick nicht möglich ist gemacht für gemeinsame Normalität (wie wäre der Fall, wenn s1 = randn(size(x,2));; s2 = randn(size(x,2));??
Dilip Sarwate

@ DilipSarwate Das wäre (b). Ich möchte einen Weg finden, um zu überprüfen, ob die gemeinsame Verteilung tatsächlich normal ist.
Rachel

Antworten:


6

Abgesehen von der grafischen Prüfung können Sie einen Normalitätstest verwenden . Für bivariate Daten sind Mardias Tests eine gute Wahl. Sie quantifizieren die Form Ihrer Verteilungen auf zwei verschiedene Arten. Wenn die Form nicht normal aussieht, ergeben die Tests niedrige p-Werte.

Matlab-Implementierungen finden Sie hier .


2

Dies ist eher ein erweiterter Kommentar als ein Versuch, den spezifischen Vorschlag von @ MånsT zu verbessern: Statistische Tests sind im Großen und Ganzen keine Tests dafür, welche Verteilung Daten erzeugt hat, sondern welche NICHT. Es gibt einige Tests, die "abgestimmt" sind, um Antworten auf die Normalitätsfrage zu geben: Ist dies NICHT aus einer Normalverteilung. Der Kolmogorov-Smirnov-Test mit einer Stichprobe ist ziemlich bekannt. Der Anderson Darling-Test ist im One-D-Fall vielleicht leistungsfähiger. Sie sollten sich ernsthaft fragen, WARUM ist die Antwort wichtig? Oft stellen Leute die Frage für die falschen statistischen Zwecke. Ihr Beispiel hat gezeigt, dass Ihr Grafik-Augapfel-Test eine geringe Leistung gegenüber einer Alternative aufweist, die aus einer Sägezahn-Gauß-Alternative besteht. Sie haben jedoch nicht gezeigt, wie sich dieser Fehler auf Ihre zugrunde liegende Frage auswirkt.


In diesem Fall ist der alternative Sägezahn-Gauß-Wert tatsächlich wahr, da auf diese Weise die Daten erzeugt wurden. Der Grafik-Augapfel-Test legt jedoch nahe, dass die Null (gemeinsam normal) nicht zurückgewiesen werden sollte . Die meisten Statistiker verstehen, dass die Nicht-Ablehnung der Null nicht gleichbedeutend ist mit der Akzeptanz der Null, aber das OP möchte einen mathematischen Grund dafür, die Nicht-Ablehnung der Null in eine von ganzem Herzen genommene Umarmung der Null als empfangene Wahrheit (die empfangene Wahrheit) zu verwandeln Fakten verdammt sein).
Dilip Sarwate

Ja. Die Tatsache, dass sein Versuch, seine Simulation zu testen, nicht richtig abgelehnt wurde, wurde verstanden (wie Sie zuvor kommentiert haben). Wie man sich dem Problem der geringen Leistung einer Methode nähern sollte, ist für das statistische Denken von zentraler Bedeutung, und es war nicht klar, ob er das zugrunde liegende Prinzip genau verstanden hatte. Aber ich bin nicht zu dem Schluss gekommen, dass er verlangt, dass ein mathematischer Test sein Augapfelergebnis bestätigt.
DWin

@ DilipSarwate Wenn ich nicht beweisen kann, dass die gemeinsame Verteilung normal ist, möchte ich zeigen, dass es eine gute Wahrscheinlichkeit gibt, dass es tatsächlich so ist. Ich bin kein Statistiker, aber wäre die Nicht-Ablehnung der Null nicht zumindest ein guter Hinweis?
Rachel

@DWin Vielleicht hast du recht und ich habe das zugrunde liegende Prinzip nicht gut genug verstanden. Wie gesagt, ich bin ein Statistik-Neuling! Ich weiß, dass zwei Variablen tatsächlich gemeinsam normalverteilt werden können, und möchte nur überprüfen, ob dies zutrifft (zumindest mit einem bestimmten Maß an Vertrauen / Wahrscheinlichkeit). Und PS: nur eine kleine Notiz - es ist eine sie, kein er.
Rachel

@ Rachel Was du versuchst zu "beweisen", nämlich. dass die beiden Signale gemeinsam normal sind, ist auf den ersten Blick nicht wahr, da eines als Sägezahnsignal erzeugt wurde und das andere Gaußsches Rauschen ist. Sie haben jedoch das Gefühl, dass sie gemeinsam normal sind und dass Ihr Test vernünftige Gründe für einen solchen Glauben liefert. Wie die Rote Königin zu Alice sagte: "Manchmal habe ich vor dem Frühstück bis zu sechs unmögliche Dinge geglaubt." Seien Sie also sicher, dass Ihr Grafik- / Augapfeltest es Ihnen tatsächlich ermöglicht, mit einiger Sicherheit zu schließen, dass die beiden Signale tatsächlich gemeinsam normal sind, und fahren Sie sofort fort.
Dilip Sarwate
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.