Ähnlichkeit zweier diskreter Fouriertransformationen?


14

Bei der Klimamodellierung suchen Sie nach Modellen, die das Erdklima angemessen abbilden können. Dazu gehört die Darstellung von Mustern, die semi-zyklisch sind: Dinge wie die El Nino-Südoszillation. Die Modellüberprüfung erfolgt jedoch im Allgemeinen über relativ kurze Zeiträume, in denen aussagekräftige Beobachtungsdaten vorliegen (letzte ~ 150 Jahre). Dies bedeutet, dass Ihr Modell möglicherweise die richtigen Muster anzeigt, jedoch nicht in Phase ist, sodass lineare Vergleiche wie die Korrelation nicht erkennen, dass das Modell eine gute Leistung erbringt.

Diskrete Fourier-Transformationen werden üblicherweise zur Analyse von Klimadaten verwendet ( hier ein Beispiel ), um solche zyklischen Muster aufzugreifen. Gibt es ein Standardmaß für die Ähnlichkeit zweier DFTs, das als Überprüfungsinstrument verwendet werden könnte (dh einen Vergleich zwischen der DFT für das Modell und der für die Beobachtungen)?

Wäre es sinnvoll, das Integral des Minimums der beiden flächennormalisierten DFTs (unter Verwendung von absoluten Realwerten) zu nehmen? Ich denke, dies würde zu einer Punktzahl , wobei x = 1 istx[0,1]x=1genau die gleichen Muster und x=0völlig andere Muster. Was könnten die Nachteile einer solchen Methode sein?


3
Haben Sie die Verwendung von Kohärenz (im Sinne der Signalverarbeitung, nicht der statistischen) als spektralübergreifendes Maß untersucht? Ich bin nicht sicher, ob das die Art von Messung ist, die Sie suchen.
Jonsca

@ jonsca: Interessantes Zeug. Ich bin sicher nicht auf der Suche nach Kausalität, aber ich kann sehen, wie nützlich es sein könnte. Das Beispiel auf dieser Wikipedia-Seite ist etwas seltsam (warum enthält es den Luftdruck nicht als Modellvariable?). Auch ich bin nicht sicher , wo die 90% Figur stammt aus ...
naught101

Das ist eine gute Frage. Dieses Beispiel wurde dem Artikel hinzugefügt, seit ich es das letzte Mal gelesen habe. Ich vermute, dass es mit der Kohärenz zu tun haben könnte, die sich auf die Frequenzen pro Tag und pro 2 Tage konzentriert (daher verbunden mit einem täglichen Gezeitenphänomen), aber das ist nur eine Vermutung ...
jonsca

(Ich weiß aber nicht, ob sie diese 90% integriert haben)
jonsca

Antworten:


12

Spektrale Kohärenz würde dies bei richtiger Verwendung tun. Die Kohärenz wird bei jeder Frequenz berechnet und ist daher ein Vektor. Daher wäre eine Summe einer gewichteten Kohärenz ein gutes Maß. Normalerweise möchten Sie die Kohärenzen bei Frequenzen gewichten, die eine hohe Energie in der spektralen Leistungsdichte aufweisen. Auf diese Weise würden Sie die Ähnlichkeiten bei den Frequenzen messen, die die Zeitreihen dominieren, anstatt die Kohärenz mit einer großen Gewichtung zu gewichten, wenn der Inhalt dieser Frequenz in der Zeitreihe vernachlässigbar ist.

In einfachen Worten - die Grundidee besteht darin, die Frequenzen zu finden, bei denen die Amplitude (Energie) in den Signalen hoch ist (interpretieren Sie als die Frequenzen, die jedes Signal dominieren), und dann die Ähnlichkeiten bei diesen Frequenzen mit einem höheren Gewicht zu vergleichen und vergleichen Sie die Signale auf den restlichen Frequenzen mit einem geringeren Gewicht.

Der Bereich, der sich mit Fragen dieser Art befasst, wird als Kreuzspektralanalyse bezeichnet. http://www.atmos.washington.edu/~dennis/552_Notes_6c.pdf ist eine hervorragende Einführung in die spektralübergreifende Analyse.

Optimale Verzögerung: Schauen Sie sich auch meine Antwort hier an: So korrelieren Sie zwei Zeitreihen mit möglichen Zeitunterschieden

Dies beinhaltet das Finden der optimalen Verzögerung unter Verwendung der spektralen Kohärenz. R hat Funktionen zur Berechnung der Leistungsspektraldichten, Auto- und Kreuzkorrelationen, Fouriertransformationen und Kohärenz. Sie müssen den richtigen Code eingeben, um die optimale Verzögerung zu finden und die max. gewichtete Kohärenz. Allerdings muss auch ein Code zum Gewichten des Kohärenzvektors unter Verwendung der Spektraldichte geschrieben werden. Anschließend können Sie die gewichteten Elemente zusammenfassen und mitteln, um die Ähnlichkeit mit der optimalen Verzögerung zu ermitteln.


1
Das ist eine hervorragende Ressource! Es beschäftigt sich mit Hypothesentests, die eine Menge Material auf Kohärenz bequem vermeidet
jonsca

2

Haben Sie einen anderen Ansatz zur Erkennung / Modellierung von Klimasignalen ausprobiert, beispielsweise eine Wavelet-Analyse? Das große Problem, das bei der DFT in der Klimaanalyse auftreten kann, ist genau das, was Sie erwähnen: Die Schwingungen sind nicht perfekt periodisch und haben normalerweise unterschiedliche Zeitspannen, so dass sie tatsächlich viele verschiedene Schwingungsbereiche haben können, was aus Sicht der Fourier-Transformation ziemlich verwirrend ist .

Eine Wavelet-Analyse eignet sich besser für Klimasignale, da Sie damit verschiedene Zeitspannen der Oszillation überprüfen können. So wie unterschiedliche Frequenzen zu unterschiedlichen Zeiten von einem Musikinstrument gespielt werden, können Sie mit der Wavelet-Transformation unterschiedliche Frequenzen in unterschiedlichen Zeiträumen prüfen.

Wenn Sie interessiert sind, sollte diese Arbeit von Lau & Weng (1995) die meisten Ihrer Zweifel an dieser Methode ausräumen. Das Interessanteste daran ist, dass die Wavelet-Transformation eines Modells mit derjenigen der Daten fast direkt vergleichbar ist, da Sie die von Ihrem Modell vorhergesagte Zeitspanne direkt vergleichen können, ohne alle störenden Schwingungsbereiche zu berücksichtigen, die dies nicht tut.

PS: Ich muss hinzufügen, dass ich dies als Kommentar posten wollte, weil es nicht wirklich das ist, wonach die OPs fragen, aber mein Kommentar wäre zu groß gewesen und hätte beschlossen, es als eine Antwort zu posten, die sich als nützlich erweisen könnte ein alternativer Ansatz zu dem von DFTs.


1

Ich habe für und zweitens die Verwendung von Wavelet- und Spektrogramm-basierten Analysen als Alternative zu dft gestimmt. Wenn Sie Ihre Serien in lokalisierte Zeit-Frequenz-Bins zerlegen können, werden die Fourier-Probleme der Aperiodizität und der Nichtstationarität reduziert und es wird ein schönes Profil diskretisierter Daten zum Vergleich bereitgestellt.

Sobald die Daten einem dreidimensionalen Satz von spektraler Energie gegenüber Zeit und Frequenz zugeordnet sind, kann der euklidische Abstand zum Vergleichen von Profilen verwendet werden. Eine perfekte Übereinstimmung würde sich dem unteren Grenzabstand von Null nähern. * Sie können Bereiche für Zeitreihen-Data Mining und Spracherkennung nach ähnlichen Ansätzen durchsuchen.

* Beachten Sie, dass der Wavelet-Binning-Prozess den Informationsgehalt etwas filtert. Wenn die verglichenen Daten keinen Verlust aufweisen, ist ein Vergleich mit euklidischer Distanz im Zeitbereich möglicherweise besser geeignet

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.