Was sind Kriterien und Entscheidungen für die Nichtlinearität in statistischen Modellen?


10

Ich hoffe, dass die folgende allgemeine Frage Sinn macht. Bitte beachten Sie, dass ich für die Zwecke dieser speziellen Frage nicht an theoretischen (Fachgebiets-) Gründen für die Einführung von Nichtlinearität interessiert bin. Daher werde ich die vollständige Frage wie folgt formulieren :

Was ist ein logischer Rahmen ( Kriterien und, wenn möglich, Entscheidungsprozess ) für die Einführung von Nichtlinearität in statistische Modelle aus anderen als theoretischen Gründen (Fachgebiet)? Wie immer sind auch relevante Ressourcen und Referenzen willkommen.

Antworten:


7

Der Modellbildungsprozess beinhaltet, dass ein Modellbauer viele Entscheidungen trifft. Eine der Entscheidungen besteht darin, zwischen verschiedenen Klassen von Modellen zu wählen , die untersucht werden sollen. Es gibt viele Klassen von Modellen, die in Betracht gezogen werden könnten; Zum Beispiel ARIMA-Modelle, ARDL-Modelle, Multiple-of-Error-State-Space-Modelle, LSTAR-Modelle, Min-Max-Modelle, um nur einige zu nennen. Natürlich sind einige Modellklassen breiter als andere, und es ist nicht üblich, dass einige Modellklassen Unterklassen anderer sind.

Angesichts der Art der Frage können wir uns hauptsächlich auf zwei Klassen von Modellen konzentrieren. lineare Modelle und nichtlineare Modelle .

Vor diesem Hintergrund werde ich mich mit der Frage des OP befassen, wann es sinnvoll ist, ein nichtlineares Modell zu übernehmen, und ob es dafür einen logischen Rahmen gibt - aus statistischer und methodischer Sicht.

Als erstes fällt auf, dass lineare Modelle eine kleine Unterklasse nichtlinearer Modelle sind. Mit anderen Worten, lineare Modelle sind Sonderfälle nichtlinearer Modelle. Es gibt einige Ausnahmen von dieser Aussage, aber für die gegenwärtigen Zwecke werden wir nicht viel verlieren, wenn wir sie akzeptieren, um die Sache zu vereinfachen.

In der Regel wählt ein Modellbauer eine Modellklasse aus und wählt ein Modell aus dieser bestimmten Klasse aus, indem er eine bestimmte Methode anwendet. Ein einfaches Beispiel ist, wenn man sich entscheidet, eine Zeitreihe als ARIMA-Prozess zu modellieren und dann der Box-Jenkins-Methode folgt, um ein Modell aus der Klasse der ARIMA-Modelle auszuwählen. Auf diese Weise mit Methoden zu arbeiten, die mit Modellfamilien verbunden sind, ist eine Frage der praktischen Notwendigkeit.

Die Entscheidung, ein nichtlineares Modell zu erstellen, hat zur Folge, dass das Problem der Modellauswahl viel größer wird (es müssen mehr Modelle berücksichtigt werden und mehr Entscheidungen getroffen werden), als wenn aus einer kleineren Gruppe linearer Modelle ausgewählt wird praktisches Problem zur Hand. Darüber hinaus gibt es möglicherweise nicht einmal vollständig entwickelte Methoden (bekannt, akzeptiert, verstanden, leicht zu kommunizieren), um aus einigen Familien nichtlinearer Modelle auszuwählen. Ein weiterer Nachteil der Erstellung nichtlinearer Modelle besteht darin, dass lineare Modelle einfacher zu verwenden sind und ihre probabilistischen Eigenschaften besser bekannt sind ( Teräsvirta, Tjøstheim und Granger (2010) ).

Das OP bittet jedoch um statistische Gründe für die Entscheidung und nicht um praktische oder domänentheoretische Gründe, daher muss ich weitermachen.

Bevor man überhaupt darüber nachdenkt, wie man mit der Auswahl der nichtlinearen Modelle umgeht, muss man zunächst entscheiden, ob man stattdessen mit linearen oder nichtlinearen Modellen arbeitet. Eine Entscheidung! Wie treffe ich diese Wahl?

Mit Berufung auf Granger und Terasvirta (1993) nehme ich das folgende Argument an, das zwei Hauptpunkte als Antwort auf die folgenden zwei Fragen enthält.

F: Wann ist es sinnvoll, ein nichtlineares Modell zu erstellen? Kurz gesagt, es kann nützlich sein, ein nichtlineares Modell zu erstellen, wenn die Klasse der linearen Modelle bereits berücksichtigt wurde und als unzureichend angesehen wird, um die untersuchte Beziehung zu charakterisieren. Man kann sagen, dass dieses nichtlineare Modellierungsverfahren (Entscheidungsprozess) von einfach zu allgemein geht, in dem Sinne, dass es von linear zu nichtlinear geht.

F: Gibt es statistische Gründe, die zur Rechtfertigung der Erstellung eines nichtlinearen Modells herangezogen werden können? Wenn man sich entscheidet, ein nichtlineares Modell basierend auf den Ergebnissen von Linearitätstests zu erstellen, würde ich sagen, ja, das gibt es. Wenn Linearitätstests darauf hindeuten, dass die Beziehung keine signifikante Nichtlinearität aufweist, wird die Erstellung eines nichtlinearen Modells nicht empfohlen. Tests sollten der Entscheidung zum Bauen vorausgehen.

Ich werde diese Punkte unter direkter Bezugnahme auf Granger und Terasvirta (1993) konkretisieren:

Vor der Erstellung eines nichtlinearen Modells ist es ratsam herauszufinden, ob ein lineares Modell die [wirtschaftlichen] Beziehungen, die analysiert werden, tatsächlich angemessen charakterisieren würde. Wenn dies der Fall wäre, gäbe es mehr statistische Theorie für die Erstellung eines vernünftigen Modells als wenn ein nichtlineares Modell angemessen wäre. Darüber hinaus wäre es viel einfacher, optimale Prognosen für mehr als einen Zeitraum zu erhalten, wenn das Modell linear wäre. Zumindest wenn die Zeitreihen kurz sind, kann es vorkommen, dass der Prüfer ein nichtlineares Modell erfolgreich schätzt, obwohl die wahre Beziehung zwischen den Variablen linear ist. Die Gefahr einer unnötigen Komplikation des Modellbaus ist daher real, kann jedoch durch Linearitätstests verringert werden.

In dem neueren Buch Teräsvirta, Tjøstheim und Granger (2010) wird derselbe Rat gegeben, den ich jetzt zitiere:

Aus praktischer Sicht ist es [daher] nützlich, die Linearität zu testen, bevor versucht wird, das kompliziertere nichtlineare Modell abzuschätzen. In vielen Fällen sind Tests sogar unter statistischen Gesichtspunkten erforderlich. Einige beliebte nichtlineare Modelle werden unter Linearität nicht identifiziert. Wenn das wahre Modell, das die Daten generiert hat, linear ist und das nichtlineare Modell, an dem man interessiert ist, dieses lineare Modell verschachtelt, können die Parameter des nichtlinearen Modells nicht konsistent geschätzt werden. Daher muss die Linearitätsprüfung jeder nichtlinearen Modellierung und Schätzung vorausgehen.

Lassen Sie mich mit einem Beispiel enden.

Im Zusammenhang mit der Modellierung von Geschäftszyklen kann ein praktisches Beispiel für die Verwendung statistischer Gründe zur Rechtfertigung der Erstellung eines nichtlinearen Modells wie folgt aussehen. Da lineare univariate oder vektorautoregressive Modelle keine asymmetrischen zyklischen Zeitreihen erzeugen können, ist ein nichtlinearer Modellierungsansatz in Betracht zu ziehen, der Asymmetrien in den Daten verarbeiten kann. Eine erweiterte Version dieses Beispiels zur Datenreversibilität findet sich in Tong (1993) .

Entschuldigung, wenn ich mich zu sehr auf Zeitreihenmodelle konzentriert habe. Ich bin mir jedoch sicher, dass einige der Ideen auch in anderen Umgebungen anwendbar sind.


2
Graeme, deine Antwort ist exzellent und während andere auch exzellent sind, kommt deine dem, was ich gesucht habe, am nächsten (eine Mini-Version, wenn du so willst). +1 und akzeptiert. Ich freue mich sehr über Ihre Bemühungen, Ihre Antwort vorzubereiten. Ich bin sicher, ich werde es mehr als einmal überprüfen sowie die Referenzen. Ich denke, dass Dr. Harrells Buch über Regressionsstrategien auch einige Teile eines Rahmens enthält, den ich idealerweise hätte. Meine Idee eines thematischen statistischen Rahmens ist übrigens inspiriert von Lisa Harlows ausgezeichnetem Buch "Die Essenz des multivariaten Denkens", das ich gerne gelesen habe.
Aleksandr Blekh

12

Das übergreifende Problem besteht darin, zu entscheiden, für welche Arten von Problemen Linearität zu erwarten ist. Andernfalls können Beziehungen nichtlinear sein, wenn die Stichprobengröße dies zulässt. Die meisten Prozesse in Biologie, Sozialwissenschaften und anderen Bereichen sind nichtlinear. Die einzigen Situationen, in denen ich lineare Beziehungen erwarte, sind:

  1. Newtonsche Mechanik
  2. Vorhersage von aus zu einem früheren Zeitpunkt gemessenY.YY

Das letztere Beispiel schließt den Fall ein, in dem man eine abhängige Variable , die ebenfalls zu Beginn (Zeitpunkt Null) gemessen wird.Y

Ich sehe selten eine Beziehung, die in einem großen Datensatz überall linear ist.

Die Entscheidung, Nichtlinearitäten in Regressionsmodelle aufzunehmen, beruht weniger auf einem globalen statistischen Prinzip als vielmehr auf der Funktionsweise der Welt. Eine Ausnahme ist, wenn ein nicht optimaler statistischer Rahmen ausgewählt wurde und Nichtlinearitäten oder Interaktionsterme eingeführt werden müssen, um die schlechte Auswahl des Rahmens auszugleichen. Manchmal können Interaktionsterme erforderlich sein, um die Haupteffekte der Untermodellierung (z. B. durch Annahme der Linearität) auszugleichen. Möglicherweise sind weitere Haupteffekte erforderlich, um den Informationsverlust auszugleichen, der sich aus der Untermodellierung der anderen Haupteffekte ergibt.

Forscher quälen sich manchmal damit, ob sie eine bestimmte Variable einbeziehen sollen, während sie eine Vielzahl anderer Variablen unteranpassen, indem sie sie zwingen, linear zu handeln. Nach meiner Erfahrung ist die Linearitätsannahme eine der am meisten verletzten Annahmen, die stark von Bedeutung sind.


2
+1 Dr. Harrell, vielen Dank für Ihre wertvolle Antwort. Ich verstehe deine Punkte. Ich bin jedoch auch neugierig auf Situationen (und das war eigentlich der Kern meiner Frage), in denen Forscher oder Datenwissenschaftler aufgrund statistischer Theorien oder verschiedener Probleme (einschließlich Statistik, Daten, Methodik usw.) Zusätzliche nichtlineare Komponenten einführen müssen .), keine Domain-Theorien. Würde mich über Ihre Erkenntnisse dazu freuen.
Aleksandr Blekh

5
Die Linearität hängt genauso stark (oder mehr) von den Daten ab wie vom Prozess. Die meisten Prozesse in den meisten Bereichen sind linear, wenn sie über einen ausreichend engen Bereich untersucht werden (weshalb Calculus so weit verbreitet ist) und über einen ausreichend breiten Bereich (einschließlich mechanischer Prozesse) nichtlinear. Obwohl es richtig ist anzunehmen , dass fast alles nichtlinear erscheint, wenn eine ausreichend große Stichprobengröße verfügbar ist, besteht eine pragmatischere Möglichkeit, das Problem zu erfassen, darin, zu entscheiden, wann die Verwendung eines linearen Modells sinnvoll ist .
whuber

2
@whuber: Danke für deinen Kommentar. Sehr hilfreich. Jetzt verstehe ich die (Nicht-) Linearität aus zwei Perspektiven besser : theoretisch (Fachgebiet) und datenzentriert . Ich bin immer noch neugierig auf statistische und / oder methodische Perspektiven für die Einführung zusätzlicher Nichtlinearität aufgrund statistischer Annahmen , Probleme (dh nach der EDA) oder ähnlicher Aspekte. Zusätzlich zu Ihrem vorgeschlagenen Rahmen für das Problem bin ich auch an einem Entscheidungsrahmen interessiert , wenn es nützlich ist, ein nichtlineares Modell zu übernehmen.
Aleksandr Blekh

1
"Die meisten Prozesse in den meisten Bereichen sind linear, wenn sie über einen ausreichend engen Bereich untersucht werden (weshalb Calculus so weit verbreitet ist) und über einen ausreichend breiten Bereich nichtlinear", obwohl dies für jeden, der einen Kurs über Calculus belegt hat, äußerst offensichtlich ist augenöffnende Einsicht für mich. Vielen Dank, Dr. @whuber +1.
Mugen

3
@Aleksandr Blekh suchen Sie beispielsweise einen statistischen Test oder ein Residuendiagramm, das Ihnen einen statistischen Grund (im Gegensatz zu einem Grund aus der zugrunde liegenden Theorie) liefert, um die Verwendung eines nichtlinearen Modells zu rechtfertigen?
Mugen

4

Beim Erstellen eines Modells versuche ich immer die Quadrate von Variablen zusammen mit linearen Komponenten. Wenn ich zum Beispiel ein einfaches Regressionsmodell werde ich einen quadratischen Term Wenn signifikant ist, ist es kann ein Fall für ein nichtlineares Modell sein. Die Intuition ist natürlich die Taylor-Erweiterung. Wenn Sie eine lineare Funktion haben, darf nur die erste Ableitung ungleich Null sein. Für nichtlineare Funktionen wären Ableitungen höherer Ordnung ungleich Null.y i = α + β x i + γ x 2 i + ε i γ

yi=α+βxi+εi
yi=α+βxi+γxi2+εi
γ

Ich versuche auch oft einen asymmetrischen Spezifikationskandidaten: Wenn signifikant ist, muss ich darüber nachdenken Erkundung asymmetrischer Spezifikationen.

yi=α+βmax(0,xi)+γmin(0,xi)+εi
γβ

Manchmal habe ich einige spezielle Werte oder Bänder in meinen Daten. oder meine Histogramme erklärender Variablen haben Knicke und Wendepunkte. Also probiere ich die linearen Splines um diese speziellen Punkte oder Regionen aus. Die einfachsten linearen Splines wären: Dies würde die verschiedenen Steigungen für vor und nach Punkt einführen . Sie können mehrere Steigungen für dieselbe Variable in verschiedenen Regionen haben. Wenn mein linearer Spline signifikant ist, spiele ich entweder mit Knotenpunkten und verwende ihn oder denke über nichtlineare Modelle nach.

xa=min(x,a)
xa+=max(x,a)
xx=a

Dies ist kein systematischer Ansatz, aber nur eines der Dinge, die ich immer mache.


1
+1 Interessante Einblicke. Vielen Dank für das Teilen - es ist gut zu wissen. Was ich gerne hätte (oder sogar vorbereiten würde), ist ein kohärenter Rahmen / Workflow ähnlicher (großer und kleiner) Ansätze mit zugrunde liegenden grundlegenden Überlegungen. Denken Sie, dass die Schaffung eines solchen Rahmens 1) machbar und 2) für andere Menschen wertvoll wäre?
Aleksandr Blekh

1
@AleksandrBlekh, ich glaube nicht, dass es möglich ist, das universelle Framework zu erstellen. Die allgemeinste Zeitreihe ist Box-Jenkins.
Aksakal

4
Statistische Tests zur Modellauswahl verzerren Schätzungen und insbesondere Standardfehler.
Frank Harrell

1
@ssdecontrol, das Taylor-Erweiterungsargument macht mich auch vorsichtig, keine Terme niedrigerer Ordnung von Polynomen zu verwenden. Wenn eine Kandidatenspezifikation beispielsweise lautet , müssen Sie eine starke Meinung zur Form Ihres Modells haben. yi=β2xi2+εi
Aksakal

2
@ssdecontrol: Weitere Informationen zur Heuristik der Taylor-Serie finden Sie in Venables (1998), "Exegeses on linear models", S-Plus-Anwenderkonferenz, Washington DC .
Scortchi - Monica wieder einsetzen
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.