Die kurze Antwort auf Ihre Frage (wie an anderer Stelle angegeben) lautet, dass es keine einzige mathematische Definition einer U-Form gibt. Der Kommentar von @whuber ist die beste allgemeine Definition, die ich gesehen habe.
Ich recherchiere über Tests von U-Formen und für meine Präsentation habe ich eine Folie mit dem Titel "Was bedeutet ein U für Sie?", Was bedeutet, dass es subjektiv ist, was Menschen unter dem Begriff "U-Form" verstehen. Das Wichtigste ist, dass Sie, wenn Sie den Begriff "U-Form" verwenden, genau definieren, was Sie damit meinen, ohne davon auszugehen, dass andere wissen, was Sie meinen.
Da Sie nur einen Regressor angegeben haben, werde ich mich darauf konzentrieren. Ich habe die folgenden Definitionen in verschiedenen Artikeln gesehen:
- Eine U-Form ist ein Quadrat.
- Eine U-Form bedeutet Konvexität (für eine Anwendung in dieser Richtung siehe Van Landeghems 2012 "Ein Test für die Konvexität des menschlichen Wohlbefindens über den Lebenszyklus: Längsschnitt aus einem 20-Jahres-Panel").
- Eine U-Form ist eine Funktion mit einer gewichteten durchschnittlichen Ableitung, die bis zu einem Punkt negativ ist, und einer gewichteten durchschnittlichen Ableitung, die nach diesem Punkt positiv ist (siehe Uri Simonsohns Zwei-Linien: Der erste gültige Test für U-förmige Beziehungen ).
- Eine U-Form ist eine Funktion mit genau einem Wendepunkt. Dies entspricht einer Funktion, die quasi konvex, aber nicht monoton ist.
Eine Komplikation ist, was passiert, wenn der Wendepunkt nahe am Ende des Bereichs der x-Variablen liegt? Sollten wir eine solche Funktion immer noch als U-Form betrachten? Meiner Meinung nach sollte eine solche Diskussion stattfinden, wenn Sie definieren, was eine U-Form für Sie für Ihre Anwendung bedeutet, und wenn Sie Ihre Nullhypothese angeben.
Die Definition, die ich in meinem Artikel " Nichtparametrisches Testen von U-förmigen Beziehungen" verwende , lautet wie folgt:
Lassen die Regressionsfunktion und lassen , die Unterstützung von . Für eine bestimmte Menge sind wir daran interessiert, Folgendes zu testen:m(x)S(X)XA0⊂S(X)
H0:versusHA:∃a∈A0 st ∀x∈S(X)m′(x)(x−a)≥0∀a∈A0,∃x∈S(X) stm′(x)(x−a)<0
Zum Beispiel teste ich in einer Anwendung eine U-Form der Lebenszufriedenheit im Alter von 20 bis 70 Jahren, wobei der Wendepunkt zwischen 30 und 60 Jahren liegt. Mit diesem vorgeschlagenen Rahmen sind willkürliche Entscheidungen erforderlich. Das Wichtigste ist, offen für sie zu sein und zu überprüfen, wie sensibel die Ergebnisse für Änderungen sind (und andere dazu aufzufordern, dasselbe zu tun).
Zusätzlich zur Angabe der Nullhypothese sollten Sie wie immer die Annahmen angeben, auf die Sie sich verlassen. Eine verbreitete Annahme ist beispielsweise, dass die Regressionsfunktion entweder monoton U-förmig ist. Siehe zum Beispiel Lind und Mehlums 2009 "Mit oder ohne U? Der geeignete Test für eine U-förmige Beziehung", in dem sie eine Verbesserung des quadratischen Vanille-OLS-Tests vorschlagen, indem sie testen, ob die Ableitung einer bestimmten funktionellen Form bei negativ ist der Anfang des Bereichs und positiv am Ende.
Ein weiterer zu berücksichtigender Punkt ist: Möchten Sie einen Test, der die Nullhypothese aufgrund einer kleinen Verletzung der U-Form ablehnt? Wenn ja, betrachten Sie das R-Paket qmutest , das einen nichtparametrischen Test implementiert , der auf Splines der Nullhypothesen basiert, dass die Regressionsfunktion quasi konvex und separat monoton ist. Wenn Sie keinen Test wünschen, der aufgrund einer kleinen Verletzung Rückschlüsse auf eine U-Form zulässt, ist der Test mit zwei Linien von Uri möglicherweise am besten geeignet, wenn Sie testen möchten, dass eine Regressionsfunktion meistens abnimmt und dann meistens zunimmt.
Da es bei Ihrer Frage um die Verwendung des Begriffs "U-Form" und der Definition ging, finde ich es relevant, hier einige Begriffe aufzulisten, die häufig verwendet werden, um sich auf dasselbe zu beziehen wie "U-Form" und "umgekehrte U-Form" "werden verwendet, um zu bezeichnen:" talförmig "," muldenförmig "," hügelförmig "," unimodal "," einspitzig "und" glockenförmig ". Es gibt keinen inhärenten Grund, warum "U-Form" ein besserer Begriff ist als die anderen, aber seine Verwendung scheint sich durchgesetzt zu haben.
Ich arbeite an einem allgemeinen R-Paket, das nur eine Schnittstelle zu bestimmten R-Paketen (wie z. B. qmutest) sein wird, die auf U-förmige Beziehungen testen, diese jedoch definieren. Ziel ist es, den Benutzern zu helfen, verschiedene Tests zu vergleichen und über die genaue Nullhypothese nachzudenken, die sie testen möchten, und welche Annahmen sie treffen möchten.