Eine Transformation, um den Versatz zu ändern, ohne die Kurtosis zu beeinflussen?


11

Ich bin gespannt, ob es eine Transformation gibt, die den Versatz einer Zufallsvariablen verändert, ohne die Kurtosis zu beeinflussen. Dies wäre analog dazu, wie eine affine Transformation eines RV den Mittelwert und die Varianz beeinflusst, nicht jedoch den Versatz und die Kurtosis (teilweise, weil der Versatz und die Kurtosis als unveränderlich gegenüber Skalenänderungen definiert sind). Ist das ein bekanntes Problem?


Benötigen Sie, dass die Standardabweichung auch bei dieser Transformation konstant bleibt?
Russellpierce

Nein, ich gehe davon aus, dass dies nicht der Fall sein wird, aber die überschüssige Kurtosis sollte behoben bleiben. Ich würde jedoch erwarten, dass die Transformation monoton und vorzugsweise deterministisch ist.
Shabbychef

1
Huch - wehe der Person, die eine nicht deterministische Funktion beweisen will, ist monoton.
Russellpierce

Antworten:


6

Meine Antwort ist der Beginn eines totalen Hacks, aber mir ist kein etablierter Weg bekannt, um das zu tun, was Sie verlangen.

Mein erster Schritt wäre, die Rangfolge Ihres Datensatzes zu ordnen. Sie können die proportionale Position in Ihrem Datensatz finden und dann in eine Normalverteilung umwandeln. Diese Methode wurde in Reynolds & Hewitt, 1996, verwendet. Siehe Beispiel-R-Code unten in PROCMiracle.

Sobald die Verteilung normal ist, wurde das Problem auf den Kopf gestellt - eine Frage der Anpassung der Kurtosis, aber nicht des Versatzes. Eine Google-Suche schlug vor, dass man die Verfahren von John & Draper, 1980, befolgen könnte, um die Kurtosis anzupassen, aber nicht den Versatz - aber ich konnte dieses Ergebnis nicht replizieren.

Meine Versuche, eine grobe Spreiz- / Verengungsfunktion zu entwickeln, die den eingegebenen (normalisierten) Wert verwendet und einen Wert proportional zur Position der Variablen auf der normalen Skala addiert oder subtrahiert, führen zu einer monotonen Anpassung, in der Praxis jedoch tendenziell eine bimodale Verteilung, die jedoch die gewünschten Werte für Schiefe und Kurtosis aufweist.

Mir ist klar, dass dies keine vollständige Antwort ist, aber ich dachte, es könnte einen Schritt in die richtige Richtung bedeuten.

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

Ich hatte so etwas gemacht: Rang, dann benutze die G-und-H-Transformation, um eine feste Kurtosis und Schrägstellung zu bekommen. Diese Technik setzt jedoch voraus, dass ich tatsächlich die Populationskurtose kenne, die ich abschätzen kann, aber ich bin philosophisch interessiert, ob es eine Transformation gibt, die die Kurtosis bewahrt, ohne dass ich wissen muss, was es ist ...
shabbychef

@shabbychef: Oh, dann tut es mir leid, dass ich nichts Neues hinzugefügt habe. Sie haben jedoch etwas Neues hinzugefügt, von dem ich noch nie etwas gehört hatte. Haben Sie ein frei zugängliches Zitat, das es bereitstellt? Ich bin auf ein Papier gestoßen, auf dem es geschrieben steht ( fic.wharton.upenn.edu/fic/papers/02/0225.pdf ), aber der Begriff ist mir etwas fremd (insbesondere ist das e ^ Z ^ g oder etwas anderes )? Ich habe es so versucht ... aber die Ergebnisse schienen seltsam ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g).
Russellpierce

1
@drnexus: Ich wollte die Ergebnisse nicht durch Erwähnung meiner Technik verzerren. Ich habe von Haynes et al. Die g-und-h- und die g-und-k-Verteilungen kennengelernt. al, dx.doi.org/10.1016/S0378-3758(97)00050-5 und Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf
shabbychef

1

nn12Norm zwischen der Stichprobenauftragsstatistik und der transformierten Version unter den angegebenen Einschränkungen. Dies ist jedoch eine Art verrückter Ansatz. In der ursprünglichen Frage suchte ich nach etwas Grundlegenderem und Grundlegenderem. Ich suchte auch implizit nach einer Technik, die auf einzelne Beobachtungen angewendet werden kann, unabhängig davon, ob eine ganze Kohorte von Proben vorhanden ist.


0

Ich würde diesen Datensatz lieber mit einer leptokurtischen Verteilung modellieren, anstatt mit Datentransformationen. Ich mag die Sinh-Arcsinh-Distribution von Jones und Pewsey (2009), Biometrika.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.