Beim Entfernen des Versatzes wird durch Transformationen versucht, den Datensatz der Gaußschen Verteilung zu folgen. Der Grund ist einfach, dass, wenn der Datensatz so transformiert werden kann, dass er statistisch nahe genug an einem Gaußschen Datensatz liegt, ihm der größtmögliche Werkzeugsatz zur Verfügung steht. Tests wie ANOVA, Test, Test und viele andere hängen von den Daten mit konstanter Varianz ( ) ab oder folgen einer Gaußschen Verteilung. 1tFσ2
Es gibt Modelle, die robuster sind 1 (wie die Verwendung von Levine Test statt Bartlett-Test), aber die meisten Tests und Modelle , die mit anderen Distributionen gut funktionieren verlangen , dass Sie wissen , was Verteilung Sie sind Arbeiten mit und sind in der Regel nur für eine einzige Verteilung aneignen auch.
So zitieren Sie das NIST Engineering Statistics Handbook :
Bei der Regressionsmodellierung wenden wir häufig Transformationen an, um die folgenden zwei Ziele zu erreichen:
- um die Homogenität der Varianzannahme für die Fehler zu befriedigen.
- um die Anpassung so weit wie möglich zu linearisieren.
Sorgfalt und Urteilsvermögen sind erforderlich, damit diese beiden Ziele in Konflikt geraten können. Im Allgemeinen versuchen wir zunächst, homogene Varianzen zu erzielen, und gehen dann auf das Problem der Linearisierung der Anpassung ein.
und an einem anderen Ort
Ein Modell mit einer Antwortvariablen und einer einzelnen unabhängigen Variablen hat die Form:
Y.ich= f( Xich) + Eich
Wobei die Antwortvariable ist, die unabhängige Variable ist, die lineare oder nichtlineare Anpassungsfunktion ist und die Zufallskomponente ist. Für ein gutes Modell sollte sich die Fehlerkomponente wie folgt verhalten:Y.XfE
- zufällige Zeichnungen (dh unabhängig);
- von einer festen Verteilung;
- mit festem Standort; und
- mit fester Variation.
Außerdem wird für Anpassungsmodelle normalerweise weiterhin angenommen, dass die feste Verteilung normal ist und die feste Position Null ist. Für ein gutes Modell sollte die festgelegte Abweichung so gering wie möglich sein. Eine notwendige Komponente von Anpassungsmodellen besteht darin, diese Annahmen für die Fehlerkomponente zu überprüfen und zu bewerten, ob die Abweichung für die Fehlerkomponente ausreichend gering ist. Das Histogramm, das Verzögerungsdiagramm und das Normalwahrscheinlichkeitsdiagramm werden verwendet, um die festen Verteilungs-, Orts- und Variationsannahmen für die Fehlerkomponente zu überprüfen. Der Plot der Antwortvariablen und der vorhergesagten Werte gegen die unabhängige Variable wird verwendet, um zu beurteilen, ob die Variation ausreichend klein ist. Die Diagramme der Residuen gegen die unabhängige Variable und die vorhergesagten Werte werden verwendet, um die Unabhängigkeitsannahme zu bewerten.
Die Bewertung der Gültigkeit und Qualität der Anpassung anhand der oben genannten Annahmen ist ein absolut wichtiger Bestandteil des Modellanpassungsprozesses. Keine Anpassung sollte ohne einen geeigneten Modellvalidierungsschritt als vollständig betrachtet werden.
- (abgekürzte) Zitate für Ansprüche:
- Breyfogle III, Forrest W. Implementierung von Six Sigma
- Pyzdek, Thomas. Das Six Sigma Handbuch
- Montgomery, Douglas C. Einführung in die statistische Qualitätskontrolle
- Ed. Cubberly, Willaim H und Bakerjan, Ramon. Handbuch für Werkzeug- und Fertigungsingenieure: Desktop Edition