Da Sie einen Artikel lesen, schlagen Sie möglicherweise vor, dass die Autoren das Problem der Modellhierarchie erörtern und ihre Abweichung davon begründen.
Hier einige Referenzen:
Nelder JA. Die Auswahl von Begriffen in Antwortoberflächenmodellen - wie stark ist das Prinzip der schwachen Vererbung? Der amerikanische Statistiker. 1998; 52: 315–8. http://www.jstor.org/pss/2685433 . Abgerufen am 10. Juni 2010.
Peixoto JL. Hierarchische Variablenauswahl in Polynom-Regressionsmodellen. Der amerikanische Statistiker. 1987; 41: 311–3. http://www.jstor.org/pss/2684752 . Abgerufen am 10. Juni 2010.
Peixoto JL. Eine Eigenschaft gut formulierter polynomieller Regressionsmodelle. Der amerikanische Statistiker. 1990; 44: 26–30. http://www.jstor.org/pss/2684952 . Abgerufen am 10. Juni 2010.
Normalerweise folge ich einer Hierarchie, aber in manchen Situationen weiche ich davon ab. Wenn Sie beispielsweise den Reifenverschleiß in Abhängigkeit von der Laufleistung bei verschiedenen Geschwindigkeiten testen, sieht Ihr Modell möglicherweise folgendermaßen aus:
Profiltiefe = Abfangen + Kilometerstand + Kilometerstand * Geschwindigkeit
Es wäre jedoch physikalisch nicht sinnvoll, einen Haupteffekt der Geschwindigkeit zu berücksichtigen, da der Reifen nicht weiß, wie hoch die Geschwindigkeit bei null Meilen sein wird.
(Auf der anderen Seite möchten Sie möglicherweise immer noch einen Geschwindigkeitseffekt testen, da dies darauf hindeutet, dass sich die Einlaufeffekte bei verschiedenen Geschwindigkeiten unterscheiden. Eine noch bessere Möglichkeit, mit dem Einlauf umzugehen, ist jedoch Daten bei null und sehr geringer Laufleistung abrufen und dann auf Nichtlinearität prüfen. Beachten Sie, dass das Entfernen des Intercept-Terms als Sonderfall für die Verletzung der Hierarchie angesehen werden kann.)
Ich werde auch wiederholen, was oben jemand gesagt hat, weil es sehr wichtig ist: Die Autoren müssen sicherstellen, dass sie wissen, ob ihre Software die Daten zentriert. Das obige Reifenmodell wird physikalisch unsinnig, wenn die Software die Laufleistung durch (Laufleistung - Mittelwert der Laufleistung) ersetzt.
Ähnliches gilt für pharmazeutische Stabilitätsstudien (tangential erwähnt in "Stabilitätsmodelle für sequentielle Lagerung", Emil M. Friedman und Sam C. Shum, AAPS PharmSciTech, Bd. 12, Nr. 1, März 2011, DOI: 10.1208) / s12249-010-9558-x).