Ich habe dies in mathoverflow gepostet und niemand antwortet:
Scheffés Methode zur Identifizierung statistisch signifikanter Kontraste ist weithin bekannt. Ein Kontrast zwischen den Mitteln , von Populationen ist eine Linearkombination in der und ein skalares Vielfaches eines Kontrasts ist im Wesentlichen der gleiche Kontrast, man könnte also sagen, dass die Menge der Kontraste ein projektiver Raum ist. Die Methode von Scheffé testet eine Nullhypothese, die besagt, dass alle Kontraste zwischen diesen Populationen 0 sind , und weist die Nullhypothese bei gegebenem Signifikanzniveau α mit der Wahrscheinlichkeit α zurück , sofern die Nullhypothese wahr ist. Und wenn die Nullhypothese verworfen wird, weist Scheffé darauf hin, dass sein Test uns sagt, welche Kontraste sich signifikant von 0 unterscheiden (ich bin mir nicht sicher, ob der Wikipedia-Artikel, den ich verlinkt habe, dies anzeigt).
Ich würde gerne wissen, ob man in einer anderen Situation etwas Ähnliches machen kann. Man betrachte ein einfaches lineares Regressionsmodell , wobei ε i ∼ i ist . ich . d . N ( 0 , σ 2 ) , i = 1 , … , n .
Die Nullhypothese, die ich betrachten möchte, betrifft eine andere Art von Kontrast. Es heißt, es gibt keine Teilmenge so dass E ( Y i ) = α 1 + β x i für i ∈ A und E ( Y i ) = α 2 + β x i für i ∉ A wobei α 1 ≤ α 2 ist. Wenn die Teilmenge im Voraus spezifiziert wurde, führt dies ein gewöhnlicher t- Test mit zwei Stichproben durch , aber wir möchten etwas, das alle Teilmengen berücksichtigt und die Wahrscheinlichkeit, eine echte Nullhypothese abzulehnen, niedrig hält.
Man könnte diese herausfinden, wenn Effizienz kein Problem ist: einen Test finden , die durch alle geht Möglichkeit. Auch dann ist es problematisch; zwei kontraste wären nicht unabhängig. Ich fragte einen Experten für die Erkennung von Ausreißern, und er sagte nur, es sei ein kombinatorischer Albtraum. Dann fragte ich, ob man beweisen könne , dass es keinen effizienten Weg gibt, dies zu tun, vielleicht indem man ein NP-hartes Problem darauf reduziert. Er sagte nur, er halte sich von NP-harten Problemen fern.
Also: Kann man beweisen, dass dieses Problem "schwer" ist oder nicht?