Wie gehe ich mit dem Deckeneffekt durch das Messwerkzeug um?


12

Ich habe psychophysiologische Daten gesammelt, die die Fähigkeit der Probanden (zwei Gruppen) messen, Schwingungen wahrzunehmen. Eine vibrierende Sonde bewegt sich bei immer kleineren Verschiebungen gegen die Haut, und das Subjekt zeigt an, wann es die Vibration spürt. Leider kann sich die Sonde bei hohen Frequenzen nur eine kurze Strecke bewegen, und manchmal ist die größte Strecke, die die Sonde bewegen kann, immer noch nicht groß genug, damit die Probanden sie wahrnehmen können. Daher habe ich für einige Probanden genaue Schwellenwerte, aber für einige, die die Vibration nie gespürt haben, habe ich einfach einen Wert, von dem ich weiß, dass ihre Schwelle größer ist als. Kann ich diese Daten trotzdem einfügen? Und wie kann man das am besten analysieren?


5
Diese werden zensierte Beobachtungen genannt . Wie dies berücksichtigt wird, hängt von der Art der statistischen Analyse ab, die Sie durchführen.

Ich stimme Procrastinator zu, mit der Ausnahme, dass ich den Begriff abgeschnitten verwenden würde. Der Ansatz für ein simlares Problem, das als richtige Zensur bezeichnet wird, findet in der Überlebensanalyse statt. Dort behalten Sie den abgeschnittenen Wert bei, verfügen jedoch über eine Indikatorvariable, die angibt, ob der Wert ein vollständiger Wert oder ein zensierter Wert ist. In der Überlebensanalyse gibt es einen einfachen Weg, um damit umzugehen, aber das liegt daran, dass Sie eine Überlebenskurve schätzen. Hier möchten Sie möglicherweise Durchschnittswerte berechnen. Wenn Sie die Erziehung ignorieren, unterschätzen Sie den Durchschnitt. Wenn Sie die abgeschnittenen Punkte wegwerfen, unterschätzen Sie den Durchschnitt.
Michael R. Chernick

Um die abgeschnittenen Werte korrekt zu berücksichtigen, müsste ein Wahrscheinlichkeitsmodell für die Sondenentfernung erstellt werden, da dieses größer als der Schwellenwert ist. Sie könnten dann den Mittelwert dieser Verteilung nehmen und einen gewichteten Durchschnitt unter Verwendung des Durchschnitts für die Werte berechnen, die nicht mit dem Durchschnitt für die abgeschnittene Verteilung abgeschnitten wurden, wobei die Gewichtung dem Anteil der abgeschnittenen Fälle entspricht.
Michael R. Chernick

4
Abschneiden ist das, was passieren würde, wenn Sie die nicht quantifizierten Daten wegwerfen würden. Das willst du nicht! Sie haben Recht, Cale, dass diese zensierten Werte Informationen enthalten und den Verdacht haben, dass es einige Standardmethoden gibt, um sie zu analysieren (und Fallstricke für Unachtsame). Um jedoch eine gute Antwort zu geben, müssen wir wissen, welche Art von Analyse Sie suchen. Insbesondere die Behandlung dieser Daten unterscheidet sich grundlegend, je nachdem, ob sie als abhängige oder unabhängige Variablen in einer Regression auftreten. Vielleicht könnten Sie dies näher erläutern?
Whuber

1
Kleine Details, die nichts mit der vorliegenden statistischen Frage zu tun haben, aber möglicherweise hilfreich sind: Daten dieser Art werden in der Regel als „psychophysische“ Daten bezeichnet, nicht als „psychophysiologische“ Daten (z. B. Herzfrequenz- oder Hautleitfähigkeitsmessungen, aber keine subjektiven Beurteilungen von Empfindungen) ). Dies kann Ihnen auch dabei helfen, nach Literatur zu suchen, wie Personen mit solchen Daten normalerweise umgehen.
Gala

Antworten:


2

Ich benutze gerne heterogene Mischungsmodelle, um kombinierte Effekte aus grundlegend verschiedenen Quellen zu beschreiben.

Sie könnten sich so etwas wie ein "Zero Inflated Poisson" -Modell im Stil von Diane Lambert anschauen. " Zero-Inflated Poisson Regression, mit einer Anwendung auf Herstellungsfehler ", Diane Lambert, Technometrics, Vol. 34, Iss. 1, 1992

Ich finde diese Idee besonders erfreulich, weil sie der Vorstellung zu widersprechen scheint, dass die Anwendung der statistischen Versuchsplanung auf die Medizin eine Krankheit nicht vollständig heilen kann. Hinter dem Gedanken, dass die wissenschaftliche Methode ihren Zweck in der Medizin nicht erfüllen kann, steckt der Gedanke, dass es keine Krankheitsdaten von einer "vollkommen" gesunden Person gibt und dass Daten keine Informationen über das Heilmittel für eine Krankheit liefern können. Ohne Messung gibt es keinen Raum zur Verbesserung.

Wenn man so etwas wie ein Null-Inflations-Modell verwendet, kann man nützliche Informationen aus Daten extrahieren, die teilweise "fehlerfrei" sind. Es nutzt Einblicke in den Prozess, um Informationen, die als "still" angesehen werden könnten, zum Sprechen zu bringen. Für mich ist das die Art von Sache, die Sie versuchen zu tun.

Jetzt kann ich nicht behaupten, welche Modellkombinationen verwendet werden sollen. Ich vermute, dass Sie für den Anfang ein Gauß'sches Mischungsmodell (GMM) ohne Luftdruck verwenden könnten. Das GMM ist ein bisschen ein empirischer Universalapproximator für kontinuierliche PDFs - wie der PDF-Cousin der Fourier-Reihe, aber mit der Unterstützung des zentralen Grenzwertsatzes, um die globale Anwendbarkeit zu verbessern und typischerweise viel weniger Komponenten zu ermöglichen, um ein " gute "Annäherung.

Viel Glück.

BEARBEITEN:

Weitere Informationen zu Modellen ohne Luftdruck:


0

Eine Lösung könnte darin bestehen, die Ergebnisse zu bündeln und eine Skala zu definieren.

Erstellen Sie eine Kategorievariable wie folgt (oder anders):

  1. Hohe Empfindlichkeit
  2. Normale Empfindlichkeit
  3. Geringe Empfindlichkeit
  4. Unempfindlich (diejenigen, die in Ihrem Fall außerhalb der Skala liegen)

Sie können diese Variable verwenden, um die Analyse durchzuführen. Ob die Ergebnisse jedoch aussagekräftig sind, hängt davon ab, wie gut Sie die Kategorien definieren.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.