Was ist die richtige Analyse für diese Art von Frage? (Bedingte logistische Regression?)


8

Was ist angesichts des folgenden Experiments die richtige statistische Methode, um die folgende Frage zu beantworten:

Eine Teilnehmerin erhält nacheinander Bilder und muss nach jedem Bild antworten, ob sie ein Objekt oder ein Gesicht gesehen hat. In jedem Versuch (Bildpräsentation) wird das präsentierte Bild (entweder 1 von 210 einzelnen Gesichtern oder 1 von 210 einzelnen Objekten) mit einer bestimmten Menge an zufälligem Rauschen (zwischen 5% und 98%) überlagert. Das dargestellte Bild in jedem Versuch ist eher klein, daher hat jeder Versuch auch einen Hintergrund. Der Hintergrund kann entweder schwarz, ein großes Objekt oder ein großes Gesicht sein. Die einzelnen Bilder werden abgeglichen, dh jedes einzelne Bild wird insgesamt dreimal dargestellt, einmal mit schwarzem Hintergrund, einmal mit einem großen Objekt als Hintergrund und einmal mit einem großen Gesicht als Hintergrund. Die Menge an zufälligem Rauschen, die einem einzelnen Bild überlagert ist, wird über die 3 verschiedenen Hintergrundbedingungen konstant gehalten. Das Objekt im großen Objekthintergrund ändert sich nicht und ist nicht in einem der 210 dargestellten Einzelobjektbilder enthalten. In ähnlicher Weise ändert sich das Gesicht im großen Gesichtshintergrund nicht und ist nicht in einem der 210 dargestellten einzelnen Gesichtsbilder enthalten. Keinem Hintergrund wird Rauschen hinzugefügt.

Die Frage, die ich beantworten möchte, ist, ob sich die Wahrnehmung von Gesichtern, Objekten oder beiden zwischen den drei verschiedenen Hintergrundbedingungen erheblich unterscheidet. Weitere Informationen zu der Frage, die ich beantworten möchte, finden Sie in Frage 5 unten

Am Ende habe ich also eine Datentabelle, die so aussieht:

+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +
| Teilnehmer | Kategorie | Bild ID | Geräuschpegel | Hintergrund | Antwort * |
+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +
| 1 | 0 | 1 | 5% | 1 | 0 |
| 1 | 0 | 1 | 5% | 2 | 0 |
| 1 | 0 | 1 | 5% | 3 | 0 |
| | | | | | |
| 1 | 0 | 2 | 24% | 1 | 0 |
| 1 | 0 | 2 | 24% | 2 | 1 |
| 1 | 0 | 2 | 24% | 3 | 0 |
| | | | | | |
| 1 | 0 | 3 | 80% | 1 | 1 |
| 1 | 0 | 3 | 80% | 2 | 0 |
| 1 | 0 | 3 | 80% | 3 | 1 |
| | | | | | |
| .. | .. | .. | .. | .. | .. |
+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +
| 1 | 1 | 211 | 12% | 1 | 1 |
| 1 | 1 | 211 | 12% | 2 | 1 |
| 1 | 1 | 211 | 12% | 3 | 1 |
| | | | | | |
| 1 | 1 | 212 | 20% | 1 | 1 |
| 1 | 1 | 212 | 20% | 2 | 0 |
| 1 | 1 | 212 | 20% | 3 | 1 |
| | | | | | |
| 1 | 1 | 213 | 75% | 1 | 0 |
| 1 | 1 | 213 | 75% | 2 | 0 |
| 1 | 1 | 213 | 75% | 3 | 1 |
| | | | | | |
| .. | .. | .. | .. | .. | .. |
+ ------------- + ------------- + ------------- + ------- ------ + ------------- + ------------- +

Dabei ist Kategorie Gesicht (0) oder Objekt (1) und Antwort auch Gesicht (0) oder Objekt (1). Die Antwort des Teilnehmers ist die abhängige Variable. Dichotom mit einem zugrunde liegenden Kontinuum. Da jeder Teilnehmer unter allen 3 Hintergrundbedingungen gemessen wird, handelt es sich um ein abhängiges Design. Da ich für ein einzelnes Bild das Rauschen über die 3 Hintergrundbedingungen konstant halte, ist es irgendwie gepaart oder angepasst.

Zuerst dachte ich darüber nach, die biserialen Korrelationen zu berechnen und sie basierend auf der t-Statistik zu vergleichen, aber dann sah ich eine logistische Regression, die besser zu meiner Datenstruktur zu passen schien. Aber ich bin immer noch der Meinung, dass die übereinstimmenden Proben und das abhängige Design irgendwie in die Analyse einbezogen werden sollten. Als ich danach suchte, tauchte die bedingte logistische Regression auf.

Das Problem ist, dass bei der bedingten logistischen Regression der Abgleich für die abhängige Variable erfolgt. Sie stimmen normalerweise mit einer 1 in der abhängigen Variablen mit einer oder mehreren 0 Stichproben überein. Ich stimmte nicht mit der abhängigen Variablen überein, sondern mit den unabhängigen Variablen (gleiche Bilder mit gleichem Rauschpegel in jeder Hintergrundbedingung). Daher glaube ich nicht, dass ich für diese Daten die bedingte logistische Regression verwenden kann, aber ich konnte nichts anderes finden, das passt.

Könnte mir jemand mit mehr Erfahrung in der Statistik erklären, wie die obige Frage richtig beantwortet werden kann, ob sich die Wahrnehmung von Gesichtern, Objekten oder beiden zwischen den drei verschiedenen Hintergrundbedingungen erheblich unterscheidet.

Danke für deine Hilfe.

[Versuchsdurchführung]

Das Experiment hat insgesamt 1260 Versuche. Bestehend aus 210 einzelnen Gesichtern und 210 einzelnen Objekten, die jeweils dreimal präsentiert werden (einmal mit jeweils 3 verschiedenen Hintergründen). Die Versuchsreihenfolge wird mit der Einschränkung randomisiert, dass im ersten, zweiten und letzten Block von 420 Versuchen jeder Hintergrund genau 140 Mal und jedes einzelne Objekt und jedes einzelne Gesicht genau einmal dargestellt wird. Den meisten, aber nicht allen verschiedenen einzelnen Gesichtern und Objekten wird eine unterschiedliche Menge an Rauschen hinzugefügt, aber das Rauschen für ein einzelnes Gesicht oder Objekt wird über die 3 verschiedenen Hintergrundbedingungen, die es darstellt, konstant gehalten.

[Fragen & Antworten]

1. Wie viele Teilnehmer? Insgesamt gibt es 5 Teilnehmer.

2. Gibt es Grenzen für Lärm? Das Rauschen wird in Schritten von 0,5% und im Bereich [5%, 98%] diskretisiert. Das Rauschen wird zufällig aus einem Rauschvektor (ohne Ersatz) gezogen und einem Bild zugewiesen. Dieser Vektor enthält eine Rauschverteilung (210 Einträge für jede Kategorie), die nicht jeden möglichen Wert zwischen 5% und 98% in Schritten von 0,5% enthält, sondern einige dieser Werte überspringt und einige andere Werte bis zu dreimal enthält ( Antwort auf Frage 3)). Dies stellt sicher, dass jeder Teilnehmer den gleichen Rauschpegel erfährt (obwohl dies für dieselben Bilder nicht wahrscheinlich ist, da die Rauschpegel zu Beginn des Experiments zufällig den einzelnen Bildern zugewiesen werden) und dass über den gesamten Bereich, aber den Fokus, eine gute Abdeckung besteht ist auf Geräuschpegel nahe der Schwelle, bei der (für unser Setup) die Teilnehmer das Bild in etwa 50% der Zeit erkennen können. Diese Schwelle wurde in einer Vorstudie mit anderen Teilnehmern unter Verwendung der gleichen Bilder auf schwarzem Hintergrund ermittelt. Daher ist der schwarze Hintergrund der Standardhintergrund in diesem Experiment.

3. Ist es möglich, dass zwei oder mehr Bilder mit demselben Rauschpegel dargestellt werden? Ja, dies geschieht mehrmals und umfasst bis zu 3 Einzelbilder bei gleichem Rauschpegel, jedoch nicht mehr als 3.

4. Können Sie bestätigen, dass Sie nicht an der Zuordnung von Lärm zur Antwort interessiert sind?Diese Frage ist für mich schwer zu beantworten. Es ist zu erwarten, dass der Effekt unterschiedlicher Hintergründe (wenn überhaupt vorhanden) am stärksten ist, wenn die Bilder schwerer zu sehen sind, dh wenn mehr Rauschen vorhanden ist. Ich möchte also das Rauschen in der Analyse berücksichtigen, aber ich benötige nicht unbedingt die Analyse, um mir etwas über die Zuordnung des Rauschens zur Antwort zu sagen. Ich bin nur daran interessiert, Unterschiede zwischen den Hintergrundbedingungen mit so viel Leistung wie möglich festzustellen. Zuerst wollte ich 2 psychometrische Kurven für jede der 3 verschiedenen Hintergrundbedingungen anpassen (Wahrscheinlichkeit, mit der jeweiligen Kategorie gegen den Geräuschpegel zu reagieren) und dann die Verschiebungen der psychometrischen Anpassungen vergleichen, um Unterschiede in den Hintergrundbedingungen festzustellen. Jedoch, Eine Bootstrapping-Analyse ergab, dass die Varianz des Anpassungsverfahrens zu groß ist, um Verschiebungen in dem von mir erwarteten Bereich erkennen zu können. Daher gehe ich davon aus, dass Informationen über die Assoziation von Rauschen mit der Reaktion die Leistung anderer Arten von Analysen ebenfalls verringern können. Wenn dies der Fall ist, brauche ich es nicht.

5. Was meinst du mit "Wahrnehmung" und "beides"? Was willst du eigentlich wissen? Mit "Wahrnehmung von [Kategorie]" meine ich nicht Prozent korrekt, sondern "[Kategorie] Antworten". Die Annahme , ich habe (und ich zu testen möchte , dass) ist , dass ein Gesicht -background einen Teilnehmer reagieren mit beeinflussen würde Gesicht BUT ein Objekt -background würde nicht einen Teilnehmer reagieren mit beeinflussen Objekt(Diese Annahme ergibt für Sie als Leser wahrscheinlich keinen Sinn, aber das muss ich testen). Was ich mit "beides" meine, ist, dass, sollte es sein, dass ein Gesichtshintergrund einen Teilnehmer beeinflusst, mit Gesicht zu antworten, UND ein Objekthintergrund einen Teilnehmer beeinflusst, mit Objekt zu antworten, meine Annahme, dass nur der Gesichtshintergrund eine Wirkung hat auf Wahrnehmung wäre falsch. Die verschiedenen Geräuschpegel wurden berücksichtigt, da die Wahrscheinlichkeit, die Wahrnehmung in Bezug auf eine der Kategorien zu beeinflussen, größer sein sollte, wenn die Bilder schwerer zu sehen / zu erkennen sind. Wenn es also für eine der Kategorien einen hintergrundabhängigen Effekt auf die Wahrnehmung gibt, ist es unwahrscheinlich, dass dieser im Rauschbereich von z. B. 5% - 20%, sondern im höheren Rauschbereich angezeigt wird.

Bitte lassen Sie mich wissen, wenn Sie weitere Informationen benötigen.


2
Sie sagten, "jeder Teilnehmer wird unter allen drei Hintergrundbedingungen gemessen" - wie viele Teilnehmer gibt es also?
Robert Long

2
Wird das die Gesamtzahl sein oder fügen Sie mehr hinzu? Müssen Sie die Daten nur mit den aktuellen 5 analysieren?
Robert Long

Wenn möglich, möchte ich es mit der aktuellen 5 analysieren. Unter bestimmten Umständen kann ich nur etwa 6 Personen pro Jahr messen. Während ich theoretisch mehr messen könnte, würde ich es gerne vermeiden, da es viel Zeit kosten würde.
Simeon

2
Gibt es Grenzen für Lärm (100% Lärm wären nicht sinnvoll, aber was ist zum Beispiel mit 99%)? Können Sie bestätigen, dass Sie nicht an der Assoziation von Lärm mit der Antwort interessiert sind? Außerdem ist jedes Bild ein Unikat. Ist es jedoch möglich, dass zwei oder mehr Bilder mit demselben Rauschpegel dargestellt werden (da das Rauschen zufällig zugewiesen wird)?
Robert Long

Ja, dem Lärm sind Grenzen gesetzt. Da ich in diesem Kommentar jedoch nicht genügend Platz habe, füge ich die Informationen meinem Beitrag hinzu. Danke, dass du so gründlich bist.
Simeon

Antworten:


4

Zuerst:

"Denken Sie daran, dass alle Modelle falsch sind. Die praktische Frage ist, wie falsch sie sein müssen, um nicht nützlich zu sein."

Box, GEP; Draper, NR (1987), Empirische Modellbildung und Reaktionsoberflächen, John Wiley & Sons.

Daher gibt es keine und nur die richtige Möglichkeit, Ihre Daten zu modellieren.

Die Forschungsfrage fragt allgemein nach dem Zusammenhang des Hintergrundtyps mit der Wahrnehmung der Kategorie, es gibt jedoch zwei unterschiedliche Fragen:

  1. Ist Hintergrund = 3 (Gesicht) mit Antwort = 0 (Gesicht) verbunden (Forschungshypothese: Ja)
  2. Ist Hintergrund = 2 (Objekt) mit Antwort = 1 (Objekt) verbunden (Forschungshypothese: Nein)

Ihr Setup ist faktoriell. Sie variieren die Ebenen der Faktoren ( Category, Noiseund Background) und messen die Reaktion für verschiedene Kombinationen davon. Ihr besonderes Interesse gilt der Zuordnung des Hintergrunds (eines 3-Ebenen-Faktors) zur Antwort (einer binären Variablen). Daher scheint eine logistische Regressionsanalyse die Fragen zu beantworten.

  • Die Schätzung für background=2beantwortet die Frage: Was ist der Unterschied in der logarithmischen Wahrscheinlichkeit, mit einem Objekt zu antworten, wenn der Hintergrund ein Objekt ist, im Vergleich zu dem, wenn der Hintergrund schwarz ist? Dies beantwortet die Forschungsfrage 2. Um mit der Forschungshypothese übereinzustimmen, sollte diese Schätzung klein und / oder statistisch nicht signifikant sein.
  • Die Schätzung für background=3beantwortet die Frage: Was ist der Unterschied in der logarithmischen Wahrscheinlichkeit, mit einem Objekt zu antworten, wenn der Hintergrund ein Gesicht ist, im Vergleich zu dem, wenn der Hintergrund schwarz ist? Das Negative dieser Schätzung ist daher der Unterschied in der logarithmischen Wahrscheinlichkeit, mit dem Gesicht zu antworten, wenn der Hintergrund ein Gesicht ist, im Vergleich zu dem, wenn der Hintergrund schwarz ist. Dies beantwortet die Forschungsfrage 1. Um mit der Forschungshypothese übereinzustimmen, sollte diese Schätzung klein und / oder statistisch nicht signifikant sein.

Dies ist jedoch nicht das Ende der Geschichte ....

Offensichtlich haben Sie wiederholte Messungen an Teilnehmern durchgeführt, und dies muss kontrolliert werden, da die Antworten eines Teilnehmers eher anderen Antworten desselben Teilnehmers ähneln als denen anderer Teilnehmer (dh es besteht wahrscheinlich eine Korrelation der Messungen innerhalb der Teilnehmer) jeder Teilnehmer). Dies kann gesteuert werden, indem zufällige Abschnitte für Participantoder Participantals fester Effekt eingeschlossen werden. 5 wird von vielen als die Mindestanzahl von Ebenen für einen Faktor angesehen, der als zufälliger Effekt verwendet werden soll. Da Sie beabsichtigen, mehr Teilnehmer zur Studie hinzuzufügen, wäre dies meine Empfehlung. Beide Methoden steuern wiederholte Messungen, sodass Sie beide Modelle ausführen können, und ich werde beide nachfolgend vorstellen.

Sie haben auch wiederholte Messungen an jedem Bild, wobei jedes Bild dreimal gemessen wird. Somit kann es auch eine Korrelation innerhalb jedes Bildes geben. Da Sie 420 verschiedene Bilder haben, wäre es keine gute Idee, das Bild als festen Effekt einzuschließen, um dies zu steuern. Daher ist ein zufälliger Schnitt angemessen. So würde mein Startmodell ein Mischeffekt - Modell mit zufälligem abfängt sein Picture_IDund Participantmit festen Effekten für Category, Backgroundund Noise(mit Rauschen codiert als numerisches wird). Die Teilnehmer sind nicht in Bildern und Bildern und nicht in den Teilnehmern verschachtelt, sodass diese zufälligen Effekte gekreuzt werden.

Bei RVerwendung des lme4Pakets wird dies wie folgt angegeben:

glmer(Response ~ Category + Background + Noise + (1|Participant) + (1|Picture_ID), data=dt, family=binomial(link=logit))

Aufgrund der geringen Teilnehmerzahl ist ein alternatives Modell:

glmer(Response ~ Category + Background + Noise + Participant + (1|Picture_ID), data=dt, family=binomial(link=logit))

Die Analyse kann erweitert werden, um Folgendes zu ermöglichen:

  • Wechselwirkungen zwischen den festen Effekten

  • nichtlineare Assoziation zwischen Antwort und Rauschen (durch Einbeziehung quadratischer Terme und möglicherweise Terme höherer Ordnung für Rauschen)

  • die Assoziation von Rauschen, um zwischen Teilnehmern und / oder Bild zu variieren (durch Einbeziehung zufälliger Koeffizienten für Rauschen)

Das Obige basiert auf Kontrasten des gewünschten Hintergrunds mit dem schwarzen Hintergrund - das heißt Gesicht gegen Schwarz und Objekt gegen Schwarz . Wenn Gesicht gegen Objekt erforderlich ist, kann dies durch Neukodieren des Faktors oder direktes Angeben des Referenzpegels erfolgen. Wenn Gesicht gegen Nicht-Gesicht oder Objekt gegen Nicht-Objekt erforderlich ist, kann dies leicht durch Erstellen von Dummy-Variablen erreicht werden.


Ich danke Ihnen sehr für Ihre Antwort. Ich bin neu in R, daher muss ich mir das lme4-Paket ansehen, um Ihre Beispiele vollständig zu verstehen, aber was Sie beschreiben, klingt sehr nach dem, wonach ich suche.
Simeon

0

Ich glaube, dass die bedingte logistische Regression zu den gewünschten Ergebnissen führt.

Sie erkennen korrekt die Notwendigkeit, bei der Analyse dieser Daten eine Konvention für wiederholte Messungen zu verwenden. Sie haben 5 Befragte, die das binäre Ergebnis der korrekten / falschen Gesichts- / Objekterkennung unter mehreren Bedingungen bewertet haben. Die zahlreichen Antworten einer Person machen einen Ansatz mit wiederholten Maßnahmen erforderlich.

Wenn Ihre Absicht tatsächlich besser ausgedrückt wird als die Frage, ob der Befragte ein Gesicht oder ein Objekt auswählt, können Sie denselben analytischen Ansatz verwenden. Beachten Sie jedoch, dass Sie die Auswahl des Befragten nicht als richtig / falsch klassifizieren würden. Für eine dritte Kategorie von "beiden" benötigen Sie eine multinomiale logistische Regression. Ich gehe davon aus, dass Sie im Folgenden an einer korrekten / falschen Klassifizierung interessiert sind.

Sie geben an: "Da jeder Teilnehmer unter allen drei Hintergrundbedingungen gemessen wird, handelt es sich um ein abhängiges Design. Da ich für ein einzelnes Bild das Rauschen über die drei Hintergrundbedingungen konstant halte, ist es irgendwie gepaart oder angepasst." Die zu bewertenden Bedingungen sind zwar in ihrem Wert oder ihrer Qualität begrenzt, "konditionieren" jedoch nicht Ihre Analyse. Die Verwendung eines Gesichtsbildes mit grauem Hintergrund und 45% Rauschen ist nur ein Vektor von Kovariaten, die vorhanden sind, wenn eine Antwort aufgezeichnet wird. Grauer Hintergrund, Objekt, 45% Rauschen ist ein weiterer Vektor, während Weiß, Gesicht, 10% Rauschen ein anderer ist. Die Regression schlägt Ihnen vor, ob Hintergrund (Dummy-codiert), Rauschen oder zusätzliche Variablen mit der richtigen Antwort verknüpft sind. Die Assoziation zwischen korrekter Identifizierung und Änderung eines Wertes, wobei alle anderen Werte konstant bleiben. ist die Interpretation der multivariablen Regression. Auf diese Weise erhalten Sie ein Gefühl für die Assoziation zwischen Hintergrund ODER einem Unterschied von einer Einheit im Rauschen ODER ob ein Gesicht / Objekt mithilfe einer bedingten logistischen Regression angezeigt wurde.

Ihr Modell in R wäre ungefähr so:

install.packages("survival")
require("survival")
clogit(correct ~ background + noise + pic_type + strata(person), data)

Ein komplizierteres Modell für jedes bestimmte Gesicht oder Objekt unter den Bildern könnte in Betracht gezogen werden, aber Sie werden Ihre Fähigkeit, den gewünschten Hintergrundeffekt zu erkennen, beeinträchtigen.


2
Bei der Frage geht es nicht darum, ob die Teilnehmer Objekte oder Gesichter richtig auswählen, sondern darum ( ob
Joe King,

1
Die Analyse der "Wahrnehmung" kann nur als eines von zwei Dingen verstanden werden: (1) Auswahl eines Gesichts oder eines Objekts oder (2) Auswahl der richtigen Darstellung. Der Veranstaltungsraum scheint nur diese beiden Möglichkeiten zu enthalten. Daher sehe ich nicht, wie "beide" analysiert werden können. Das Originalplakat sollte das gewünschte Gewicht haben. Meine Antwort spiegelt wider, was ich als Unklarheit über das Ergebnis empfinde. Ich habe noch keine Kommentarfähigkeit, daher habe ich die Mehrdeutigkeit in meiner Antwort behandelt.
Todd D

Ich entschuldige mich dafür, dass ich nicht genau weiß, was ich mit Wahrnehmung gemeint habe, und dass ich ein schlechtes Beispiel für die verschiedenen Bedingungen gewählt habe. Ich muss einen schmalen Weg gehen, um keine Details einer unveröffentlichten Studie preiszugeben und (offensichtlich) nah genug an der Realität zu sein, dass es keine Unterschiede in der Analyse geben würde. Es scheint, dass ich keine gute Arbeit geleistet habe und ich entschuldige mich, wenn dies jemandes Zeit verschwendet hat. Ich habe einen weiteren Informationsblock hinzugefügt, der hoffentlich alle offenen Fragen klären wird. Wenn sich jemand durch diese Änderung betrogen fühlt, lassen Sie es mich wissen und ich sehe, was ich tun kann.
Simeon

@Simeon Ich bin mir immer noch nicht sicher, ob ich Ihr Forschungsproblem vollständig verstehe. Wenn Sie jedoch sowohl (1) testen möchten, ob der Hintergrund die Gesichtswahrnehmung beeinflusst, als auch (2) ob der Hintergrund die Objektwahrnehmung beeinflusst, können Sie den Datensatz durch die Darstellung von Gesicht oder Objekt teilen. Sie können dann die Rolle des Hintergrunds bei der Objekterkennung für verschiedene Hintergründe bewerten, wenn ein Objekt in einer Analyse angezeigt wird. Die andere Analyse würde Hintergrundeffekte auf die Gesichtserkennung bewerten, wenn ein Gesicht gezeigt wird. Nähert sich dies Ihrer Absicht?
Todd D

Vielen Dank für Ihre Antwort. Ich beabsichtige jedoch nicht, den Datensatz aufzuteilen, da der Effekt, die Reaktion der Teilnehmer auf Gesichter zu beeinflussen, auch bei Versuchen auftreten kann, bei denen ein verrauschtes Objekt auf einem Gesichtshintergrund dargestellt wird.
Simeon
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.