Hintergrund: Ich bin ein Biostatistiker, der derzeit mit einem Datensatz zellulärer Expressionsraten ringt. Die Studie setzte eine Vielzahl von Zellen, die in Gruppen von verschiedenen Spendern gesammelt wurden, bestimmten Peptiden aus. Zellen exprimieren entweder bestimmte Biomarker als Reaktion oder sie tun dies nicht. Die Rücklaufquoten werden dann für jede Spendergruppe aufgezeichnet. Die Antwortraten (ausgedrückt als Prozentsätze) sind das Ergebnis des Interesses, und die Peptidexposition ist der Prädiktor.
Beachten Sie, dass die Beobachtungen innerhalb der Spender zusammengefasst sind.
Da ich nur die zusammenfassenden Daten habe, behandle ich die Spender-Rücklaufquoten (zumindest vorerst) als kontinuierliche Daten.
Die Komplikation ergibt sich aus der Tatsache, dass meine Daten viele Nullen enthalten. Viel zu viele, um ignoriert zu werden. Ich denke über ein Null-Inflations-Gammamodell nach, um mit der Tatsache fertig zu werden, dass ich kontinuierliche Daten in Verbindung mit einer Überfülle von Nullen verzerrt habe. Ich habe auch das Tobit-Modell in Betracht gezogen, aber dies scheint minderwertig zu sein, da es eine Zensur an einer Untergrenze im Gegensatz zu echten Nullen voraussetzt (Ökonomen könnten sagen, dass die Unterscheidung umstritten ist).
Frage: Wann ist es im Allgemeinen angebracht, ein Gammamodell ohne Inflation zu verwenden? Das heißt, was sind die Annahmen? Und wie interpretiert man seine Schlussfolgerungen? Ich wäre dankbar für Links zu Artikeln, die dies diskutieren, falls Sie welche haben.
Ich habe auf SAS-L einen Link gefunden, in dem Dale McLerran NLMIXED-Code für ein Gammamodell ohne Inflation bereitstellt, sodass dies möglich erscheint. Trotzdem würde ich es hassen, blindlings vorzugehen.