Sie verwechseln den Effekt einer Datentransformation mit der Verwendung einer Verknüpfungsfunktion in einem GLM.
E.( Y.| x)exp( a + b x )
In einem GLM wird die Verknüpfungsfunktion jedoch nicht zum Transformieren der Daten verwendet.
Das GLM selbst berücksichtigt die Tatsache, dass die Varianz des Poisson mit dem Mittelwert zunimmt; Sie müssen nichts dagegen tun (solange die Poisson-Annahme geeignet ist).
Das einzige, was es übrig ließ, um die Beziehung zwischen dem Prädiktor und der Antwort zu erklären. Die Verknüpfungsfunktion gibt die Form der Beziehung zwischen dem bedingten Mittelwert der Antwort und dem Prädiktor an.
Der sqrt-Link wird hauptsächlich zum Vergleich mit einer älteren Analyse verwendet, bei der eine Quadratwurzeltransformation verwendet wurde, um die Regression der kleinsten Quadrate anzuwenden. Mithilfe des Quadratwurzel-Links können Sie ein Modell derselben Funktionsform anpassen, jedoch mit vollständiger ML-Schätzung der Parameter.
Wenn Sie erwägen, das Protokoll zu verwenden, weil es die Beziehung linearisiert, ist dies definitiv der Link, den Sie verwenden sollten. (Im Allgemeinen ist der Protokolllink auch leichter zu interpretieren.)
Wenn Sie beide Verbindungsfunktionen wirklich unterhalten und zwischen ihnen wählen möchten, können Sie die AICs vergleichen. oder Sie können die Abweichungen vergleichen (es gibt natürlich auch andere Möglichkeiten, aber beide sind bereits in der zusammenfassenden Ausgabe enthalten und messen "fit"; je nachdem, was Sie betrachten, sollten sie zu derselben Schlussfolgerung führen). Wenn es jedoch keinen eindeutigen Hinweis darauf gibt, dass die Protokollverknüpfung unzureichend ist oder einen anderen Grund, die Quadratwurzelverknüpfung zu unterhalten, würde ich einfach die Protokollverknüpfung durchführen.
Beachten Sie, dass nachfolgende Hypothesentests von Koeffizienten, die aus denselben Datenpunkten geschätzt werden, (unter anderem) ihre nominalen Eigenschaften nicht mehr haben, wenn Sie die Daten verwenden, um zwischen den Verknüpfungsfunktionen zu wählen (Standardfehler sind zu klein, Konfidenzintervalle zu eng , p-Werte bedeuten nicht dasselbe ...)
(Übrigens sind dies nicht die einzigen beiden Verbindungsfunktionsoptionen für einen Poisson in R, da es auch den Identitätslink gibt ... und das zählt nicht, was Sie tun können, wenn Sie zu einer Quasi-Poisson-Anpassung wechseln.)
Eine Warnung: Wenn Sie eine Variable im Laufe der Zeit modellieren, sollten Sie berücksichtigen, dass (a) wahrscheinlich eine Zeitabhängigkeit in Ihren Zählungen besteht, die die GLM-Annahmen der Unabhängigkeit ungültig macht (z. B. könnten Ihre Standardfehler leicht auftreten falsch liegen); und (b) der Begriff der falschen Regression kann für eine Poisson-Regression genauso leicht gelten wie für eine gewöhnliche Regression (daher können Ihre Parameterschätzungen auch leicht falsch / irreführend sein).
Ich bezweifle , dass Ihre Serie stationär sein wird, so dass dies möglicherweise eine ernsthafte Bedrohung ist auf Ihre Schlussfolgerungen - aber falsche Regression kann ein Problem auch bei stationärer Serie sein (ein Punkt, der nicht so weit verstanden wird, gebe ich eine Referenz für den in diesem Antwort, welche Antwort auch das Phänomen mit Korrelationen im instationären Fall anhand eines einfachen Beispiels für das Werfen von Münzen veranschaulicht.