Ich untersuche Störungen, die durch den Schiffsverkehr zu einem kleinen Seevogel verursacht werden. Ich beobachtete fokale Tiere für eine festgelegte Zeitspanne und zeichnete auf, ob sie während der Beobachtung aus dem Wasser fliegen oder nicht. Dieser bestimmte Vogel fliegt nicht mit hoher Wahrscheinlichkeit, wenn er nicht gestört wird (etwa 10% der Zeit). Post hoc habe ich jeder Beobachtung die Entfernung zum nächsten Schiff hinzugefügt (Schiffe von Interesse hatten GPS-Ortungsgeräte, die alle 5 Sekunden einen Punkt aufzeichneten).
Ich habe die kumulative Verteilungsfunktion für ALLE Beobachtungen und für Beobachtungen aufgezeichnet, bei denen der Vogel als Funktion der Entfernung zum nächsten Schiff aus dem Wasser geflogen ist. Wie erwartet wurde die Mehrzahl der Beobachtungen, bei denen der Vogel flog, beobachtet, als sich das Schiff in der Nähe befand.
Kann ich mit dem Kolmogorov-Smirnov-Test testen, ob es einen statistischen Unterschied in der Verteilung der Flugbeobachtungen und der Gesamtbeobachtungen gibt? Mein Gedanke ist, wenn diese beiden Verteilungen unterschiedlich sind, würde dies darauf hindeuten, dass die Schiffsentfernung einen Einfluss auf den Flug hat. Ich mache mir Sorgen, da diese Verteilungsfunktionen nicht unabhängig sind, da die Flugbeobachtungen eine Teilmenge der Gesamtbeobachtungen sind.
Gedanken?
Nachdem ich auf dieser Seite etwas weiter gelesen habe, denke ich, dass ich die Verteilung der Beobachtungen, bei denen der Flug stattgefunden hat (F), gegen die Verteilung der Beobachtungen testen kann, bei denen dies nicht der Fall war (NF), da diese unabhängig sind. Wenn diese Verteilungen gleich F = NF sind, können wir annehmen, dass die Verteilung von (F) und (TOT = alle Beobachtungen) gleich ist, da wir wissen, dass die Verteilung von (F) gleich sich selbst und (F) + ist (T) = (TOT). Recht?
UPDATE: 12.02.14
Nach den Vorschlägen von @Scortchi untersuchte ich die Beziehung zwischen Fluginzidenz und Entfernung zum nächsten Schiff in einem logistischen Regressionsrahmen. Es war eine leichte Beziehung vorhanden (negative Steigung), aber der p-Wert war nicht signifikant, was darauf hindeutet, dass die wahre Steigung Null sein könnte. Basierend auf den beschreibenden Statistiken (einschließlich der Ecdf-Diagramme) vermutete ich, dass die Wirkung von nahen Schiffen durch die vielen Beobachtungen übertönt wurde, als das Schiff das Verhalten nicht beeinflusste. Ich habe dann das segmentierte R-Paket verwendet ( http://cran.r-project.org/web/packages/segmented/segmented.pdf)) um zu versuchen, einen Haltepunkt im Modell zu finden. Das Programm stellte fest, dass das Brechen der Daten in 2,6 km Entfernung vom Schiff und das Anpassen von zwei separaten Koeffizienten besser war als das Einzelkoeffizientenmodell. Der Koeffizient für die Steigung der Annäherungen an nahe Schiffe war negativ und legt nahe, dass Schiffe die Flugreaktion bis etwa 2,6 km beeinflussen (p-Wert <0,001). Der Koeffizient für die zweite Steigung war leicht positiv, aber der p-Wert war bei einem Alpha-Wert von 0,05 nicht signifikant (p-Wert = 0,11). Zusammenfassend konnte die segmentierte Regressionslinie eine Schwellendifferenz erkennen, bei der die Flugwahrscheinlichkeit zunimmt. Die Schätzung für die Flugwahrscheinlichkeit, wenn das Schiff weiter als 2,6 km entfernt ist, beträgt 0,11. Passenderweise beobachtete ich 79 Vögel, als sich noch keine Schiffe in der Untersuchungsbucht befanden (>
Vielen Dank für alle Vorschläge. Ich hoffe, diese Frage zusammen mit den Vorschlägen und Antworten hilft anderen.