Ist die beobachtete Allelfrequenz signifikant geringer als vorhergesagt?


10

Frage : Wie kann ich einen Test erstellen, um festzustellen, ob die beobachtete "Berg" -Allele-Frequenz (Abb. 1) im mittleren bis südlichen Gebirge signifikant niedriger ist als vom ökologischen Auswahlmodell vorhergesagt (Abb. 2) ( Einzelheiten siehe unten )?

Problem : Mein erster Gedanke war, die Modellreste gegen Breite: Länge und Höhe zu regressieren (was nur dazu führt, dass die Wechselwirkung zwischen Breite und Länge als signifikant gilt). Das Problem ist, dass die Residuen (Abb. 3) Variationen widerspiegeln können, die nicht durch das Modell erklärt wurden, und / oder dass etwas biologisches passiert, z. B. hatte das Allel keine Zeit, sich nach Süden zu seinem Potenzial auszubreiten, oder es gibt eine Barriere für den Genfluss. Wenn Sie die beobachteten (Abb. 1) mit den erwarteten (Abb. 2) Gebirgsallelfrequenzen vergleichen, gibt es einen offensichtlichen Unterschied, insbesondere in den zentralen und südlichen Bergen Schwedens und Norwegens. Ich akzeptiere, dass das Modell möglicherweise nicht alle Variationen erklärt, aber kann ich einen vernünftigen Test finden, um die Idee zu untersuchen, dass das Berg-Allel sein Potenzial in den zentralen bis südlichen Bergen nicht erreicht hat?

Hintergrund: Ich habe einen bi-allelischen AFLP-Marker, dessen Häufigkeitsverteilung mit dem Lebensraum der Berge (und Breiten- und Längengrade) im Vergleich zu den Lebensräumen im Tiefland auf der skandinavischen Halbinsel in Zusammenhang zu stehen scheint (Abb. 1). Die "Berg" -Allele ist im Norden, der bergig ist, fast fixiert. Es fehlt fast oder ist für das "Tiefland" -Allele im Süden, dem Berge fehlen, fixiert. Wenn man sich in den Bergen von Norden nach Süden bewegt, tritt die "Berg" -Allele in geringerer Häufigkeit auf. Dieser Unterschied in der "Berg" -Allele-Frequenz von Nord nach Süd kann einfach auf Phylogeographie oder historische Prozesse zurückzuführen sein, da die Region sowohl von Norden als auch von Süden kolonisiert wurde. Wenn das Berg-Allel beispielsweise aus der nördlichen Bevölkerung stammt, hatte es möglicherweise keine Zeit, sich vollständig auf die südliche Bevölkerung auszudehnen.

Meine Arbeitshypothese ist, dass die "Berg" -Allele-Frequenz ein Ergebnis der ökologischen Selektion ist (Nullhypothese ist neutrale Selektion).

Für mein ökologisches Auswahlmodell habe ich ein verallgemeinerte additives Modell (GAM) mit der binomischen Allel verwendet Frequenz als Reaktionsvariable (129 Standorte in Fennoscandinavia mit in der Regel 10 bis 20 Personen an jeder Stelle abgetastete) und mehrere Klima- und Vegetationsperiode Variablen wie die Prädiktorvariablen. Die Modellergebnisse sind wie folgt (TMAX04-06 = maximale Temperatur im April-Juni, Phen_NPPMN = mittlere Vegetationsproduktivität in der Vegetationsperiode, PET_HE_YR = jährliche potenzielle Evapotranspiration, Dist_Coast = Entfernung zur Küste):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

Geben Sie hier die Bildbeschreibung ein

Figure 1. Beobachtete "Berg" -Allelefrequenz für den bi-allelischen AFLP-Marker. Konturlinien 0,1 Frequenzintervalle, Farbschattierung ist Höhe mit Blau für niedrigste und Rot am höchsten.

Geben Sie hier die Bildbeschreibung ein

Abbildung 2. Voraussichtliche "Berg" -Allelefrequenz für den bi-allelischen AFLP-Marker. Konturlinien 0,1 Frequenzintervalle, Farbschattierung ist Höhe mit Blau für niedrigste und Rot am höchsten.

Geben Sie hier die Bildbeschreibung ein

Abbildung 3. Residuen des ökologischen Auswahlmodells (unter Verwendung von GAM), aufgeschlüsselt nach dem gesamten Untersuchungsgebiet (Fennoscandinavia) und getrennt nach Norwegen, Schweden und Finnland. Die roten gestrichelten Linien stellen eine sekundäre Kontaktzone zwischen der nördlichen und der südlichen Population dar, die aus anderen AFLP-Markern und der Stabilisotopenanalyse von Federn abgeleitet wurde, die auf ihren separaten Überwinterungsgebieten in Afrika gezüchtet wurden. Die dünne schwarz gepunktete Linie ist das Zentrum der Zone.


1
Vielen Dank für die große Menge an Details. Wie kommt das Nullmodell in Frage? Es scheint, dass nur das ökologische Auswahlmodell für den Vergleich von beobachtet und erwartet von Bedeutung ist.
gui11aume

Was sind Ihre tatsächlichen Daten hier? Die Modellausgabe sagt "n = 129", aber sind das 129 Individuen oder 129 Orte, an denen Sie jeweils Allelfrequenzen haben, oder ...?
Onestop

Es tut mir leid, dass ich so viel Hintergrund wie möglich bereitstellen wollte, damit Sie alle die Logik (oder Unlogik) meines Ansatzes für das von mir entwickelte Manuskript am besten verstehen können. Meine Frage steht ganz oben, ich möchte ein Warum finden, um festzustellen, ob der Unterschied zwischen beobachtet und erwartet signifikant unterschiedlich ist. Dies könnte mich darüber informieren, ob sich das Allel noch ausbreitet oder ob es ein Hindernis gibt, den erwarteten Wert zu erreichen. Da es sich bei "N = 129" um eine Allelfrequenz handelt, bedeutet dies 129 Stellen mit typischerweise zwischen 10 und 20 Individuen, die an jeder Stelle beprobt wurden.
Keith Larson

Sie erwähnen, dass Individuen für die mütterlichen und automsomalen Loci panmiktisch zu sein scheinen. Haben Sie Zugriff auf diese Daten? Wie haben Sie Panmixia bewertet?
Sameer

Antworten:


1

Diese Frage mag tot sein, aber die Grafiken hier sind großartig, und die Antwort hier fühlt sich intuitiv offensichtlich an. Wenn Sie nach einem "Berg" -Allel suchen, ist es naheliegend, die Höhe (oder einen Ersatz davon) als Prädiktor zu verwenden. Wenn dies einen signifikanten Zusammenhang mit der Allelfrequenz zeigt, würde dies einen starken Beweis für Ihre Hypothese liefern.

Sie können mehr Prädiktorvariablen hinzufügen, die andere Aspekte des Berges als seine Höhe beschreiben - zum Beispiel die "Rauheit" des Geländes oder den Vegetationstyp -, die einzigartig bergig sind und auch mit der Allelfrequenz verbunden sein können.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.