Co-evolution mellem malaria- parasitter (Plasmodium) og deres værter.

Slides:



Advertisements
Lignende præsentationer
Case: Tekst på Call-To-Action link
Advertisements

Historien om Jørgen Finke
Funktioner Grundbegreber.
Hypotese test – kapitel 6 (Signifikans test)
Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt
Statistik Lektion 18 Multipel Linear Regression
Anvendt Statistik Lektion 4
Program Informationer χ2-test (chi-i-anden) Projekt 3
Evolution.
KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Apis mellifera subspecies. Artens udbredelse Ruttner (1992): 25 underarter baseret på morfologisk, adfærdsmæssig og biogeografisk variation 3 hovedlinier/grp.
Sammenligning af to grupper – kapitel 7
1 Går fra at vil maksimere dækning til at minimere omkostning Det kender vi fra den anden bog Omkostningen er afstanden gange antal enheder der skal transporteres.
Evolutionen af ultraviolet syn hos vertebrater. Shi, Y. & Yokoyama, S. 2003: Molecular Analysis of the evolutionary significance of ultravolet voision.
Projekt 6: Molekylær Evolution Af Keratin Proteiner Vejleder: Rasmus Nielsen.
Rodkrebs Fylogeni Projektarbejde af: Line Vej Ugelvig & Tommy Kristensen Molekylær Evolution 2004.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Representations for Path Finding in Planar Environments.
Case.
Statistik Lektion 5 Log-lineære modeller.
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Signifikanstest ved (en eller) to stikprøver
Learning Objectives 5 Steps of a Significance Test Assumptions
Statistik II 5. Lektion Log-lineære modeller.
Evolutionsteorien En teori om, hvordan livet udvikler sig. For at forstå den skal man lære følgende begreber: Fødselsoverskud: Der fødes flere unger end.
Learning Objectives 5 Steps of a Significance Test Assumptions
Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
1 Sortering I elementære metoder. 2 Plan Terminologi Elementære metoder til sortering -sortering ved udvælgelse -sortering ved indsættelse -Shellsort.
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
1 Vi ser nu på en general graf Men antager at alle afstande er heltallige (Det er ikke så restriktivt) Algoritmen leder efter den mindst mulige dækningsdistance.
Malaria - diagnostik Maj - juni Malaria diagnostik Antal besvarelser : 18 - heraf 14 fra vagtholdet (93 %) - heraf 14 fra vagtholdet (93.
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Bio-informatik Søgning efter og karakterisering af mikro RNAer.
Algoritmer og Datastrukturer 1 Binære Søgetræer [CLRS, kapitel 12] Gerth Stølting Brodal.
1 Sortering. 2 Sortering ved fletning (merge-sort) 7 2 | 9 4  | 2  2 79 | 4   72  29  94  4.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 7. december 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Algoritmer og Datastrukturer 1 Binære Søgetræer [CLRS, kapitel 12] Gerth Stølting Brodal Aarhus Universitet.
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
1 Center problems Placer et givet antal nye faciliteter Alt efterspørgsel skal dækkes Dækningsdistancen skal minimeres.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri – lektion 8 Multipel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
F21: Instrumentvariabelestimation III1 Økonometri 1 Instrumentvariabelestimation III 8. december 2006.
Evolutionens historie
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Lineær og logistisk regression - fortsat
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Algoritmer og Datastrukturer 1
Anvendt Statistik Lektion 8
Algoritmer og Datastrukturer 1
Anvendt Statistik Lektion 6
Præsentationens transcript:

Co-evolution mellem malaria- parasitter (Plasmodium) og deres værter

Formål At undersøge slægtskab hos h.h.v malaria- parasitter af slægten Plasmodium og deres værter. At sammenligne fylogenier med henblik på at konstatere om der er sket co-evolution eller spring mellem værter.

Metode Download af gensekvenser (rRNA SSU) for parasitter og værter fra GenBank. Alignment med CLUSTALw Konstruktion af fylogenetiske træer v.h.a. –Neighbor-joining (NJ) –Maximum Parsimony (MP) –Maximum Likelihood (ML)

Neighbour-joining Minimum evolution Distance Matrix Method Fordele –Hurtig. Velegnet til store datasæt –Tillader lineages med forskellige grenlængder (forskellig mutationsrater/evolutionshastgheder) –Tillader korrektion af multiple substitutioner Ulemper –Sekvensinformation er reduceret –Giver kun et muligt træ –Stærkt afhængigt af den anvendte evolutionsmodel

Neighbour-joining Da afstanden mellem AC er kortere end AB ville AC klade sammen ved brug af UPGMA Derfor......

Neighbour-joining ialt 6 OTUs (N=6). Step 1: nettodivergens r(i) beregnes r(A) = =30 r(B) = 42 r(C) = 32 r(D) = 38 r(E) = 34 r(F) = 44 ABCDE B5 C47 D7107 E6965 F811898

Neighbour-joining Step 2: Ny distance beregnes for hvert OTU par: M(ij)=d(ij) - [r(i) + r(j)]/(N-2) M(AB)=d(AB) -[(r(A) + r(B)]/(N-2) M(AB)=5-[30+42]/(6-2)=-13

Neighbour-joining ABCDE B-13 C-11.5 D E F

Neighbour-joining A F | B \ | / /|\ E | C D

Neighbour-joining Step 3: Nu udvælges som naboer de to OTUer for hvem Mij er mindst A & B og D & E. Fx A & B som naboer. Ny noder som kaldes U Grenlængder beregnes fra den interne node U til de eksterne OTUer A & B S(AU) =d(AB) / 2 + [r(A)-r(B)] / 2(N-2) = 1 S(BU) =d(AB) -S(AU) = 4

Neighbour-joining Step 4: Nye afstande defineres fra U til alle andre terminale noder: d(CU) = d(AC) + d(BC) - d(AB) / 2 = 3 d(DU) = d(AD) + d(BD) - d(AB) / 2 = 6 d(EU) = d(AE) + d(BE) - d(AB) / 2 = 5 d(FU) = d(AF) + d(BF) - d(AB) / 2 = 7

Neighbour-joining C D | \ | A \ |___/ 1 / | \ / | \ 4 E | \ F \ B Hele proceduren gentages UCDE C3 D67 E565 F7898

Maximum Parsimony Parsimony indebærer at den mest simple hypotese foretrækkes Maximum parsimony er en karakterbaseret metode der udleder fylogenetiske træer ved at minimere det totale antal af evolutionære trin der kræves for at forklare et givent datasæt. Minimering af trælængden (antal substitutioner) Trin kan være base eller aminosyre substitutioner for sekvensdata

Maximum Parsimony Site Sekv A A G A G T G C A 2 A G C C G T G C G 3 A G A T A T C C A 4 A G A G A T C C G * * *

Maximum Parsimony 1) GGA ACA (3) \1 1/ Antal mutationer \ 2 / GGG --- ACG Træ I: 4 / \ /0 0\ (2) GGG ACG (4)

Maximum Parsimony (1) GGA GGG (2) \1 1/ Antal mutationer \ 1 / GCA --- GCG Træ II: 5 / \ /1 1\ (3) ACA ACG (4)

Maximum Parsimony (1) GGA GGG (2) \2 1/ Antal mutationer \ 0 / GCG --- GCG Træ III: 6 / \ /1 2\ (4) ACG ACA (3)

Maximum Parsimony Mindste antal substitutioner vinder.. Et informativt site favoriserer ET træ Træ I støttes af 2 sites Træ II støttes af 1 site Træ III støttes 0 sites MP søger efter det optimale (minimale) træ –Men der kan være mere end et! –Exhaustive search af alle mulige træer –MEEEEEN

Maximum Parsimony Antal OTUerAntal urodede træerAntal rodede træer E15 152,13E158E21

Maximum Parsimony Branch and Bound: en variation af MP der garanterer at finde det minimale træ uden at evaluerer samtlige træer Heuristic searches branch swapping metoder. Ingen garanti for at finde bedste træ –Nearest neighbour interchange –Subtree pruning and regrafting –Treebisection and reconnection

Maximum Parsimony

Fordele: Reducerer ikke sekvensinformation til et enkelt tal Prøver at give information om ancestrale sekvenser Evaluerer forskellige træer Ulemper: Langsom i forhold til distancebaserede metoder Bruger ikke al sekvensinformation Korrigerer ikke for multiple mutationer Giver ikke information om grenlængder

Maximum Likelihood Maximum Likelihood evaluerer en hypotese om en evolutionær historie som en sandsynlighed for at den foreslåede model og den hypotetiserede historie ville ligge til grund for de observerede data Det antages at en historie med en højere sandsynlighed for at nå det observerede stadium er at foretrække frem for en en historie med en lavere sandsynlighed Metoden søger efter træet med den højeste sandsynlighed eller likelihood

Maximum Likelihood Fordele med ML Ofte lavere varians end andre metoder (den metode mindst påvirket af sampling error!) Mindre påvirkelig over for brud på antagelser af den evolutionære model Selv med meget korte sekvenser er den ofte bedre en d MP og distancemetoder Al sekvensinformation bruges

Maximum Likelihood Ulemper med ML ML er MEGET langsom Resultatet er beroende på evolutionsmodellen som anvendes Vægtning af mutationer –Transition Purin til purin A til G, G til A Pyrimidin til pyrimidin T til C, C til T –Transversion Purin til pyrimidin A til T, A til C, G til T, G til C Pyrimidin til purin C til A, C til G, T til A, T til G

Maximum Likelihood Maximum likelihood evaluerer sandsynligheden for at den valgte evolutionsmodel vil have genereret de observerede sekvenser Fylogenier konstrueres ved at finde træer med den højeste likelihood

Maximum Likelihood Antag at vi har følgende alignede nukleotidsekvenser for 4 taxa: 1 j....N (1) A G G C U C C A A....A (2) A G G U U C G A A....A (3) A G C C C A G A A.... A (4) A U U U C G G A A.... C

Maximum Likelihood Under antagelse af at nukleotidsites udvikler sig uafhængigt (the Markovian model of evolution), kan likelihood for hvert site beregnes separat og en samlet likelihood for alle sites kan beregnes Alle muligheder for nukleotidudviklingen for site j må beregnes Sandsynligheden/Likelihooden for et bestemt site er summeringen af alle mulige rekonstruktioner for en bestemt basesubstitutionsmodel I dette tilfælde samtlige mulige nukleotider A,G,C,T ved node 5 og 6 eller 4 x 4 = 16 muligheder

Maximum Likelihood Og vi vil evaluere sandsynligheden/likelihooden for det urodede træ repræsenteret ved nukleotiderne ved site j (1,C) (2,C) \ / (5,?) --- (6,?) / \ (3,A) (4,G)

Maximum Likelihood N L= L(1) x L(2)..... x L(N) = ½ L(j) j=1 Da likelihoodværdier er små summes log likelihoods for hver enkelt site og likelihood for hele træet opgives som log likelihood N ln L= ln L(1) + ln L(2)....+ ln L(N) = SUM ln L(j) j=1

Maximum Likelihood Proceduren gentages for alle topologier/træer Træet med den højeste sandsynlighed er træet med maximum likelihood.

Bootstrapping Sample A A G G C U C C A A A B A G G U U C G A A A C A G C C C C G A A A D A U U U C C G A A C Pseudosample A G G G U U U C A A A B G G G U U U G A A A C G C C C C C G A A A D U U U C C C G A A C A B C B 1 C 6 5 D 8 7 4

Bootstrapping Sample A A G G C U C C A A A B A G G U U C G A A A C A G C C C C G A A A D A U U U C C G A A C Pseudoreplicates A A U U C C C C A A A B A U U C C G G A A A C A C C C C G G A A A D A C C C C G G C C C A B C B 2 C 4 2 D 7 5 3

Bootstrapping Sample A A G G C U C C A A A B A G G U U C G A A A C A G C C C C G A A A D A U U U C C G A A C Pseudoreplicates A A U U C C C C A A A B A U U C C G G A A A C A C C C C G G A A A D A C C C C G G C C C A B C B 1 C 3 2 D 6 3 4

Bootstrapping

Parasitter Fugl: P. gallinaceum Firben: P. mexicanum Gnaver: P. berghei Østaber: P. cynomolgi, P. knowlesi Chimpanse: P. reichenowi Menneske: P. falciparum, P. vivax, P. ovale, P. malariae

Co-evolution eller spring mellem værter? Hvis parasitternes stamtræ har samme topologi som de tilsvarende værters, kan det tolkes som co- evolution (parasitterne er udviklet med værterne). Hvis parasitternes stamtræ ikke har samme topologi som værternes, tyder det på, at parasitterne har sprunget mellem værter.

NJ værter

NJ parasitter

MP værter (bootstrap)

MP parasitter (bootstrap)

ML værter

ML parasitter

Hvad siger litteraturen? Waters et al. 1991: Fylogeni baseret på SSU rRNA, NJ. P. falciparum er opstået ved spring fra fuglevært til menneskelig vært. Quari et al. 1996: Fylogeni baseret på SSU rRNA, ML. Pattedyrsparasitter er evolutionært adskilt fra fugle/krybdyr-parasitter. P.falciparum og P. reichenowi (chimpanse) er søstergrupper og evolutionært adskilt fra resten af pattedyrsparasitterne Perkins & Schall 2002: Fylogeni baseret på cytochrom b, MP og ML. Samme konklusion som Quari et al.

Hvad understøtter vores resultater? MP-træet: Meget rodet, generelt parafyletiske arter. Støtter teori om spring fra fugl til menneske. Fastholder dog søstergruppeforholdet ml. P. falciparum og P. Reichenowi. NJ- og MP-træerne:Støtter teorien om adskillelse ml. krybdyr/fugleparasitterne og pattedyrsparasitterne. P. falciparum og P. reichenowi er søstergrupper og evolutionært adskilt fra resten af pattedyrsparasitterne.