Jakob Fredslund, datalog, phd. jakobf@birc.au.dk Team Supermule Jakob Fredslund, datalog, phd. jakobf@birc.au.dk
Planteavl Vores projekt er bl.a. om jordnøddeplanten (Arachis Hypogaea) Forædling: samling af gode egenskaber i samme linie (bakterieresistens, mange frugter, etc.) Kryds far-plante med gode egenskaber med mor-plante med andre gode egenskaber, håb på afkommet får dem alle
Planteavl Tager tid & plads og er bøvlet: egenskab afhængig af omgivelser test af egenskaben sen ikrafttræden, etc. Alternativt: genetiske markører. Sparer tid & plads: tag DNA-prøver brug kun kimplanter
Genetisk markør Specifikt stykke variabelt DNA der vides at sidde et (og kun et) sted i genomet Markør der følges med en ønsket egenskab kan være indikator (linkage: genet må så ligge tæt på markøren) Markør CGACTAGCAATGCTACA(G/C)AGGATCCCCGCGAC Genom (Ukendt) gen for ønsket egenskab
PCR Det gode ved genetiske markører: Let at afgøre om en plante har en given markør: Tag DNA-prøve Tilsæt kemisk fremstillede primere baseret på markør-DNA´en Lav Polymerase Chain Reaction (PCR)
Eksempel: gen for Supermuleegenskaben? Kilde: http://www.disney.dk/andersand/andeby/portraetter/supermule/
Supermulegenet Må have to alleller (findes i to varianter): Jordnøddens genom ? Må have to alleller (findes i to varianter): Fedtmuleallellen - almindelige jordnødder Supermuleallellen - superjordnødder
Supermulegenet Opgave: Hvilke planter har supermuleallellen? Jordnøddens genom ? Opgave: Hvilke planter har supermuleallellen? Problem: Vi kender ikke allellernes sekvens, så vi kan ikke afgøre med PCR, om en plante har den ene eller den anden
Genetisk markør som indikator? Jordnøddens genom AATGCTACAGG(C/T)GCCCGCGACCCGAC Følges med supermuleallellen AATGCTACAGGCGCCCGCGACCCGAC Følges med fedtmuleallellen AATGCTACAGGTGCCCGCGACCCGAC Vil gerne finde en markør tæt på genet
Mange markører → genetisk kort Jo flere markører, jo større chance for at en af dem ligger tæt på supermulegenet Dvs. lav genetisk kort: identificér en masse markører. (Markør: Specifikt stykke DNA i flere varianter der findes ét sted i genomet hos alle eksemplarer)
Hvordan finder vi markører? Sekventere hele jordnøddegenomet for flere jordnøddeplanter..? .. nix, alt for dyrt. ACGACCGGGGcaatccggcgcgcccacgcctcaCAGCGATGGTAGAGAG Jordnøddeplante A Jordnøddeplante B ACGACCGGGGgggcgggcgggcatcattactatCAGCGATGGTAGAGAG God markørregion: bevarelse & variation
EST’er Vi kan sekventere stumper af tilfældige gener og få expressed sequence tags (ESTs) exon exon exon exon Gen: DNA mRNA (sekventeres som EST) intron intron intron Protein
Leder efter bevarede regioner m. variation DNA bevaret mellem eksemplarer: vigtig for organismen. Meget vigtig DNA: bevaret mellem arter (ingen grund til at genopfinde den dybe tallerken).
Leder efter bevarede regioner m. variation Kig i EST-databaser for beslægtede arter, find bevarede stumper. Disse stumper vil formentlig også være bevaret hos alle eksemplarer af jordnøddeplanten. (også genominformation)
Leder efter bevarede regioner m. variation Ikke-så-vigtig DNA: bevares ikke nødvendigvis God chance for variation i introns selv i vigtigt gen (mutationer i introns skader ikke organismen) Dvs. godt bud på god markør: stump der indeholder bevaret exon samt intron exon exon exon exon intron intron intron
Leder efter bevarede regioner m. variation Sammenhold (align) bevarede EST´er med fuld genominformation fra Medicago/Lotus exon exon intron exon intron exon intron Lotusgenom Glycine EST Medicago EST Jordnød? AGCAT CGATCAGGAC GGGAA CTAAACTCTCTCTAG TACCC GGAGGAGGAGGACCTAACAATAAGAGAC CACAT TACCC CACAT AGCAT GGGAA TACCC CACAT TACCC <----------intron----------> CACAT Meget sandsynlig struktur – god markørregion!
Leder efter bevarede regioner m. variation Sammenhold (align) bevarede EST´er med fuld genominformation fra Medicago/Lotus exon exon intron exon intron exon intron Lotusgenom Glycine EST Medicago EST Jordnød? AGCAT CGATCAGGAC GGGAA CTAAACTCTCTCTAG TACCC GGAGGAGGAGGACCTAACAATAAGAGAC CACAT CACAT TACCC CACAT TACCC GGGAA AGCAT TACCC <----------intron----------> CACAT Meget sandsynlig struktur – god markørregion!
Alignment: Lotus, Glycine, Medicago introns (faktisk sekvens erstattet af X´er) God markørregion
Valg af specifik markør PCR skal kunne fungere for markøren: dvs. visse krav til primerne skal opfyldes
Datalogens forklaring af PCR DNA Primere (små stumper DNA kopieret fra markøren)
Datalogens forklaring af PCR Hvis primerne matcher DNA-strengen.. .. kan PCR med DNA-strengen som skabelon producere det manglende stykke mellem primerne.
Datalogens forklaring af PCR Efter mange gentagelser: Et produkt kan detekteres (markøren findes i DNA-strengen), eller Intet produkt (markøren findes ikke). Primere: skal kunne binde til DNA-strengen kun ét sted og ved optimal temperatur m.m. Dvs. ikke alle stumper af markøren kan bruges.
Primerdesign Typisk delvis manuelt ved inspektion af alignment
Automatisk primerdesign (og her kommer datalogen endelig på scenen)
Automatisk primerdesign Analyser alle mulige primere og giv dem en score Foreslå de bedste http://cgi-www.daimi.au.dk/cgi-chili/PriFi/main
Det vil altså sige.. Søgning i EST-databaser efter bevaret DNA Alignment med genomisk information Automatisk primerdesign til PCR Laboratorietest: giver primerne forskellige resultater for far- og mor-jordnøddeplanten? Hvis ja: her er en markør!
Status lige nu Ca. 70 primere testet Ca. 30 markører fundet Resten var ikke polymorfe eller primerne duede ikke i jordnøddeplanten Vi er kun halvvejs igennem vores EST-alignments → Nettet strammes om Supermulegenet!