Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens.

Lignende præsentationer


Præsentationer af emnet: "For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens."— Præsentationens transcript:

1 For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Next Generation Sequencing Analysis 2015 - RNA-sequencing Jonas Andreas Sibbesen & Lasse Maretty Bioinformatics Centre, University of Copenhagen Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 1

2 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 2 Transcriptome The full set of RNA transcripts and their associated abundance in a sample RNA-seq High-throughput sequencing technology used for probing the transcriptome of a sample

3 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Library preparation Differs primarily from the standard sequencing protocol by an additional reverse transcription step (RNA->cDNA) RNA-seq (protocol) Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 3 Martin et al., Nature Genetics Review (2011)

4 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod RNA-seq (strand-specific) The standard library preparation protocol do not preserve information about which strand was originally transcribed Strand-specific sequencing (e.g. dUTP method) Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 4 Martin et al., Nature Genetics Review (2011) Levin et al., Nature Methods (2010)

5 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod RNA-seq (output) Transcript fragments (single- or paired-end) Non-uniform distribution of fragments along transcripts due to biases Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 5 Lahens et al., Genome biology (2014)

6 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod RNA-seq (bias) Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 6 Lahens et al., Genome biology (2014)

7 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod RNA-seq vs. microarray Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 7 RNA-seq Pros: Discover novel genes and splice-variants Quantify a large dynamic range of expression levels Cons: Sequencing cost Low sensitivity for very lowly abundant transcripts (if you don’t sequence enough) Microarray Pros: Lower sample cost relative to sequencing Rapid turnover time Sensitivity for very lowly abundant transcripts Cons: Design based on annotated content (no discovery) Cross-hybridization Saturation

8 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Mapping RNA-seq reads Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 8 http://en.wikipedia.org/wiki/RNA-Seq Split-read mapping Reads are split by introns when a aligned to a reference genome Tools: Tophat2, STAR etc.

9 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Split-read mapping Tophat2 Uses a two step exon first approach Identify exons 1.Map reads contiguously (unspliced) Identify exon-exon junctions 1.Segment unmapped reads (e.g. 25 nt) 2.Map read segments 3.Search for neighbouring read segments to infer splice- junctions Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 9 Garber et al. Nature Methods Review (2011)

10 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Classic expression analysis Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 10 Estimate feature expression Test for differential feature expression Test for differential feature set enrichment Kinase A A B C D Kinase A ctrl treated p = 0.02 Kinase A ctrl treated Phosphorylation (p = 0.01) Kinase B ctrl treated

11 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Genes expression estimation 1.Build gene model (e.g. from RefSeq) 2.Count the numbers of reads aligned to the model (ignoring multi-maps) Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 11 isoform A isoform B union model isoform A isoform B union model 5 5 10

12 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Gene expression estimation: Caveats Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 12 isoform A isoform B union model 0 10 isoform A isoform B union model 5 5 10 ctrl treated

13 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Feature expression estimation: Transcripts Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 13 isoform A isoform B isoform C isoform A isoform B multi-maps Transcript abundance estimation algorithm 1.Initialisation: Randomly choose relative expression levels for A,B,C 2.Repeat: 1.Allocate reads based on expression 2.Estimate expression based on allocated reads

14 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Normalisation 1.Library-size (i.e. number of reads) 1.Length Transformation log(fold-change) Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 14 Garber et al. Nature Methods Review (2011) Composition effects

15 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Features: Genes vs. transcripts Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 15 Garber et al. Nature Methods Review (2011) GenesTranscripts Multi-map problem severity Low (only genomic repeats) High (genomic repeats and between isoforms) Functional annotations ManyFew ResolutionLowHigh Feature definitionRequired (not an observable entity) Observable entity (no definition required)

16 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Differential expression analysis: The data Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Gene expression (counts) Additional variables Clinical variables (e.g. blood pressure) Interventions (e.g. treatment) Etc. Slide 16 ControlTreated Gene 1352440434248 Gene 2121016131417911

17 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Count data Key t-test assumption Data is normally distributed with independent mean and variance Count data Mean and variance are not independent Counts are not normally distributed Normalisation does not change this! RNA-seq count data Overdispersed - not Poisson  Take home rant For counts: Use a test dedicated to (overdispersed) count data! Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 17 Figure from Anders et al. 2010

18 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Generalized linear models We could come up with a “t-test” for overdispersed count data – but we want something general! Generalised linear model: Distribution (e.g. Poisson): Observed r.v. Y ~ Pois(µ) Link function (e.g. log): log(E(Y)) = log(µ) = n Linear predictor: n = x1*beta1 + x2*beta2 … Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 18 The negative binomial distribution Two parameters (mean, dispersion) Allows for modeling count data that are more dispersed than expected from Poisson

19 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod DESeq2 Negative binomial GLM with log-link function Normalises for library size Produces log 2 -fold change (lfc) estimates e.g. beta treated = log(µ treated /µ ctrl ) Shrinks lfc’s for low counts (unstable?) Wald test (think one-sample t-test): H 0 : beta treated = 0 Under H 0 : beta ~ N(0, se beta ) -> beta/se beta ~ N(0,1) Adjust p-values for multiple testing (FDR method) Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 19

20 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Log-fold changes Biologically relevant changes are often assumed to be proportionate High baseline expression -> large response Low baseline expression -> small response Interested in relative change: Problem: Asymmetry Solution: Logarithm Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 20

21 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod DeSeq2 Differential gene expression analysis based on the negative binomial distribution Input: Read count tables (HTSeq) Output: Table containing statistics for whether a gene is differential expressed between two conditions Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 21 Gene id Mean read count Log2 fold change and standard error Test statisticP-value and adjusted p-value

22 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Transcriptome assembly Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 22 Objective Reconstruct and quantify the complete set of transcripts in a RNA-seq sample Motivation Discover novel transcripts not part of an annotation Perform transcriptome analyses for species without a proper annotation Korf, Nature Methods (2013)

23 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod The transcriptome assembly problem Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 23

24 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Transcriptome assembly pipeline Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 24 de novo Reference-based

25 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Transcriptome assembly algorithms Problem complexity Extremely hard problem (biases, fragmentation) – quite strong assumptions are needed Algorithms Cufflinks Finds the smallest combination of transcripts which can explain all exons and exon-exon junctions De facto standard algorithm Bayesembler Uses a statistical method to simultaneously find the most likely combination of transcripts and abundance values Shows marked improvements compared to other assemblers Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 25

26 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod Bioinformatics Centre Slide 26 Maretty, L., Sibbesen, J. & Krogh A., Bayesian transcriptome assembly, Genome Biology 2014, 15:501 Next Generation Sequencing Analysis 2015 - RNA-seq

27 Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling, brug formindsk indrykning Overskrift her For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod HTSeq-count Bioinformatics Centre Next Generation Sequencing Analysis 2015 - RNA-seq Slide 27 Simply counts the number of reads that map to each feature Feature: Can be a gene or transcript annotation Overlapping features: Union or intersection


Download ppt "For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens."

Lignende præsentationer


Annoncer fra Google