Download præsentationen
1
Statistik for geografer
Lektion 8
2
Stokastiske variable R S
En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at udføre eksperimenter ( fx. foretage en meningsmåling, måle nitratindhold i drikkevand osv.) kan man få værdier af en stokastisk variabel. Disse værdier betegnes med de tilsvarende små bogstaver, fx. x1, x2, x3, …… xn , hvis der er udført n eksperimenter. X R S
3
Hvorfor er det lige at vi skal lære det her?
4
Stokastisk variabel
5
…og det vi vil, er jo …
6
Diskret variabel (antals variabel)
7
Beskrivelse af variationen
8
De vigtigste diskrete fordelinger
Den uniforme fordeling (lige-fordelingen) Binomial-fordelingen Poisson-fordelingen
9
Den Uniforme Fordeling
10
Binomial Fordelingen
11
Binomialfordelingen Et basiseksperiment beskrives af et udfaldsrum E med to udfald succes (s) og fiasko (f), dvs. E={s,f}, hvor P(s)=p og P(f)=1-p. Basiseksperimemtet gentages n gange uafhængigt af hinanden. Hvis X betegner antal succes i de n gentagelser gælder der Sætning: E(X)=np ; V(X)=np(1-p) Eks. 5 uafhængige kast med en terning. X er antal 6’ere. q 1 2 3 4 5 P(X=q) 0,402 0,462 0,161 0,032 0,003 0,000
12
Et eksempel
13
Poisson Fordelingen
14
Poisson Fordelingen
15
Poisson Fordelingen
16
Poisson Fordelingen
17
SPSS
24
Kontinuerte fordelinger
26
Hvordan beskrives fordelingen?
27
Tæthedsfunktion
28
Middelværdi
29
Beskrivelse af variationen
30
Mere formelt :Kontinuerte fordelinger
Definition: Tæthedsfunktion En sandsynlighedstæthedsfunktion på R er en integrabel funktion f : R→[0;∞[ hvor =1 Definition: Kontinuert fordeling En kontinuert sandsynlighedsfordeling er en sandsynlighedsfordeling, som har en sandsynlighedstæthedsfunktion f : funktionen kaldes fordelingsfunktionen for en kontinuert fordeling på R Definition: middelværdi ,varians og spredning Lad X være en stokastisk variabel med tæthedfunktion f(x) Middelværdi : μ=E(X)= Varians : σ2=E((X-μ)2)= Spredningen er σ
31
Normalfordelingen er det klassiske eksempel på en kontinuert
fordeling. Her er tæthedsfunktionen givet ved Middelværdien er μ og spredningen σ. Den stokastiske variabel med denne tæthedsfunktion siges at være N(μ, σ2) –fordelt. Den normalfordelte stokastiske variabel, som har middelværdi 0 og varians 1, kaldes sædvanligvis U, og den tilhørende tæt- hedsfunktion for φ , dvs. at Den tilsvarende fordelingsfunktion kaldes for Ф, dvs. at
32
Man kan derfor klare sig med kendskab til værdier af Ф, som er
Der gælder følgende : Man kan derfor klare sig med kendskab til værdier af Ф, som er tabellagt og indlagt i de fleste computersystemer. Undersøgelse af om et observationssæt kan betragtes som Normalfordelt: Apgar- fødselsvægt (SPSS) eller BMI – Geogear (SPSS)
33
Den uniforme fordeling
34
Normalfordelingen
35
Normalfordelingen
36
Standard normalfordelingen
37
Hvorfor er normalfordelingen interessent?
Ja, det er den, fordi gennemsnittet af næsten alle målinger tilnærmelsesvis er normalfordelt. Mere præcist, så gælder den centrale grænseværdisætning :
38
QQ-plot – What and How?
39
Output
40
Annual Maximums of Daily Rainfall in Sydney
Not nice and normal QQ-plot is not terrible though
41
Log-transform Much nicer!!
42
Detrended QQ-plots Here we see the difference between raw and log-transformed data Deviations seem to be scattered unstructured Deviations are structured
43
Skewness og QQ-plot Venstre-skæv
44
Skewness og QQ-plot Højre-skæv
45
Box-plot Outliers 75% percentil Median
46
Boxplot illustrerer forskelle
Lignende præsentationer
© 2024 SlidePlayer.dk Inc.
All rights reserved.