Statistik for geografer Lektion 6
Tidsrække Analyse Proces som varierer over tid Observationer til bestemte tidspunkter Eksempler y1, y2, …,yk, …,yn Langtidsændring i klima Efterspørgslen på elektricitet BNP i perioden 1945 - 2004
Tidsrække Analyse Præcis beskrivelse af de karakteristiske træk Modellere de typiske træk Lave forudsigelser Kontrollere processen Deskriptiv statistik Forklarende variable Extrapolation ud fra modellen Ændre på de forklarende variable
Ønske Måling = Noget Pænt + Støj Grundlæggende Antagelse Systematisk del Tilfældig del Grundlæggende Antagelse Målingen i dag ligner målingerne i den nærmeste fortid og fremtid
Dekomponering af tidsrækker Måling = Glat del + Støj Støj = Måling - Glat del Rest = Måling - Vores bud på den Glatte del Ligner den tilfældig støj?
Mere teoretisk: er støjen, dvs. den stokastiske del Hvor er den glatte del og er støjen, dvs. den stokastiske del
Glidende Gennemsnit
Glidende Gennemsnit Høj orden contra lav orden Outliers Lige orden
Yderligere Dekomponering Måling = Systematisk del + Støj Trend + … + Sæsonvariation Hvordan får man en tidsrække dekomponeret i individuelle mønstre????
Nu skal vi lave tidsrække
Hvordan var det lige det var?
Glidende Gennemsnit Bestem orden Vælg Funktion Udpeg variabel
Sæson Variation
Støj Processen
Sandsynlighedsregning Statistisk eksperiment Udfald Udfaldsrum Hændelse Random trial Noget hvor et ud af flere mulige udfald indtræffer Elementary outcome Resultatet af eksperimentet Sample space Mængden af alle mulige udfald Event Delmængde af udfaldsrummet
Sandsynlighedsmål S 0 ≤ P(Ei) ≤ 1 P(A) = Σ P(Ei) P(S) = 1 og P(Ø) = 0 En
Hvordan bestemmes sandsynligheden? Model-betragtning Objektiv metode Subjektiv metode Mønt, kortspil osv. Frekvensfortolkning Det afhænger af, hvem man spørger!!!
De fire tælleregler Produktreglen Permutationsreglen Kombinationsreglen Den hypergeometriske regel
Additions-sætningen S A B P(AUB) = P(A) + P(B) – P(A∩B)
Et eksempel
Eksemplet fortsat P(A|B) = P(A∩B) / P(B) P(Moderen røg) = 10/30 = 33.3% P(Apgar < 7) = 11/30 = 36.7% P(Moderen røg og Apgar < 7) = 8/30 = 26.7% P(Apgar < 7| Moderen røg) = 26.7% / 33.3 % = 8/10 = 80.0%
SPSS
…og så får vi
Bayes’ formel P(Brun) = 35% P(Lus|Blond) = 20% P(Lus) = ???
Bayes’ formel fortsat P(Lus|Blond) = P(Lus ∩ Blond)/P(Blond) P(Lus ∩ Blond) = P(Blond) P(Lus|Blond) = 0.4 · 0.2 = 8% P(Lus) = P(Lus ∩ Brun) + P(Lus ∩ Blond) + P(Lus ∩ Sort) + P(Lus ∩ Rød) = 0.12 · 0.35 + 0.20 · 0.40 + 0.08 · 0.20 + 0.25 · 0.05 = 15.1%
Bayes’ formel fortsat P(Rød|Lus) = ??? P(Rød|Lus) = P(Lus ∩ Rød)/P(Lus) = 0.25 · 0.05/0.151 = 8.3%
Den hypergeometriske fordeling Fra en population på N elementer, hvoraf d er defekte, udtages en stikprøve på n elementer. Hvis X er antal defekte i stikprøven fås
Eksempel En population består af 30 æbler, hvoraf 5 er rådne. Der udtages en stikprøve på 4 æbler. Kaldes X for antal rådne æbler i stikprøven fås q 1 2 3 4 sum P(X=q) 0,462 0,420 0,110 0,009 0,000 1,000