Statistik for geografer

Slides:



Advertisements
Lignende præsentationer
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Advertisements

Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Sandsynlighedsfordelinger
Hypotese test – kapitel 6 (Signifikans test)
Anvendt Statistik Lektion 3
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Hjemmeside : Statistiske test Silkeborg efteråret 2009 Jens Friis, AAU Hjemmeside :
Statistik og sandsynlighedsregning
Statistik Lektion 17 Multipel Lineær Regression
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Normalfordelingen Man siger at et talmateriale er normalfordelt, når der optræder mange observationer i midten af materialet og få i yderkanterne. Her.
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Matematikseminar foråret 2009
Akademi Merkonomer Statistik Aften 3
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 3
SPSS: basale dataanalyser
Statistik og sandsynlighedsregning
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Man siger at X er binomialfordelt med
Statistik – Lektion 2 Uafhængighed Stokastiske Variable
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistik for geografer
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 7
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Agenda Informationer Opsamling fra sidst Normalfordelingen
Grundlæggende teoretisk statistik
Statistik for geografer
Simpel Lineær Regression
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Bernoulli og binomial fordelingerne
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 1. oktober 2004.
Økonometri – lektion 7 Multipel Lineær Regression
Økonometri – lektion 5 Multipel Lineær Regression
 Gennemgang af aflevering  Poisson Fordelingen  Kontinuerte Fordelinger ◦ Intro til kontinuerte fordelinger ◦ Normalfordelingen.
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Grundlæggende teoretisk statistik
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Økonometri – lektion 8 Multipel Lineær Regression
Introduktion Deskriptiv statistik Sandsynslighedregning
Betinget sandsynlighed Bayes’ regel Diskrete stokastiske variable
Simpel Lineær Regression
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Lektion 2. Definitioner En stikprøve (sample) Vi ønsker at generalisere ud fra en stikprøve Stikprøvefejls (samplings-error) Tilfældige fejl Systematikse.
Lektion 3. Noget teori og nogle begreber En stikprøve eller et observationssæt betegnes x 1,x 2,…………x n En a- fraktil er det mindste tal x, hvor den kumuleret.
Statistik Lektion 8 Test for ens varians.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Normalfordelingen og Stikprøvefordelinger
Statistik II 4. Lektion Logistisk regression.
Statistik for geografer
Statistik for geografer Lektion 8. Hvordan beskrives fordelingen?
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Reliabilitet. Disposition Kapitel 4 Artikel: Reliability of SF-36 in an Internet- and a pen-and-paper version Pause Artikel v. Annette de Thurah.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel.
Opgave i normalfordeling 2.g, HHX. Grundbegreber Middelværdi, μ (græsk: my) Standardafvigelse, σ(græsk: sigma) X ̴ N(μ,σ)
Ellen Holm, Forskningscafé
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Statistik for geografer Lektion 8

Stokastiske variable R S En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at udføre eksperimenter ( fx. foretage en meningsmåling, måle nitratindhold i drikkevand osv.) kan man få værdier af en stokastisk variabel. Disse værdier betegnes med de tilsvarende små bogstaver, fx. x1, x2, x3, …… xn , hvis der er udført n eksperimenter. X R S

Hvorfor er det lige at vi skal lære det her?

Stokastisk variabel

…og det vi vil, er jo …

Diskret variabel (antals variabel)

Beskrivelse af variationen

De vigtigste diskrete fordelinger Den uniforme fordeling (lige-fordelingen) Binomial-fordelingen Poisson-fordelingen

Den Uniforme Fordeling

Binomial Fordelingen

Binomialfordelingen Et basiseksperiment beskrives af et udfaldsrum E med to udfald succes (s) og fiasko (f), dvs. E={s,f}, hvor P(s)=p og P(f)=1-p. Basiseksperimemtet gentages n gange uafhængigt af hinanden. Hvis X betegner antal succes i de n gentagelser gælder der Sætning: E(X)=np ; V(X)=np(1-p) Eks. 5 uafhængige kast med en terning. X er antal 6’ere. q 1 2 3 4 5 P(X=q) 0,402 0,462 0,161 0,032 0,003 0,000

Et eksempel

Poisson Fordelingen

Poisson Fordelingen

Poisson Fordelingen

Poisson Fordelingen

SPSS

Kontinuerte fordelinger

Hvordan beskrives fordelingen?

Tæthedsfunktion

Middelværdi

Beskrivelse af variationen

Mere formelt :Kontinuerte fordelinger Definition: Tæthedsfunktion En sandsynlighedstæthedsfunktion på R er en integrabel funktion f : R→[0;∞[ hvor =1 Definition: Kontinuert fordeling En kontinuert sandsynlighedsfordeling er en sandsynlighedsfordeling, som har en sandsynlighedstæthedsfunktion f : funktionen kaldes fordelingsfunktionen for en kontinuert fordeling på R Definition: middelværdi ,varians og spredning Lad X være en stokastisk variabel med tæthedfunktion f(x) Middelværdi : μ=E(X)= Varians : σ2=E((X-μ)2)= Spredningen er σ

Normalfordelingen er det klassiske eksempel på en kontinuert fordeling. Her er tæthedsfunktionen givet ved Middelværdien er μ og spredningen σ. Den stokastiske variabel med denne tæthedsfunktion siges at være N(μ, σ2) –fordelt. Den normalfordelte stokastiske variabel, som har middelværdi 0 og varians 1, kaldes sædvanligvis U, og den tilhørende tæt- hedsfunktion for φ , dvs. at Den tilsvarende fordelingsfunktion kaldes for Ф, dvs. at

Man kan derfor klare sig med kendskab til værdier af Ф, som er Der gælder følgende : Man kan derfor klare sig med kendskab til værdier af Ф, som er tabellagt og indlagt i de fleste computersystemer. Undersøgelse af om et observationssæt kan betragtes som Normalfordelt: Apgar- fødselsvægt (SPSS) eller BMI – Geogear (SPSS)

Den uniforme fordeling

Normalfordelingen

Normalfordelingen

Standard normalfordelingen

Hvorfor er normalfordelingen interessent? Ja, det er den, fordi gennemsnittet af næsten alle målinger tilnærmelsesvis er normalfordelt. Mere præcist, så gælder den centrale grænseværdisætning :

QQ-plot – What and How?

Output

Annual Maximums of Daily Rainfall in Sydney Not nice and normal QQ-plot is not terrible though

Log-transform Much nicer!!

Detrended QQ-plots Here we see the difference between raw and log-transformed data Deviations seem to be scattered unstructured Deviations are structured

Skewness og QQ-plot Venstre-skæv

Skewness og QQ-plot Højre-skæv

Box-plot Outliers 75% percentil Median

Boxplot illustrerer forskelle