Statistik – Lektion 2 Uafhængighed Stokastiske Variable

Slides:



Advertisements
Lignende præsentationer
Kombinatorik, sandsynlighed og statistik
Advertisements

Hypotese test – kapitel 6 (Signifikans test)
Anvendt Statistik Lektion 3
Kombinatorik, sandsynlighed og statistik
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Statistik og sandsynlighedsregning
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Matematikseminar foråret 2009
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
Statistik og sandsynlighedsregning
Statistik og sandsynlighedsregning
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Sandsynligheder Udfald og hændelser Sandsynligheder Additionsreglen
Statistik for geografer
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Statistik for geografer
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik for geografer
Bernoulli og binomial fordelingerne
Statistik Lektion 7 Hypotesetest og kritiske værdier
Kombinatorik, sandsynlighed og statistik
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Grundlæggende teoretisk statistik
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Statistik for geografer Lektion 6. Sandsynlighedsregning Statistisk eksperiment Udfald Udfaldsrum Hændelse Statistisk eksperiment Udfald Udfaldsrum Hændelse.
Økonometri – lektion 8 Multipel Lineær Regression
Introduktion Deskriptiv statistik Sandsynslighedregning
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Kombinatorik, sandsynlighed og statistik
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Betinget sandsynlighed Bayes’ regel Diskrete stokastiske variable
Simpel Lineær Regression
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Statistik Lektion 8 Test for ens varians.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
Grundlæggende teoretisk statistik
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Normalfordelingen og Stikprøvefordelinger
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Anvendt Statistik Lektion 6
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Statistik – Lektion 2 Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Repetition Population Stikprøve Hændelser Sandsynligheder Populationsstørrelse N Populationsmiddelværdi μ Populationsvarians σ2 Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s2 Hændelser Sandsynligheder

Simultan og marginal sandsynlighed Simultan sandsynlighed er sandsynligheden for at en eller flere hændelser indtræffer simultant, fx P(A1∩B1) Marginale sandsynligheder beregnes ved at summere over rækker og søjler Holdning til fælles fond B Fælles fond bedst B1 Fælles fond dårligst B1 Total God skole A1 P(A1∩B1) =0.11 0.29 P(A1) = 0.40 Dårlig skole A2 0.06 0.54 0.60 0.17 0.83 P(A)=P(B)=1.00 Skole B

Uafhængighed To hændelser er uafhængige hvis: Lige meget hvilken kombination af hændelser vi vælger, skal uafhængigheden gælde. Hvis bare en kombination viser afhængighed, er hændelserne afhængige.

Uafhængighed Eksempel: Er der uafhængighed mellem om en fælles fond er god eller dårlig og om manageren kom fra en god eller dårlig skole? Holdning til fælles fond B Fælles fond bedst B1 Fælles fond dårligst B2 Total God skole A1 0.11 0.29 0.40 Dårlig skole A2 0.06 0.54 0.60 0.17 0.83 1.00 Skole B Check fx om P(B1|A1) = P(B1) el. P(A2∩B2)= P(A2)P(B2)

Lov om Total Sandsynlighed I ord: Sandsynligheden for A er lig sandsynligheden for A og B plus sandsynligheden for A og B’s kompliment. _ B B A

Eksempel – Lov om Totalsandsynlighed Kortspil – find sandsynligheden for at trække et billedkort, A: Det må være sandsynligheden for at trække en billedkort i Hjerter (H), Spar (S), Ruder (R) eller Klør (K): P(A)=P(A∩H) + P(A∩S) + P(A∩R) + P(A∩K) = 3/52 + 3/52 + 3/52 + 3/52 = 12/52 Hjerter Spar Ruder Klør A∩H A∩S A∩R A∩K A

Bayes’ sætning Bemærk: Vi har ”vendt” de betingede sandsynligheder!

Bayes’ sætning – Eksempel 2-10 En test for en sjælden sygdom, der rammer 0,1% af befolkningen (P(I)=0,001), er upræcis. Lad i det følgende: Sandsynligheden for at testen er positiv når man er syg: Sandsynligheden for at testen er positiv, når man er rask: Hvad er så sandsynligheden for at man er syg, givet at testen var positiv?

Stokastisk Variabel: Et eksempel Betragt de forskellig mulige ordninger af drenge (B) og piger (G) i fire fødsler. Der er 2*2*2*2=24 = 16 muligheder og udfaldsrummet er: BBBB BGBB GBBB GGBB BBBG BGBG GBBG GGBG BBGB BGGB GBGB GGGB BBGG BGGG GBGG GGGG Hvis pige og dreng er lige sandsynlige, [P(G) = P(B) = 1/2], og kønnet af hvert barn er uafhængig af kønnet på det foregående barn, så er sandsynligheden for hver af disse 16 muligheder: (1/2)(1/2)(1/2)(1/2) = 1/16.

Eksempel - fortsat Tæl antallet af piger i hver af de fire fødsler: BBBB (0) BGBB (1) GBBB (1) GGBB (2) BBBG (1) BGBG (2) GBBG (2) GGBG (3) BBGB (1) BGGB (2) GBGB (2) GGGB (3) BBGG (2) BGGG (3) GBGG (3) GGGG (4) Bemærk at: hvert mulig udfald tildeles en enkelt værdi værdierne, der tildeles varierer over de forskellige udfald Antallet af piger er en stokastisk variabel: En stokastisk variabel , X, er en funktion, der tildeler en enkelt, men variabel værdi til hvert element i udfaldsrummet.

Eksempel - fortsat X 1 2 3 4 Punkter på den reelle linie Udfalds rum BBBB BGBB GBBB BBBG BBGB GGBB GBBG BGBG BGGB GBGB BBGG BGGG GBGG GGGB GGBG GGGG 1 2 3 4 X Udfalds rum Punkter på den reelle linie

Stokastisk variabel En stokastisk variabel X er en funktion defineret på S (udfaldsrummet), der antager værdier på R (reelle tal) I eksperimenter knyttes en talværdi til hvert udfald: Stokastiske variable kan enten være diskrete eller kontinuerte. Diskrete: Antager et endeligt antal værdier Kontinuerte: Antager værdier i en mængde af reelle tal X: S R S oi R X(oi) X

Eksempler på diskrete og kontinuerte variable Eksperiment Stokastisk variabel Type Kast med terning Antal øjne Diskret Kast med 2 terninger Sum af antal øjne Familie i Danmark Antal børn Indkomst Kontinuert Kvinder i Danmark Højde Baby Fødselsvægt Resten af denne forelæsning ser vi på diskrete stokastiske variable

Eksempel - fortsat Eksempel: Den stokastisk variabel X = 3 når de følgende fire hændelser BGGG, GBGG, GGBG, eller GGGB forekommer, P(X = 3) = P(BGGG) + P(GBGG) + P(GGBG) + P(GGGB) = 4/16 Sandsynligheds fordelingen af en stokastisk variabel er en tabel, der opskriver alle de mulige værdier af en stokastisk variabel og deres tilknyttede sandsynligheder. x P(x) For eksemplet: 0 1/16 1 4/16 2 6/16 3 4/16 4 1/16 16/16=1

Eksempel - fortsat

Sandsynligheds fordeling Definition: Lad X:S→R være en diskret stokastisk variabel. P(X=x) = P(x) er en sandsynligheds-fordeling (-funktion) for X, hvis:

Kumulativ fordelingsfunktion Den kumulative fordelingsfunktion, F(x), for en diskret stokastisk variabel X er: Kumulative fordelingsfunktions for antallet af piger ved 4 fødsler: x P(x) F(x) 0 1/16 1/16 1 4/16 5/16 2 6/16 11/16 3 4/16 15/16 4 1/16 16/16 1.00 1 . . 9 . 8 . 7 x ) . 6 ( F . 5 . 4 . 3 . 2 . 1 . 1 2 3 4 x

Eksempel - fortsat x P(x) F(x) 0 1/16 1/16 1 4/16 5/16 2 6/16 11/16 0 1/16 1/16 1 4/16 5/16 2 6/16 11/16 3 4/16 15/16 4 1/16 16/16 1.00

Middelværdi Middelværdien af en diskret stokastisk variabel X er givet ved: Dvs. summen af værdien gange sandsynligheden for værdien – et vægtet gennemsnit. Bemærk! Middelværdi kaldes også den forventede værdi.

Middelværdi - Eksempel x P(x) xP(x) 0 1/16 1 4/16 2 6/16 3 4/16 4 1/16 16/16=1 Eksempel: X er antal øjne ved terningkast. Dvs. P(X=1) = P(X=2) = … = P(X=6) =1/6. Middelværdien er da:

Varians Variansen er den vægtede gennemsnitlige kvadrerede afvigelse af værdierne af en stokastisk variabel fra gennemsnittet. Standard afvigelsen er kvadratroden af variansen:

Varians - eksempel x x2 P(x) x2P(x) xP(x) 0 0 1/16 0 0 0 0 1/16 0 0 1 1 4/16 4/16 4/16 2 4 6/16 24/16 12/16 3 9 4/16 36/16 12/16 4 16 1/16 16/16 4/16 1 80/16 32/16

Chebyshevs Sætning For en stokastisk variabel X med middelværdi μ og varians σ2 og ethvert tal k>1 gælder: Ex: k=2: Dvs. at med mindst 75% sandsynligheden er X mindre end to standardafvigelser fra μ.

Regneregler for middelværdi og varians Hvis X er en diskret stokastisk variabel, da er middelværdien for en funktion h(X) givet ved Regneregler for en lineær funktion af X:

Regneregler for middelværdi og varians Middelværdien af en linearkombination af stokastiske variable X1,X2,…,Xk. Hvis X1,X2,…,Xk er indbyrdes uafhængige, så: