Anvendt Statistik Lektion 5

Slides:



Advertisements
Lignende præsentationer
Hypotese test – kapitel 6 (Signifikans test)
Advertisements

Anvendt Statistik Lektion 3
Dummyvariabler 13. oktober 2006
Dagens program Kursusevaluering Information Spørgsmål om eksamen
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Statistik Lektion 18 Multipel Linear Regression
Anvendt Statistik Lektion 4
Statistik og sandsynlighedsregning
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 9
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
Statistik og sandsynlighedsregning
Grundlæggende teoretisk statistik
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Statistik og kvantitativ metode Politik & Administration og Samfundsfag 3. semester 2007 Lektion 5, tirsdag den 23. oktober Punkt- og intervalestimering.
Case.
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Signifikanstest ved (en eller) to stikprøver
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik II Lektion 4 Generelle Lineære Modeller
Anvendt Statistik Lektion 7
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Grundlæggende teoretisk statistik
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Simpel Lineær Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri – lektion 7 Multipel Lineær Regression
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Anvendt Statistik Lektion 10  Regression med både kvantitative og kvalitative forklarende variable  Modelkontrol 1.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Statistik Lektion 8 Test for ens varians.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri – lektion 6 Multipel Lineær Regression
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 4
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 3
Præsentationens transcript:

Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Der er to variable registeret for hver person Køn: Forklarende variabel Binær/dikotom (to mulige værdier) Tid: Afhængig variabel Kontinuert/skala Uafhængige grupper (mænd/kvinder) Rengøring/Madlavning Køn Stikprøvestørrelse (ni) Gennemsnit (yi) Standardafvigelse (si) Mænd 1219 23 32 Kvinder 733 37 16

Sammenligning af middelværdier Mål: Sammenligne middelværdier m1 og m2 for to grupper. Ny parameter Differencen m2 - m1 er en parameter Estimat y2 – y1 er et estimat for m2 - m1 Husk: Et 95% konfidensinterval er af typen Punktestimat ± 2 · se hvis punktestimatet er (approks.) normalfordelt.

Standardfejlen for y1-y2 Antag vi har to uafhængige stikprøver, og at se1 og se2 er standardfejlen for hhv. y1 og y2. Da er den estimerede standardfejl for y1 - y2 hvor , i = 1,2. Eksempel: Oprydning/Madlavning

Konfidensinterval for m1-m2 For uafhængige stikprøver fra to grupper der har normale populationsfordelinger er et (1-a)100% konfidensintervallet for m1-m2 givet ved hvor t har df = n1 + n2 - 2 frihedsgrader. Eksempel: Oprydning/Madlavning

Konfidensintervaller Eksempler på konfidensintervaller for m2 - m1: Indeholder ikke nul. Peger i retning af, at m2 er mindre end m1. Indeholder nul. Ingen forskel ml. m1 og m2 er plausibelt. Indeholder ikke nul. Peger i retning af, at m2 er større end m1.

Hypotesetest for m2-m1 Antagelser: Normale populationer Nul-hypotese: H0: m2-m1 = 0 (ingen forskel) Alternativ hypotese: Ha: m2-m1  0 (en forskel) Teststørrelse: hvor P-værdi Konklusion: Jo lavere P-værdi jo mindre tror vi på H0. P-værdien Ha: m2-m1  0 -t t

Rengøring/Madlavning Eksempel Antal minutter brugt på rengøring/madlavning: Hypoteser: H0: m2-m1 = 0 vs Ha: m2-m1  0 Rengøring/Madlavning Køn Stikprøvestørrelse Gennemsnit Standardafvigelse Mænd n1=1219 y1=23 s1=32 Kvinder n2=733 y2=37 s2=16

SPSS SPSS: Analyze → Compare Means → Independent-Sample T Test Test Variable(s): Afhængig variabel Grouping variabel: Forklarende variabel Define Groups: Angiv hvilke værdier af den forklarende variabel, der svarer til de to grupper. Bemærk: Køn er kodet som hhv. 0 og 1.

SPSS Output Opsummering af de to grupper Bemærk: I forhold til forrige slide er m1 og m2 byttet rundt. Derved får t modsat fortegn. P-værdien er upåvirket af ombytningen, da det er et to-sidet test. Opsummering af de to grupper Test af forskel i middelværdi: Konfidensinterval: t-teststørrelse P-værdi for to-sidet test 95% konf. interval for m1-m2.

Sammenligne m1 og m2 for afhængige stikprøver Typisk eksempel på afhængige grupper, er hvor observationer i de to grupper er parrede. Eksempel: Hver af 32 studerende får målt reaktionstider under bilkørsel under to omstændigheder: 1) Mens de snakker i mobil (gruppe1) y1,i 2) Uden de snakker i mobil (gruppe2) y2,i For hver studerende har vi en forskel i reaktionstid: yd,i = y2,i - y1,i Reaktions- tider for i’te studerende.

Sammenligne m1 og m2 for afhængige stikprøver Lad y1 og y2 være gennemsnittet for hhv. gruppe 1 og gruppe 2. Lad yd være gennemsnittet af differencerne. Der gælder Dvs. hvis vi vil teste forskelle er det nok at se på gennemsnittet af differencerne. Et (1-a)100% konfidensinterval for m2 - m1 hvor sd er standardafvigelsen for differencerne. df = n-1

Signifikanstest for m2 - m1 (parrede obs.) Antagelser: Normale populationer Nul-hypotese: H0: md = 0 (ingen forskel/effekt) Alternativ hypotese: Ha: md  0 (en forskel/effekt) Teststørrelse: hvor P-værdi: Se figur → Konklusion: Jo lavere P-værdi jo mindre tror vi på H0 P-værdien Ha: md  0 -t t

Eksempel Hypoteser H0: md = 0 vs Ha: md  0 Gennemsnitsdifferencen Uden mobil Med mobil Diff. 604 556 540 522 459 544 : 636 623 615 672 601 600 32 67 75 150 142 56 Hypoteser H0: md = 0 vs Ha: md  0 Gennemsnitsdifferencen Standardafvigelse for differencerne Teststørrelse

SPSS SPSS: Analyze → Compare Means → Paired-Samples T Test Gruppe 1

SPSS: Resultat Hypoteser H0: md = 0 vs Ha: md  0

Test direkte på differencerne Lav et t-test af differencerne Bemærk at t er præcis som før og dermed er P-værdien som før.

Sammenligning af andele Effekten af bøn på udfald af operation: Der er to variable registeret for hver person Bøn: Forklarende variabel Binær/dikotom (to mulige værdier) Udfald: Afhængig variabel Uafhængige grupper (Bøn/Ej bøn) Bøn Komplikationer Ej komplikationer Total Andel komplika. Ja 315 289 604 0.522 Nej 304 293 597 0.509

Sammenligning af andele Mål: Sammenligne pop. andelene p1 og p2 for to grupper. Ny parameter Differencen p2 - p1 er en parameter Estimat p2 – p1 er et estimat for p2 - p1. Husk: Et 95% konfidensinterval er af typen Punktestimat ± 2 · se hvis punktestimatet er (approks.) normalfordelt. ^ ^ Stikprøve-andele

Standardfejlen for p2 - p1 ^ ^ Standardfejlen for p2 - p1 er hvor . Eksempel: Bøn og operation ^ ^

Konfidensinterval for p2 - p1 For store stikprøver er et (1-a)100% konfidens-interval for forskellen p2 - p1 mellem to populationer Eksempel: Bøn og operation Et 95% konfidensinterval for forskellen i andele: Da KI’et indeholder 0, er ”ingen forskel” plausibelt.

Signifikanstest for p2 - p1 Antagelser: Store stikprøver Nul-hypotese: H0: p2-p1 = 0 (ingen effekt) Alternativ hypotese: Ha: p2-p1  0 (en effekt) Teststørrelse: hvor P-værdi Konklusion: Jo lavere P-værdi jo mindre tror vi på H0 p er den overordnede andel, når grupper ignoreres. ^

Test af forskel i andele Effekten af bøn på udfald af operation: Hypoteser: H0: p2-p1 = 0 vs Ha: p2-p1  0 Bøn Komplikationer Ej komplikationer Total Andel kompl. Ja 315 289 n1 = 604 p1= 0.522 Nej 304 293 n2 = 597 p2 = 0.509 ^ ^