Test i to populationer Hypotesetest for parrede observationer

Slides:



Advertisements
Lignende præsentationer
Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Advertisements

Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Hypotese test – kapitel 6 (Signifikans test)
Anvendt Statistik Lektion 3
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Statistik Lektion 20 Ikke-parametriske metoder
Anvendt Statistik Lektion 4
Akademi Merkonomer Statistik Aften 5
Statistik og sandsynlighedsregning
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Statistik Lektion 8 Parrede test Test for forskel i andele
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 9
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Learning Objectives 5 Steps of a Significance Test Assumptions
Dagens program Test of Independence (chi-i-anden) Videre med projekt 3
Statistik II 5. Lektion Log-lineære modeller.
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 7
Grundlæggende teoretisk statistik
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 8 Parrede test Test for forskel i andele
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Repetition Fortolkning af odds Test i logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Bernoulli og binomial fordelingerne
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 14 Simpel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Statistik Lektion 8 Test for ens varians.
Grundlæggende teoretisk statistik
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Statistik II 4. Lektion Logistisk regression.
Inge Henningsen Stat BK uge Konfidensinterval og hypotesetest for to normalfordelte stikprøver.
Økonometri – lektion 6 Multipel Lineær Regression
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 4
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 3
Præsentationens transcript:

Test i to populationer Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Afhængige og uafhængige stikprøver Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe. Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper. Kilometer per liter: Tilfældig stikprøve af Touran’er og tilfældig stikprøve af Skoda’er. Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer. Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touran’er og test dem med de to forskellige typer benzin. Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.

Forrige forlæsning Denne forlæsning Sammenligning af to middelværdier – kendt varians norm. pop. eller stort n Hypotesetest + Konfidensinterval Sammenligning af to middelværdier – ukendt varians normal population Sammenligning af to andele Parrede observationer Test for ens varians i to populationer Denne forlæsning

Sammenligning af to andele, p1 = p2, store stikprøver H0: p1 – p2 = 0 ( dvs. H0 : p1 = p2 ) H1: p1 – p2 ≠ 0 ( dvs. H0 : p1 ≠ p2 ) Teststørrelse Hvis H0 er sand, så gælder Z ~ N(0,1). Forkast H0, når p-værdien er lille, eller sammenlign med de kritiskeværdier.

Eksempel - Titanic Er andelen af mænd, der overlevede, pm, den samme som andelen af kvinder, der overlevede, pk?

Eksempel - Titanic H0: pk = pm H1: pk ≠ pm H0 forkastes da p-værdien = P(|Z|>18.23) ≈ 0.

Sammenligning af to andele, p1 - p2=D, store stikprøver

Konfidens interval for differencen, p1 – p2, mellem to andele

Eksempel - Titanic Find et 95% konfidensinterval for forskellen i andelen af overlevende blandt mænd og kvinder: Da konfidensintervallet ikke indeholder nul, kan vi afvise H0: m1 = m2 på signifikansniveau a = 0.05.

Parrede observationer For den i’te person har vi to observationer Xi,1 og Xi,2, fx. blodtryk før og efter behandling. For den i’te person definerer vi differencen Di = Xi,1-Xi,2. Forskelle mellem ”før” og ”efter” kan nu undersøges vha. hypotesetest af middeldifferencen, mD. Typisk antagelse er, at differencerne er normalfordelte, Di ~ N(mD, sD2). Estimaterne for hhv. middelværdi og varians betegnes og .

Parrede observationer Udregn differencer: Nike Super 20 17 18 15 16 Nike Original 21 19 Super-Original -1 -2 -5 1

F fordelingen og test for lighed af to populationsvarianser F fordelingen er fordelingen af brøken af to chi-i-anden stokastiske variable, der er uafhængige og hver er divideret med antallet af dens frihedsgrader. En F fordelt stokastisk variable med k1 og k2 frihedsgrader:

F-tabellen Critical Points of the F Distribution Cutting Off a Right-Tail Area of 0.05 k1 1 2 3 4 5 6 7 8 9 k2 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 F-fordelingen med 7 og 11 frihedsgrader . 7 . 6 0.05 . 5 F ) . 4 f ( . 3 0.05 . 2 . 1 . F 1 2 3 4 5 3.01 1/F(11,7) = 0.278 F(7,11) = 3.01 Det venstresidet kritiske punkt, der hører til F(k1,k2) er givet ved: hvor F(k2,k1) er det højresidet kritiske punkt for en F fordelt stokastisk variabel, men det omvendte antal frihedsgrader.

Kritiske punkter i F fordelingen F(6, 9),  = 0.10 Det højresidet kritiske punkt: F(6,9) = 3.37 Det tilsvarende venstresidet punkt: F-fordeling med 6 og 9 frihedsgrader . 7 0.05 . 6 0.90 . 5 ) F . 4 ( f . 3 0.05 . 2 . 1 . 1 2 3 4 5 F F0.95=(1/4.10)=0.2439 F0.05=3.37

Test for ens varians 1 = 2 Teststørrelsen til test for ens populations varians i to normalfordelte populationer er givet ved: I: Tosidet test: 1 = 2 H0: 1 = 2 H1: 2 II:Ensidet test 12 H0: 1  2 H1: 1  2

Eksempel 8-10

Vigtigste fordelinger i kurset Binomial B(n,p) Normal N(m,s2) c2 c2(n) t t(n) F F(k1,k2)

Flyskræk! Passer overskriften? Er du tryg ved at flyve? Politiken 6/12-’07 Er du tryg ved at flyve? Ja: 86% i 2005 83% i 2007 Er der sket en statistisk signifikant ændring? Sum selv svaret ;-)

Sidste Summeopgave Antag at der er blevet udspurgt 1001 personer i både 2005 og 2007. Test på signifikansniveau a=0.05 om der er en forskel i andelen af folk, der er trygge ved at flyve. Bestem p-værdien. Hvad synes I om overskriften?

Til efteråret Variansanalyse Lineær regression Sammenligne middelværdier i mere end to populationer Bruge mere end en forklarende variabel Lineær regression Middelværdien er forklaret ved en eller flere kontinuerte forklarende variable Undersøge sammenhænge i kontingenstabeller større end 2x2.