Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Statistik Lektion 8 Parrede test Test for forskel i andele

Lignende præsentationer


Præsentationer af emnet: "Statistik Lektion 8 Parrede test Test for forskel i andele"— Præsentationens transcript:

1 Statistik Lektion 8 Parrede test Test for forskel i andele
Test for ens varians Gensyn med flyskræk!

2 Afhængige og uafhængige stikprøver
Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe. Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper. Kilometer per liter: Tilfældig stikprøve af Fiat’er og tilfældig stikprøve af Lancia’er. Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer. Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touran’er og test dem med de to forskellige typer benzin. Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.

3 Forrige forlæsning Denne forlæsning
Sammenligning af to middelværdier – kendt varians norm. pop. eller stort n Hypotesetest + Konfidensinterval Sammenligning af to middelværdier – ukendt varians normal population Parrede observationer Sammenligning af to andele Test for ens varians i to populationer Denne forlæsning

4 Parrede observationer
For den i’te person har vi to observationer Xi,1 og Xi,2, fx. blodtryk før og efter behandling. For den i’te person definerer vi differencen Di = Xi,1-Xi,2. Forskelle mellem ”før” og ”efter” kan nu undersøges vha. hypotesetest af middeldifferencen, mD. Typisk antagelse er, at differencerne er normalfordelte, Di ~ N(mD, sD2). Estimaterne for hhv. middelværdi og varians betegnes og

5 Parrede observationer
Udregn differencer: Nike Super 20 17 18 15 16 Nike Original 21 19 Super-Original -1 -2 -5 1

6 Samme Historie I R Commander
Statistics → Means → Paired t-test… p-værdi = > 0.05, dvs. vi kan ikke afvise H0. Dvs. vi kan ikke afvise at de to sko-typer er lige gode. Bemærk: 95% konfidensinterval for forskellen i middelværdi indeholder 0!

7 Bemærkninger til parret t-test
Selvom vi har to sæt af observationer, så koger det ned til et sæt af differencer. Vi tester derfor kun én middelværdi, og kan derfor ”genbruge” t-testet fra sidst. Ved at have parrede observationer, forsvinder variationen i observationerne, der skyldes variationen i ”deltagerne”. Dette gælder kun hvis differencerne er uafhængige af før-målingerne.

8 Sammenligning af to andele, p1 = p2, store stikprøver
H0: p1 – p2 = 0 ( dvs. H0 : p1 = p2 ) H1: p1 – p2 ≠ 0 ( dvs. H0 : p1 ≠ p2 ) Teststørrelse Hvis H0 er sand, så gælder Z ~ N(0,1). Forkast H0, når p-værdien er lille, eller sammenlign med de kritiskeværdier.

9 Eksempel - Titanic Er andelen af mænd, der overlevede, pm, den samme som andelen af kvinder, der overlevede, pk?

10 Eksempel - Titanic H0: pk = pm H1: pk ≠ pm
H0 forkastes da p-værdien = 2·P(|Z|>18.23) ≈ 0.

11 Sammenligning af to andele, p1 - p2=D, store stikprøver

12 Konfidens interval for differencen, p1 – p2, mellem to andele

13 Eksempel - Titanic Find et 95% konfidensinterval for forskellen i andelen af overlevende blandt mænd og kvinder: Da konfidensintervallet ikke indeholder nul, kan vi afvise H0: m1 = m2 på signifikansniveau a = 0.05.

14 F fordelingen og test for lighed af to populationsvarianser
F fordelingen er fordelingen af brøken af to chi-i-anden stokastiske variable, der er uafhængige og hver er divideret med antallet af dens frihedsgrader. En F fordelt stokastisk variable med k1 og k2 frihedsgrader:

15 F-tabellen – tabel 9, side 867
Critical Points of the F Distribution Cutting Off a Right-Tail Area of 0.05 k k2 F-fordelingen med 7 og 12 frihedsgrader . 7 . 6 0.05 . 5 F ) . 4 f ( . 3 0.05 . 2 . 1 . F 1 2 3 4 5 3.01 1/F12,7,0.05 = 0.278 F7,12,0.05 = 3.01 Når man skal finde det venstre kritiske punkt, kan man bruge følgende sammenhæng:

16 Kritiske punkter i F fordelingen F(6, 9),  = 0.10
Det højresidet kritiske punkt: F6,9,0.05 = 3.37 Det tilsvarende venstresidet punkt: F-fordeling med 6 og 9 frihedsgrader . 7 0.05 . 6 0.90 . 5 ) F . 4 ( f . 3 0.05 . 2 . 1 . 1 2 3 4 5 F F6,9,0.95 = 1/F9,6,0.05 = F6,9,0.05 = 3.37

17 Test for ens varians 1 = 2
Teststørrelsen til test for ens populations varians i to normalfordelte populationer er givet ved: I: Tosidet test: 1 = 2 H0: 1 = 2 H1: 2 II:Ensidet test 12 H0: 1  2 H1: 1  2

18 Eksempel

19 Eksempel Population 1 Population 2 Signifikansniveau: a = 0.10
Kritiske værdier: Hypoteser: Teststørrelse: H0 kan ikke afvises på signifikans-niveau 10%, da teststørrelsen ikke er større end 3.28 eller mindre end 0.35.

20 Vigtigste fordelinger i kurset
Binomial B(n,p) Normal N(m,s2) c2 c2(n) t t(n) F F(k1,k2)

21 Flyskræk! Passer overskriften? Er du tryg ved at flyve?
Politiken 6/12-’07 Er du tryg ved at flyve? Ja: 86% i % i 2007 Er der sket en statistisk signifikant ændring? Sum selv svaret ;-)

22 Sidste Summeopgave Antag at der er blevet udspurgt 1001 personer i både 2005 og 2007. Test på signifikansniveau a=0.05 om der er en forskel i andelen af folk, der er trygge ved at flyve. Bestem p-værdien. Hvad synes I om overskriften?

23 Til efteråret: Økonometri
Økonometri: Statistik anvendt på økonomiske problemstillinger Indhold: Lineær regression - Middelværdien er forklaret ved en eller flere kontinuerte forklarende variable Form: 7 forelæsninger efterfulgt af projekt.


Download ppt "Statistik Lektion 8 Parrede test Test for forskel i andele"

Lignende præsentationer


Annoncer fra Google