Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Statistik Lektion 8 Parrede test Test for forskel i andele

Lignende præsentationer


Præsentationer af emnet: "Statistik Lektion 8 Parrede test Test for forskel i andele"— Præsentationens transcript:

1 Statistik Lektion 8 Parrede test Test for forskel i andele
Test for ens varians Gensyn med flyskræk!

2 Afhængige og uafhængige stikprøver
Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe. Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper. Kilometer per liter: Tilfældig stikprøve af Touran’er og tilfældig stikprøve af Skoda’er. Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer. Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touran’er og test dem med de to forskellige typer benzin. Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.

3 Forrige forlæsning Denne forlæsning
Sammenligning af to middelværdier – kendt varians norm. pop. eller stort n Hypotesetest + Konfidensinterval Sammenligning af to middelværdier – ukendt varians normal population Sammenligning af to andele Parrede observationer Test for ens varians i to populationer Denne forlæsning

4 Parrede observationer
For den i’te person har vi to observationer Xi,1 og Xi,2, fx. blodtryk før og efter behandling. For den i’te person definerer vi differencen Di = Xi,1-Xi,2. Forskelle mellem ”før” og ”efter” kan nu undersøges vha. hypotesetest af middeldifferencen, mD. Typisk antagelse er, at differencerne er normalfordelte, Di ~ N(mD, sD2). Estimaterne for hhv. middelværdi og varians betegnes og

5 Parrede observationer
Udregn differencer: Nike Super 20 17 18 15 16 Nike Original 21 19 Super-Original -1 -2 -5 1

6 Samme Historie I R Commander
Statistics → Means → Paired t-test… p-værdi = > 0.05, dvs. vi kan ikke afvise H0. Dvs. vi kan ikke afvise at de to sko-typer er lige gode. Bemærk: 95% konfidensinterval for forskellen i middelværdi indeholder 0!

7 Sammenligning af to andele, p1 = p2, store stikprøver
H0: p1 – p2 = 0 ( dvs. H0 : p1 = p2 ) H1: p1 – p2 ≠ 0 ( dvs. H0 : p1 ≠ p2 ) Teststørrelse Hvis H0 er sand, så gælder Z ~ N(0,1). Forkast H0, når p-værdien er lille, eller sammenlign med de kritiskeværdier.

8 Eksempel - Titanic Er andelen af mænd, der overlevede, pm, den samme som andelen af kvinder, der overlevede, pk?

9 Eksempel - Titanic H0: pk = pm H1: pk ≠ pm
H0 forkastes da p-værdien = P(|Z|>18.23) ≈ 0.

10 Sammenligning af to andele, p1 - p2=D, store stikprøver

11 Konfidens interval for differencen, p1 – p2, mellem to andele

12 Eksempel - Titanic Find et 95% konfidensinterval for forskellen i andelen af overlevende blandt mænd og kvinder: Da konfidensintervallet ikke indeholder nul, kan vi afvise H0: m1 = m2 på signifikansniveau a = 0.05.

13 F fordelingen og test for lighed af to populationsvarianser
F fordelingen er fordelingen af brøken af to chi-i-anden stokastiske variable, der er uafhængige og hver er divideret med antallet af dens frihedsgrader. En F fordelt stokastisk variable med k1 og k2 frihedsgrader:

14 F-tabellen Critical Points of the F Distribution Cutting Off a Right-Tail Area of 0.05 k k2 F-fordelingen med 7 og 11 frihedsgrader . 7 . 6 0.05 . 5 F ) . 4 f ( . 3 0.05 . 2 . 1 . F 1 2 3 4 5 3.01 1/F(11,7) = 0.278 F(7,11) = 3.01 Det venstresidet kritiske punkt, der hører til F(k1,k2) er givet ved: hvor F(k2,k1) er det højresidet kritiske punkt for en F fordelt stokastisk variabel, men det omvendte antal frihedsgrader.

15 Kritiske punkter i F fordelingen F(6, 9),  = 0.10
Det højresidet kritiske punkt: F(6,9) = 3.37 Det tilsvarende venstresidet punkt: F-fordeling med 6 og 9 frihedsgrader . 7 0.05 . 6 0.90 . 5 ) F . 4 ( f . 3 0.05 . 2 . 1 . 1 2 3 4 5 F F0.95=(1/4.10)=0.2439 F0.05=3.37

16 Test for ens varians 1 = 2
Teststørrelsen til test for ens populations varians i to normalfordelte populationer er givet ved: I: Tosidet test: 1 = 2 H0: 1 = 2 H1: 2 II:Ensidet test 12 H0: 1  2 H1: 1  2

17 Eksempel

18 Vigtigste fordelinger i kurset
Binomial B(n,p) Normal N(m,s2) c2 c2(n) t t(n) F F(k1,k2)

19 Flyskræk! Passer overskriften? Er du tryg ved at flyve?
Politiken 6/12-’07 Er du tryg ved at flyve? Ja: 86% i % i 2007 Er der sket en statistisk signifikant ændring? Sum selv svaret ;-)

20 Sidste Summeopgave Antag at der er blevet udspurgt 1001 personer i både 2005 og 2007. Test på signifikansniveau a=0.05 om der er en forskel i andelen af folk, der er trygge ved at flyve. Bestem p-værdien. Hvad synes I om overskriften?

21 Til efteråret: Økonometri
Økonometri: Statistik anvendt på økonomiske problemstillinger Indhold: Lineær regression - Middelværdien er forklaret ved en eller flere kontinuerte forklarende variable Form: 7 forelæsninger efterfulgt af projekt.


Download ppt "Statistik Lektion 8 Parrede test Test for forskel i andele"

Lignende præsentationer


Annoncer fra Google