Download præsentationen
Offentliggjort afJacob Nissen Redigeret for ca. et år siden
1
Statistik Lektion 8 Parrede test Test for forskel i andele
Test for ens varians Gensyn med flyskræk!
2
Afhængige og uafhængige stikprøver
Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe. Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper. Kilometer per liter: Tilfældig stikprøve af Fiat’er og tilfældig stikprøve af Lancia’er. Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer. Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touran’er og test dem med de to forskellige typer benzin. Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.
3
Forrige forlæsning Denne forlæsning
Sammenligning af to middelværdier – kendt varians norm. pop. eller stort n Hypotesetest + Konfidensinterval Sammenligning af to middelværdier – ukendt varians normal population Parrede observationer Sammenligning af to andele Test for ens varians i to populationer Denne forlæsning
4
Parrede observationer
For den i’te person har vi to observationer Xi,1 og Xi,2, fx. blodtryk før og efter behandling. For den i’te person definerer vi differencen Di = Xi,1-Xi,2. Forskelle mellem ”før” og ”efter” kan nu undersøges vha. hypotesetest af middeldifferencen, mD. Typisk antagelse er, at differencerne er normalfordelte, Di ~ N(mD, sD2). Estimaterne for hhv. middelværdi og varians betegnes og
5
Parrede observationer
Udregn differencer: Nike Super 20 17 18 15 16 Nike Original 21 19 Super-Original -1 -2 -5 1
6
Samme Historie I R Commander
Statistics → Means → Paired t-test… p-værdi = > 0.05, dvs. vi kan ikke afvise H0. Dvs. vi kan ikke afvise at de to sko-typer er lige gode. Bemærk: 95% konfidensinterval for forskellen i middelværdi indeholder 0!
7
Bemærkninger til parret t-test
Selvom vi har to sæt af observationer, så koger det ned til et sæt af differencer. Vi tester derfor kun én middelværdi, og kan derfor ”genbruge” t-testet fra sidst. Ved at have parrede observationer, forsvinder variationen i observationerne, der skyldes variationen i ”deltagerne”. Dette gælder kun hvis differencerne er uafhængige af før-målingerne.
8
Sammenligning af to andele, p1 = p2, store stikprøver
H0: p1 – p2 = 0 ( dvs. H0 : p1 = p2 ) H1: p1 – p2 ≠ 0 ( dvs. H0 : p1 ≠ p2 ) Teststørrelse Hvis H0 er sand, så gælder Z ~ N(0,1). Forkast H0, når p-værdien er lille, eller sammenlign med de kritiskeværdier.
9
Eksempel - Titanic Er andelen af mænd, der overlevede, pm, den samme som andelen af kvinder, der overlevede, pk?
10
Eksempel - Titanic H0: pk = pm H1: pk ≠ pm
H0 forkastes da p-værdien = 2·P(|Z|>18.23) ≈ 0.
11
Sammenligning af to andele, p1 - p2=D, store stikprøver
12
Konfidens interval for differencen, p1 – p2, mellem to andele
13
Eksempel - Titanic Find et 95% konfidensinterval for forskellen i andelen af overlevende blandt mænd og kvinder: Da konfidensintervallet ikke indeholder nul, kan vi afvise H0: m1 = m2 på signifikansniveau a = 0.05.
14
F fordelingen og test for lighed af to populationsvarianser
F fordelingen er fordelingen af brøken af to chi-i-anden stokastiske variable, der er uafhængige og hver er divideret med antallet af dens frihedsgrader. En F fordelt stokastisk variable med k1 og k2 frihedsgrader:
15
F-tabellen – tabel 9, side 867
Critical Points of the F Distribution Cutting Off a Right-Tail Area of 0.05 k k2 F-fordelingen med 7 og 12 frihedsgrader . 7 . 6 0.05 . 5 F ) . 4 f ( . 3 0.05 . 2 . 1 . F 1 2 3 4 5 3.01 1/F12,7,0.05 = 0.278 F7,12,0.05 = 3.01 Når man skal finde det venstre kritiske punkt, kan man bruge følgende sammenhæng:
16
Kritiske punkter i F fordelingen F(6, 9), = 0.10
Det højresidet kritiske punkt: F6,9,0.05 = 3.37 Det tilsvarende venstresidet punkt: F-fordeling med 6 og 9 frihedsgrader . 7 0.05 . 6 0.90 . 5 ) F . 4 ( f . 3 0.05 . 2 . 1 . 1 2 3 4 5 F F6,9,0.95 = 1/F9,6,0.05 = F6,9,0.05 = 3.37
17
Test for ens varians 1 = 2
Teststørrelsen til test for ens populations varians i to normalfordelte populationer er givet ved: I: Tosidet test: 1 = 2 H0: 1 = 2 H1: 2 II:Ensidet test 12 H0: 1 2 H1: 1 2
18
Eksempel
19
Eksempel Population 1 Population 2 Signifikansniveau: a = 0.10
Kritiske værdier: Hypoteser: Teststørrelse: H0 kan ikke afvises på signifikans-niveau 10%, da teststørrelsen ikke er større end 3.28 eller mindre end 0.35.
20
Vigtigste fordelinger i kurset
Binomial B(n,p) Normal N(m,s2) c2 c2(n) t t(n) F F(k1,k2)
21
Flyskræk! Passer overskriften? Er du tryg ved at flyve?
Politiken 6/12-’07 Er du tryg ved at flyve? Ja: 86% i % i 2007 Er der sket en statistisk signifikant ændring? Sum selv svaret ;-)
22
Sidste Summeopgave Antag at der er blevet udspurgt 1001 personer i både 2005 og 2007. Test på signifikansniveau a=0.05 om der er en forskel i andelen af folk, der er trygge ved at flyve. Bestem p-værdien. Hvad synes I om overskriften?
23
Til efteråret: Økonometri
Økonometri: Statistik anvendt på økonomiske problemstillinger Indhold: Lineær regression - Middelværdien er forklaret ved en eller flere kontinuerte forklarende variable Form: 7 forelæsninger efterfulgt af projekt.
Lignende præsentationer
© 2024 SlidePlayer.dk Inc.
All rights reserved.