Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Sammenligning af to grupper

Lignende præsentationer


Præsentationer af emnet: "Sammenligning af to grupper"— Præsentationens transcript:

1 Sammenligning af to grupper
Repetition, herunder om kritiske værdier Sammenligning af to grupper: Sammenligning af to middelværdier Sammenligning af to andele Sammenligning af to varianser

2 Hypoteser og hypotesetest.
En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable, for eksempel: ”Er middelværdien af de 3.semesters HA studerendes vægt lig med 70 kilo?” I en hypotesetest (signifikanstest) testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 68 kilo. Er det (signifikant) forskellig fra 70? Det er forskellig fra 70, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhænger af eksempelvis stikprøvestørrelsen. En hypotesetest består af 5 elementer: antagelser, hypoteser, test størrelse, p-værdi og beslutning/konklusion.

3 Test af middelværdi Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: . 8 7 6 5 4 3 2 1 0 x

4 Eksempel H0: m = 30 H1: mm 30 Stikprøve: n = 50 = 31.5 s = 5
Test størrelse: P-værdi: Lille p-værdi, så H0 forkastes. Fordeling: . 8 . 7 . 6 . 5 . 4 . 3 . 2 .017 .017 . 1 . 0=30 x- x

5 P-værdi og forkastelse af H0
Når nul hypotesen er falsk, er p-værdien meget lille og når nul hypotesen er sand, vil p-værdien være stor (større end for eksempel 0.05). Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand.

6 Signifikans niveau Signifikans niveauet a er et tal, således at H0 forkastes, hvis p-værdien er mindre end a. Er normalvis 0.05 eller 0.01. Vælges før analysen foretages. Hvis man tester på signifikans niveau 0.05, svarer det til en z-værdi på 1.96 i en to-sidet test og i en højresidet test. Normal ses dog på p-værdien i stedet, da de i de fleste tilfælde ikke er smart at have en standard procedure for om man forkaster eller ej. Konklusion P-værdi H0 H1 P<0.05 Forkast Accepter P>0.05 Forkast ikke Accepter ikke

7 Kritiske værdier, to-sidet test, α=0.05
Eksemplet er for standard normal fordelingen. Tilsvarende kritiske værdier kan findes andre fordelinger, for eksempel t-fordelingen.

8 Eksempel H0: m = 30 H1: mm 30 Stikprøve: n = 50 = 31.5 s = 5
Test størrelse: Kritiske værdi: Da 2,12 > 1,96 forkastes H0 (eller hvis den var mindre end -1,96) Hvis højresidet test, dvs H1:μ>30: Da 2,12 > forkastes H0 Hvis venstresidet test, dvs. H1:μ<30: Da 2,12 ikke er mindre end -1,645, forkastes H0 ikke

9

10 Sammenligning af to grupper
Tjener mænd og kvinder lige meget? (Respons: Løn, Forklarende: Køn) Er andelen af helbredte kræftpatienter den samme for to forskellige typer kemoterapi? (Respons: helbredte patienter, Forklarende: Kemotype) Er andelen af overvægtige i 2006 den samme som andelen af overvægtige i 1999? (Forklarende: årstal, Respons: overvægtige) Kører en VW Touran og en Skoda det samme antal kilometer per liter? (Forklarende: Bilmærke, Respons: antal kilometer per l) Kører en VW Touran det samme antal kilometer per liter på almindelig benzin, som på bio benzin? (Forklarende: Benzin type, Respons: antal kilometer) Er der forskel på hvor mange mænd og kvinder, der benytter et værested for misbrugere? Er der forskel på hvor hurtigt man løber 5 km, når man har originale Nike sko og Super Nike sko på?

11 Afhængige og uafhængige stikprøver
Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe. Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper. Kilometer per liter: Tilfældig stikprøve af Touran’er og tilfældig stikprøve af Skoda’er. Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer. Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touran’er og test dem med de to forskellige typer benzin. Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.

12 Forklarende variabel og respons variabel.
To grupper, der sammenlignes, udgør en bivariat variabel – dvs. en variabel, der kun har to kategorier, for eksempel mænd og kvinder. Denne variabel kaldes den forklarende variabel (eller den uafhængige variabel). Den variabel, der sammenlignes, kaldes respons variablen (eller den afhængige variabel), for eksempel løn. Når respons variablen er kvantitativ, sammenlignes middelværdier. Når respons variablen er kvalitativ, sammenlignes andele. Summeopgave: Se på eksemplerne – identificer respons og forklarende variabel og se på om responsen er kvalitativ eller kvantitativ.

13 Resten af forelæsningen
Sammenligning af to middelværdier – kendt varians Hypotesetest Konfidens interval Sammenligning af to middelværdier – ukendt varians Sammenligning af to andele Sammenligning af to middelværdier – parrede observationer Sammenligning af to varianser Hypotese test

14 Sammenligning af to middelværdier – kendte varianser og store stikprøver eller populationer normalfordelte Population 1 Population 2

15 Sammenligning af to middelværdier – kendte varianser og store stikprøver eller populationer normalfordelte

16 Konfidens interval

17 Eksempel – er der forskel på hvor langt bilerne kører på 25 l. benzin?

18 SPSS

19 SPSS

20 SPSS

21 Ukendt varians, normalfordeling
Hvis store stikprøver, bruges z i stedet for t-fordelingen. Bogen bruger z, når n1 og n2 er større end 30. SPSS regner altid med t-fordelingen

22 Eksempel

23 Konfidens intervaller

24 Sammenligning af to andele, p1=p2, store stikprøver

25 Eksempel - Titanic Er andelen af mænd, der overlevede, den samme som andelen af kvinder, der overlevede?

26 Eksempel - Titanic H0 forkaste, da p-værdi=0

27 Sammenligning af to andele, p1-p2=D, store stikprøver

28 Konfidens interval for differencen mellem to andele

29 Parrede observationer
Lav differencer: Nike Super 20 17 18 15 16 Nike Original 21 19 Super-Original -1 -2 -5 1 Beregn selv eksemplet til opgaveregningen!

30 F fordelingen og test for lighed af to populations varianser
F fordelingen er fordelingen af brøken af to chi-i-anden stokastiske variable, der er uafhængige og hver er divideret med antallet af dens frihedsgrader. En F fordelt stokastisk variable med k1 og k2 frihedsgrader:

31 F tabellen Critical Points of the F Distribution Cutting Off a Right-Tail Area of 0.05 k k2 F D i s t r i b u t i o n w i t h 7 a n d 1 1 D e g r e e s o f F r e e d o m . 7 . 6 . 5 ) F . 4 ( f . 3 . 2 . 1 . F 1 2 3 4 5 3.01 F0.05=3.01 Det venstresidet kritiske punkt, der hører til F(k1,k2) er givet ved: hvor F(k2,k1) er det højresidet kritiske punkt for en F fordelt stokastisk variabel, men det omvendte antal frihedsgrader.

32 Kritiske punkter i F fordelingen F(6, 9),  = 0.10
5 4 3 2 1 . 7 6 F f ( ) D i s t r b u o n w h a d 9 e g m F0.05=3.37 F0.95=(1/4.10)=0.2439 0.05 0.90 Det højresidet kritiske punkt: F(6,9) =3.37 Det tilsvarende venstresidet punkt:

33 Test for ens varians 1 = 2 I: Tosidet test: H0: 1 = 2 H1: 2
II:Ensidet test 12 H0: 1  2 H1: 1  2

34 Eksempel 8-10


Download ppt "Sammenligning af to grupper"

Lignende præsentationer


Annoncer fra Google