Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Sammenligning af to grupper – kapitel 7

Lignende præsentationer


Præsentationer af emnet: "Sammenligning af to grupper – kapitel 7"— Præsentationens transcript:

1 Sammenligning af to grupper – kapitel 7
Slides:

2 Hypoteser og hypotesetest.
En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable, for eksempel: ”Er middelværdien af de 5.semesters studerendes vægt lig med 70 kilo?” I en hypotesetest (signifikanstest) testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 68 kilo. Er det (signifikant) forskellig fra 70? Det er forskellig fra 70, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhænger af eksempelvis stikprøvestørrelsen. En hypotesetest består af 5 elementer: antagelser, hypoteser, test størrelse, p-værdi og beslutning/konklusion.

3 Test af middelværdi Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: . 8 7 6 5 4 3 2 1 0 x

4 P-værdi og forkastelse af H0
Når nul hypotesen er falsk, er p-værdien meget lille og når nul hypotesen er sand, vil p-værdien være stor (større end for eksempel 0.05). Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand.

5 Beregning af p-værdi Når H0 er sand, er fordelingen af Z approksimativt standard normal fordelt (dvs. normal fordelt med middelværdi 0 og standard afvigelse 1). P-værdien er sandsynligheden for at observere en test størrelse mindst så ekstrem som den observerede, givet at H0 er sand. I formler: p( |Z| > beregnet z værdi) . I praksis: I tabellen for standard normalfordelingen aflæses sandsynligheden ud fra værdien af z-værdien og ganges med 2, da det ”er i begge sider af fordelingen”. Dvs. skal ganges med 2, da vi både ser på værdier der er mindre end og større end middelværdien opgivet i H0. Meget nemmere at se ved hjælp af et eksempel:

6 Eksempel H0: m = 30 Ha: mm 30 Stikprøve: n = 50 = 31.5 s = 5
Test størrelse: P-værdi: Fordeling: . 8 . 7 . 6 . 5 . 4 . 3 . 2 .017 .017 . 1 . 0=30 x- x

7 Signifikans niveau Signifikans niveauet a er et tal, således at H0 forkastes, hvis p-værdien er mindre end a. Er normalvis 0.05 eller 0.01. Vælges før analysen foretages. Hvis man tester på signifikans niveau 0.05, svarer det til en z-værdi på 1.96 i en to-sidet test og i en højresidet test. Normal ses dog på p-værdien i stedet, da de i de fleste tilfælde ikke er smart at have en standard procedure for om man forkaster eller ej. Konklusion P-værdi H0 H1 P<0.05 Forkast Accepter P>0.05 Forkast ikke Accepter ikke

8 Kritiske værdier, to-sidet test, α=0.05
Eksemplet er for standard normal fordelingen. Tilsvarende kritiske værdier kan findes andre fordelinger, for eksempel t-fordelingen.

9 SPSS

10 Sammenligning af to grupper
Tjener mænd og kvinder lige meget? (Respons:Løn, Forklarende:Køn) Er andelen af helbredte kræftpatienter den samme for to forskellige typer kemoterapi? (Respons: helbredte patienter, Forklarende:Kemotype) Er andelen af overvægtige i 2006 den samme som andelen af overvægtige i 1999? (Forklarende: årstal, Respons: overvægtige) Kører en VW Touran og en Skoda det samme antal kilometer per liter? (Forklarende: Bilmærke, Respons: antal kilometer per l) Kører en VW Touran det samme antal kilometer per liter på almindelig benzin, som på bio benzin? (Forklarende: Benzin type, Respons: antal kilometer) Er der forskel på hvor mange mænd og kvinder, der benytter et værested for misbrugere? Er der forskel på hvor hurtigt man løber 5 km, når man har originale Nike sko og Super Nike sko på?

11 Afhængige og uafhængige stikprøver
Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe. Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper. Kilometer per liter: Tilfældig stikprøve af Touraner og tilfældig stikprøve af Skodaer. Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer. Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touraner og test dem med de to forskellige typer benzin. Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.

12 Forklarende variabel og respons variabel.
To grupper, der sammenlignes, udgør en bivariat variabel – dvs. en variabel, der kun har to kategorier, for eksempel mænd og kvinder. Denne variabel kaldes den forklarende variabel (eller den uafhængige variabel). Den variabel, der sammenlignes, kaldes respons variablen (eller den afhængige variabel), for eksempel løn. Når respons variablen er kvantitativ, sammenlignes middelværdier. Når respons variablen er kvalitativ, sammenlignes andele. Summeopgave: Se på eksemplerne – identificer respons og forklarende variabel og se på om responsen er kvalitativ eller kvantitativ.

13 Resten af forelæsningen
Sammenligning af to middelværdier – store stikprøver Hypotesetest Konfidens interval Sammenligning af to andele Sammenligning af to middelværdier – små stikprøver Sammenligning af to middelværdier – parrede observationer

14 Sammenligning af to middelværdier – store stikprøver
Population 1 Population 2

15 Sammenligning af to middelværdier – store stikprøver

16 Konfidens intervaller

17 Eksempel – er der forskel på hvor langt bilerne kører på 25 l. benzin?

18 SPSS

19 SPSS

20 SPSS Gennemsnit S S/√n Test størrelsen. SPSS bruger altid t-fordelingen og ikke z, da det er det mest korrekte. P-værdien Konfidensinterval

21 Sammenligning af to andele

22 Eksempel - Titanic Er andelen af mænd, der overlevede, den samme som andelen af kvinder, der overlevede?

23 Eksempel - Titanic

24 Konfidens interval for differencen mellem to andele

25 Små stikprøver SPSS som før!

26 Eksempel

27 Konfidensintervaller

28 Parrede observationer
Nike Super 20 17 18 15 16 Nike Original 21 19 Lav differencer: Super-Original -1 -2 -5 1

29 SPSS

30 Eksempel Nike-sko Gennemsnit af differencer Teststørrelse P-værdi


Download ppt "Sammenligning af to grupper – kapitel 7"

Lignende præsentationer


Annoncer fra Google