Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Hypotese test – kapitel 6 (Signifikans test)

Lignende præsentationer


Præsentationer af emnet: "Hypotese test – kapitel 6 (Signifikans test)"— Præsentationens transcript:

1 Hypotese test – kapitel 6 (Signifikans test)
Repetition Hypotese test Hypoteser Test størrelser P-værdi Konklusion Signifikans niveau Type 1 og type 2 fejl

2 Normalfordelingen En normalfordeling er klokkeformet og symmetrisk.
Den er karakteriseret ved en middelværdi  og en standard afvigelse . Arealet under kurven indenfor z af middelværdien, er den samme for enhver normalfordeling, uanset middelværdi og varians. Normal fordelingen er en vigtig fordeling, blandt andet fordi mange andre fordelingen, kan approksimeres til den. Desuden er mange test størrelser normalfordelte – kommer senere i kurset

3 Standard normalfordelingen
Standard normalfordelingen, er normalfordelingen med middelværdi 0 og standard afvigelse 1. Hvis X er normalfordelt med middelværdi μ og standard afvigelse σ, så er Z= (x – μ) /σ, standard normalfordelt. Dvs. vi kan lave enhver normalfordelt stokastisk variabel X om til en standard normalfordelt Z. 5 4 3 2 1 - . Z f ( z ) Standard Normal Fordeling  = 0 =1 {

4 Konfidens interval for μ

5 Eksempel Dvs. med 95% sikkerhed ligger den sande middelværdi af fødselsår i intervallet fra 1952,20 til 1954,35. Gennemsnittet er lig 1953,28.

6 Populations og stikprøve andele
Populations andelen er lig med antallet af elementer i populationen der tilhører den kategori, man er interesseret i, divideret med det totale antal elementer i populationen: Stikprøve andelen er antallet af elementer i stikprøven, der tilhører den kategori, man er interesseret i, divideret med det totale antal elementer i stikprøven:

7 Estimation af en andel Punkt estimat af en population andel, er stikprøve andelen . Standard fejlen for populations andelen er givet som: Er typisk ukendt, så derfor bruges Populations andelen er en slags stikprøve middelværdi (for eksempel hvis data består af 0 og 1) og kan derfor for store n antages at være normalfordelt. Et konfidens interval for populations andelen er derfor givet som:

8 Værdi-undersøgelsen - køn

9 Køn – stikprøve andel og konfidens interval
Standard fejlen Konfidens interval Dvs. med 95% sikkerhed ligger den sande andel af kvinder (da kvinde=1 og mand=0) i intervallet fra 0,4766 til 0,5380. Gennemsnittet er lig 0,5073.

10 Hypoteser og hypotesetest.
En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable, for eksempel: ”Er middelværdien af de 5.semesters studerendes vægt lig med 70 kilo?” Eller er middel lønnen for nyuddannede sociologer om måneden? I en hypotesetest (signifikanstest) testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra en stikprøve. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 68 kilo. Er det (signifikant) forskellig fra 70? Det er forskellig fra 70, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation (afhænger af eksempelvis stikprøvestørrelsen). Eller er et gennemsnit på kroner signifikant forskelligt fra ? En hypotesetest består af 5 elementer: antagelser, hypoteser, test størrelse, p-værdi og beslutning/konklusion.

11 Antagelser Type af data: Se på om det er diskrete eller kontinuerte data Populations fordeling: Se på hvilken fordeling populationen har. Stikprøve: Hvilken metode er brugt til at indsamle data. Skal være en simpel stikprøve i de test vi bruger. Stikprøve størrelse: Hvor stor er den stikprøve vi har til at beregne test størrelsen.

12 Hypoteser

13 O.J. Simpson – en analogi fra den virkelige verden
O. J. Simpson er anklaget for mordet sin eks og dennes kæreste. Nul hypotesen: Han er uskyldig Alternativ hypotese: Han er skyldig For at O. J. skal kunne dømmes skyldig, skal anklagerne bevise, at han er skyldig – beyond any reasonable doubt – O. J. skal ikke bevise, at han er uskyldig. Vi kan forkaste nul hypotesen, hvis han findes skyldig, men hvis nul hypotesen ikke forkastes, har vi ikke bevist, at han er uskyldig – blot, at der ikke er beviser nok til at finde ham skyldig. (Note: Han blev erklæret ”ikke skyldig” !!)

14 Summe opgave Opstil nogle hypoteser ud fra jeres eget datasæt.

15 Test størrelsen Test størrelsen beregnes fra stikprøve data og bruges til at vurdere nul hypotesen. Den indeholder typisk et punkt estimat for den parameter, der indgår i nul hypotesen – for eksempel gennemsnittet som punkt estimat for middelværdien. Selve fremgangsmåden for hypotese test er ens fra test til test, uanset data type, fordelings type og stikprøve størrelse. Men formlen for test størrelsen varierer afhængigt af disse ting.

16 P-værdi P-værdien af en test, er sandsynligheden for at observere en teststørrelse mindst så ekstrem som den beregnede/observerede værdi, når nul hypotesen er sand. Sagt på en anden måde- p-værdien er sandsynligheden for, for eksempel at gennemsnittet af stikprøven er kroner , når den sande middelværdi er Der gælder følgende for p-værdier: Når p-værdien < 0.01 er resultatet meget signifikant. Når p-værdien er mellem 0.01 og 0.05 er resultatet signifikant. Nå p-værdien er mellem 0.05 og 0.1 er resultatet marginalt signifikant. Når p-værdien er større end 0.1, er resultatet ikke signifikant.

17 P-værdi, fortsat Det vil altså sige – når nul hypotesen er falsk, er p-værdien meget lille og når nul hypotesen er sand, vil p-værdien være stor (større end for eksempel 0.05). Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand.

18 Konklusion/beslutnings regel
En beslutningsregel for en hypotese test, er en regel for under hvilke betingelse nul hypotesen kan forkastes. Betragt H0: m=100. Beslutnings reglen kan her være at forkaste H0, når stikprøve gennemsnittet er mindre end 95 eller større end 105. Typisk bruges dog p-værdien for testen. Så en beslutningsregel er for eksempel at forkaste H0, når p-værdien er mindre end 0.05. Hvor lille man vælger p-værdien, afhænger af hvilke konsekvenser beslutningen om at forkaste H0 har. Hvis det er et spørgsmål om liv eller død, for eksempel i medicinske forsøg, vælges p-værdien meget lille. Men hvis det ”bare” er at teste om et folketingsparti er større end et andet, kan man godt vælge p-værdien større.

19 Test af middelværdi Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: er under H0 standard normalfordelt . 8 7 6 5 4 3 2 1 0 x

20 Beregning af p-værdi Når H0 er sand, er fordelingen af Z approksimativt standard normal fordelt (dvs. normal fordelt med middelværdi 0 og standard afvigelse 1). P-værdien er sandsynligheden for at observere en test størrelse mindst så ekstrem som den observerede, givet at H0 er sand. I formler: p( |Z| > beregnet z værdi) . I praksis: I tabellen for standard normalfordelingen aflæses sandsynligheden ud fra værdien af z-værdien og ganges med 2, da det ”er i begge sider af fordelingen”. Dvs. skal ganges med 2, da vi både ser på værdier der er mindre end og større end middelværdien opgivet i H0. Meget nemmere at se ved hjælp af et eksempel:

21 Eksempel H0: m = 30 Ha: mm 30 Stikprøve: n = 50 = 31.5 s = 5
Test størrelse: P-værdi: Fordeling: . 8 . 7 . 6 . 5 . 4 . 3 . 2 .017 .017 . 1 . 0=30 x- x

22 Sandsynligheden for Z-værdien
. 8 7 6 5 4 3 2 1 .017 Z=-2,12 Z=2,12

23 Summe opgave H0: m = 30 Ha: mm 30 Stikprøve: n = 20 = 31.5 s = 5
Beregn værdien af test størrelsen og p-værdien. H0: m = 30 Ha: mm 30 Stikprøve: n = 100 = 31.5 s = 5 Beregn værdien af test størrelsen og p-værdien

24 Relation til konfidens intervaller
95% konfidens interval omkring observeret middelværdi Middelværdi under H0  = 30 32.88 30.11 x = 31.5

25 Højresidet test Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi m og standard afvigelse Teststørrelse: P-værdien: p( Z > beregnet z værdi)

26 Eksempel højresidet test
H0: m = 30 Ha: m > 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: P-værdi: Fordeling: . 8 7 6 5 4 3 2 1 .017 Z=2,12 . 8 . 7 . 6 . 5 . 4 . 3 . 2 .017 . 1 . 0=30 x

27 Venstresidet test Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi m og standard afvigelse Teststørrelse: P-værdien: p( Z < beregnet z værdi)

28 Eksempel venstresidet test
H0: m = 30 Ha: m < 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: P-værdi: Fordeling: . 8 1-.017 . 7 . 6 . 5 . 4 . 3 . 2 . 1 . Z=2,12 . 8 . 7 1-.017 . 6 . 5 . 4 . 3 . 2 . 1 . 0=30 x

29 Test af en andel Antagelse: Test af p, kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: P-værdien: p( |Z| > beregnet z værdi) Højresidet og venstresidet test efter samme princip som før.

30 Eksempel P-værdien kan beregnes til 0.01 og derfor forkastes H0.

31 Signifikans niveau Signifikans niveauet a er et tal, således at H0 forkastes, hvis p-værdien er mindre end a. Er normalvis 0.05 eller 0.01. Vælges før analysen foretages. Hvis man tester på signifikans niveau 0.05, svarer det til en z-værdi på 1.96 i en to-sidet test og i en højresidet test. Normal ses dog på p-værdien i stedet, da de i de fleste tilfælde ikke er smart at have en standard procedure for om man forkaster eller ej. Konklusion P-værdi H0 Ha P<0.05 Forkast Accepter P>0.05 Forkast ikke Accepter ikke

32 Type 1 og type 2 fejl Type 1 fejl: H0 forkastes, når den er sand.
Type 2 fejl: H0 forkastes ikke, selvom den er falsk. Signifikans niveauet a er sandsynligheden for at begå en type 1 fejl. Sandsynligheden for type 1 og type 2 fejl er inverst relaterede, dvs. når den ene stiger, så falder den anden, så man kan ikke vælge begge to så lavt som muligt. Typisk vælger med at fastsætte sandsynligheden for type 1 fejl, så man ikke begår store fejl. For eksempel hvis H0 er, at en eller anden medicin er skadelig, er det bedre at være sikker på, at man ikke forkaster H0 selvom den er sand, end at være sikker på, at man ikke forkaster den, selvom den er falsk. I O.J. Simpson sagen er der nok sket en type 2 fejl ;-) Beslutning Forkast H0 Forkast ikke H0 Sand tilstand af H0 H0 sand Type 1 fejl Korrekt beslutning H0 falsk Type 2 fejl

33 Summeopgave Se igen på jeres eget datasæt og lave nogle tænkte type 1 og type 2 fejl. Diskuter hvilke der ville være værst.

34 Test af middelværdi for n<30
Antagelse: Test af m, X normalfordelt variabel og n<30. Hypoteser: Teststørrelse er t-fordelt med (n-1) frihedsgrader. X skal være normalfordelt pga. det lave antal observationer. Hvis standard afvigelsen havde været kendt, havde teststørrelsen været normalfordelt, selvom n<30.

35 t-fordelingen T-fordelingen er klokkeformet og symmetrisk omkring 0.
Standard afvigelsen af fordelingen afhænger af antallet af frihedsgrader df=n-1. Er altid større end 1, men går med 1, når n vokser. Minder om standard normalfordelingen, men halerne i fordelingen er tykkere. Når n vokser, går t-fordelingen mod standard normal fordelingen. Dvs. når n er stor (større end 30) er standard normal fordelingen og t-fordelingen stort set ens – hvilket jo lige præcis er det, der ses i fordelingerne for teststørrelserne. T-fordelingen afhænger af antal frihedsgrader og er derfor ikke fuldt tabellagt, kun nogle enkelte hale sandsynligheder er tabellagt. Derfor kan man ikke præcist beregne p-værdien, men må angive tal den ligger mellem. Computere bruger altid t-fordelingen selv når n>30, men man får altså næsten samme resultat som når man bruger normalfordelingen for n>30. I konfidens intervaller bruges ligeledes t-fordelingen og ikke normalfordelingen når n<30.

36 Opsamling –hvad skal I have styr på nu ;-)
Hypotese test Opstille hypoteser Beregne test størrelser for middelværdi og andele Fortolke (og beregne) p-værdier Tage en beslutning omkring hypoteserne Type 1 og type 2 fejl


Download ppt "Hypotese test – kapitel 6 (Signifikans test)"

Lignende præsentationer


Annoncer fra Google