Hypotese test – kapitel 6 (Signifikans test)

Slides:



Advertisements
Lignende præsentationer
Valg med Excel Fordelingsmetoder med Excel
Advertisements

Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Anvendt Statistik Lektion 3
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Akademi Merkonomer Statistik Aften 5
Statistik og sandsynlighedsregning
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
Akademi Merkonomer Statistik Aften 6
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Statistik og kvantitativ metode Politik & Administration og Samfundsfag 3. semester 2007 Lektion 5, tirsdag den 23. oktober Punkt- og intervalestimering.
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Signifikanstest ved (en eller) to stikprøver
Learning Objectives 5 Steps of a Significance Test Assumptions
Statistik – Lektion 2 Uafhængighed Stokastiske Variable
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Grundlæggende teoretisk statistik
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Simpel Lineær Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Bernoulli og binomial fordelingerne
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 6 Konfidensinterval for andele
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Normalfordelingen og Stikprøvefordelinger
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Anvendt Statistik Lektion 4
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 3
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Hypotese test – kapitel 6 (Signifikans test) Repetition Hypotese test Hypoteser Test størrelser P-værdi Konklusion Signifikans niveau Type 1 og type 2 fejl

Normalfordelingen En normalfordeling er klokkeformet og symmetrisk. Den er karakteriseret ved en middelværdi  og en standard afvigelse . Arealet under kurven indenfor z af middelværdien, er den samme for enhver normalfordeling, uanset middelværdi og varians. Normal fordelingen er en vigtig fordeling, blandt andet fordi mange andre fordelingen, kan approksimeres til den. Desuden er mange test størrelser normalfordelte – kommer senere i kurset

Standard normalfordelingen Standard normalfordelingen, er normalfordelingen med middelværdi 0 og standard afvigelse 1. Hvis X er normalfordelt med middelværdi μ og standard afvigelse σ, så er Z= (x – μ) /σ, standard normalfordelt. Dvs. vi kan lave enhver normalfordelt stokastisk variabel X om til en standard normalfordelt Z. 5 4 3 2 1 - . Z f ( z ) Standard Normal Fordeling  = 0 =1 {

Konfidens interval for μ

Eksempel Dvs. med 95% sikkerhed ligger den sande middelværdi af fødselsår i intervallet fra 1952,20 til 1954,35. Gennemsnittet er lig 1953,28.

Populations og stikprøve andele Populations andelen er lig med antallet af elementer i populationen der tilhører den kategori, man er interesseret i, divideret med det totale antal elementer i populationen: Stikprøve andelen er antallet af elementer i stikprøven, der tilhører den kategori, man er interesseret i, divideret med det totale antal elementer i stikprøven:

Estimation af en andel Punkt estimat af en population andel, er stikprøve andelen . Standard fejlen for populations andelen er givet som: Er typisk ukendt, så derfor bruges Populations andelen er en slags stikprøve middelværdi (for eksempel hvis data består af 0 og 1) og kan derfor for store n antages at være normalfordelt. Et konfidens interval for populations andelen er derfor givet som:

Værdi-undersøgelsen - køn

Køn – stikprøve andel og konfidens interval Standard fejlen Konfidens interval Dvs. med 95% sikkerhed ligger den sande andel af kvinder (da kvinde=1 og mand=0) i intervallet fra 0,4766 til 0,5380. Gennemsnittet er lig 0,5073.

Hypoteser og hypotesetest. En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable, for eksempel: ”Er middelværdien af de 5.semesters studerendes vægt lig med 70 kilo?” Eller er middel lønnen for nyuddannede sociologer 20.000 om måneden? I en hypotesetest (signifikanstest) testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra en stikprøve. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 68 kilo. Er det (signifikant) forskellig fra 70? Det er forskellig fra 70, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation (afhænger af eksempelvis stikprøvestørrelsen). Eller er et gennemsnit på 21.000 kroner signifikant forskelligt fra 20.000? En hypotesetest består af 5 elementer: antagelser, hypoteser, test størrelse, p-værdi og beslutning/konklusion.

Antagelser Type af data: Se på om det er diskrete eller kontinuerte data Populations fordeling: Se på hvilken fordeling populationen har. Stikprøve: Hvilken metode er brugt til at indsamle data. Skal være en simpel stikprøve i de test vi bruger. Stikprøve størrelse: Hvor stor er den stikprøve vi har til at beregne test størrelsen.

Hypoteser

O.J. Simpson – en analogi fra den virkelige verden O. J. Simpson er anklaget for mordet sin eks og dennes kæreste. Nul hypotesen: Han er uskyldig Alternativ hypotese: Han er skyldig For at O. J. skal kunne dømmes skyldig, skal anklagerne bevise, at han er skyldig – beyond any reasonable doubt – O. J. skal ikke bevise, at han er uskyldig. Vi kan forkaste nul hypotesen, hvis han findes skyldig, men hvis nul hypotesen ikke forkastes, har vi ikke bevist, at han er uskyldig – blot, at der ikke er beviser nok til at finde ham skyldig. (Note: Han blev erklæret ”ikke skyldig” !!)

Summe opgave Opstil nogle hypoteser ud fra jeres eget datasæt.

Test størrelsen Test størrelsen beregnes fra stikprøve data og bruges til at vurdere nul hypotesen. Den indeholder typisk et punkt estimat for den parameter, der indgår i nul hypotesen – for eksempel gennemsnittet som punkt estimat for middelværdien. Selve fremgangsmåden for hypotese test er ens fra test til test, uanset data type, fordelings type og stikprøve størrelse. Men formlen for test størrelsen varierer afhængigt af disse ting.

P-værdi P-værdien af en test, er sandsynligheden for at observere en teststørrelse mindst så ekstrem som den beregnede/observerede værdi, når nul hypotesen er sand. Sagt på en anden måde- p-værdien er sandsynligheden for, for eksempel at gennemsnittet af stikprøven er 21.000 kroner , når den sande middelværdi er 20.000. Der gælder følgende for p-værdier: Når p-værdien < 0.01 er resultatet meget signifikant. Når p-værdien er mellem 0.01 og 0.05 er resultatet signifikant. Nå p-værdien er mellem 0.05 og 0.1 er resultatet marginalt signifikant. Når p-værdien er større end 0.1, er resultatet ikke signifikant.

P-værdi, fortsat Det vil altså sige – når nul hypotesen er falsk, er p-værdien meget lille og når nul hypotesen er sand, vil p-værdien være stor (større end for eksempel 0.05). Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand.

Konklusion/beslutnings regel En beslutningsregel for en hypotese test, er en regel for under hvilke betingelse nul hypotesen kan forkastes. Betragt H0: m=100. Beslutnings reglen kan her være at forkaste H0, når stikprøve gennemsnittet er mindre end 95 eller større end 105. Typisk bruges dog p-værdien for testen. Så en beslutningsregel er for eksempel at forkaste H0, når p-værdien er mindre end 0.05. Hvor lille man vælger p-værdien, afhænger af hvilke konsekvenser beslutningen om at forkaste H0 har. Hvis det er et spørgsmål om liv eller død, for eksempel i medicinske forsøg, vælges p-værdien meget lille. Men hvis det ”bare” er at teste om et folketingsparti er større end et andet, kan man godt vælge p-værdien større.

Test af middelværdi Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: er under H0 standard normalfordelt . 8 7 6 5 4 3 2 1 0 x

Beregning af p-værdi Når H0 er sand, er fordelingen af Z approksimativt standard normal fordelt (dvs. normal fordelt med middelværdi 0 og standard afvigelse 1). P-værdien er sandsynligheden for at observere en test størrelse mindst så ekstrem som den observerede, givet at H0 er sand. I formler: p( |Z| > beregnet z værdi) . I praksis: I tabellen for standard normalfordelingen aflæses sandsynligheden ud fra værdien af z-værdien og ganges med 2, da det ”er i begge sider af fordelingen”. Dvs. skal ganges med 2, da vi både ser på værdier der er mindre end og større end middelværdien opgivet i H0. Meget nemmere at se ved hjælp af et eksempel:

Eksempel H0: m = 30 Ha: mm 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: P-værdi: Fordeling: . 8 . 7 . 6 . 5 . 4 . 3 . 2 .017 .017 . 1 . 0=30 x- x

Sandsynligheden for Z-værdien . 8 7 6 5 4 3 2 1 .017 Z=-2,12 Z=2,12

Summe opgave H0: m = 30 Ha: mm 30 Stikprøve: n = 20 = 31.5 s = 5 Beregn værdien af test størrelsen og p-værdien. H0: m = 30 Ha: mm 30 Stikprøve: n = 100 = 31.5 s = 5 Beregn værdien af test størrelsen og p-værdien

Relation til konfidens intervaller 95% konfidens interval omkring observeret middelværdi Middelværdi under H0  = 30 32.88 30.11 x = 31.5

Højresidet test Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi m og standard afvigelse Teststørrelse: P-værdien: p( Z > beregnet z værdi)

Eksempel højresidet test H0: m = 30 Ha: m > 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: P-værdi: Fordeling: . 8 7 6 5 4 3 2 1 .017 Z=2,12 . 8 . 7 . 6 . 5 . 4 . 3 . 2 .017 . 1 . 0=30 x

Venstresidet test Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi m og standard afvigelse Teststørrelse: P-værdien: p( Z < beregnet z værdi)

Eksempel venstresidet test H0: m = 30 Ha: m < 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: P-værdi: Fordeling: . 8 1-.017 . 7 . 6 . 5 . 4 . 3 . 2 . 1 . Z=2,12 . 8 . 7 1-.017 . 6 . 5 . 4 . 3 . 2 . 1 . 0=30 x

Test af en andel Antagelse: Test af p, kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: P-værdien: p( |Z| > beregnet z værdi) Højresidet og venstresidet test efter samme princip som før.

Eksempel P-værdien kan beregnes til 0.01 og derfor forkastes H0.

Signifikans niveau Signifikans niveauet a er et tal, således at H0 forkastes, hvis p-værdien er mindre end a. Er normalvis 0.05 eller 0.01. Vælges før analysen foretages. Hvis man tester på signifikans niveau 0.05, svarer det til en z-værdi på 1.96 i en to-sidet test og 1.645 i en højresidet test. Normal ses dog på p-værdien i stedet, da de i de fleste tilfælde ikke er smart at have en standard procedure for om man forkaster eller ej. Konklusion P-værdi H0 Ha P<0.05 Forkast Accepter P>0.05 Forkast ikke Accepter ikke

Type 1 og type 2 fejl Type 1 fejl: H0 forkastes, når den er sand. Type 2 fejl: H0 forkastes ikke, selvom den er falsk. Signifikans niveauet a er sandsynligheden for at begå en type 1 fejl. Sandsynligheden for type 1 og type 2 fejl er inverst relaterede, dvs. når den ene stiger, så falder den anden, så man kan ikke vælge begge to så lavt som muligt. Typisk vælger med at fastsætte sandsynligheden for type 1 fejl, så man ikke begår store fejl. For eksempel hvis H0 er, at en eller anden medicin er skadelig, er det bedre at være sikker på, at man ikke forkaster H0 selvom den er sand, end at være sikker på, at man ikke forkaster den, selvom den er falsk. I O.J. Simpson sagen er der nok sket en type 2 fejl ;-) Beslutning Forkast H0 Forkast ikke H0 Sand tilstand af H0 H0 sand Type 1 fejl Korrekt beslutning H0 falsk Type 2 fejl

Summeopgave Se igen på jeres eget datasæt og lave nogle tænkte type 1 og type 2 fejl. Diskuter hvilke der ville være værst.

Test af middelværdi for n<30 Antagelse: Test af m, X normalfordelt variabel og n<30. Hypoteser: Teststørrelse er t-fordelt med (n-1) frihedsgrader. X skal være normalfordelt pga. det lave antal observationer. Hvis standard afvigelsen havde været kendt, havde teststørrelsen været normalfordelt, selvom n<30.

t-fordelingen T-fordelingen er klokkeformet og symmetrisk omkring 0. Standard afvigelsen af fordelingen afhænger af antallet af frihedsgrader df=n-1. Er altid større end 1, men går med 1, når n vokser. Minder om standard normalfordelingen, men halerne i fordelingen er tykkere. Når n vokser, går t-fordelingen mod standard normal fordelingen. Dvs. når n er stor (større end 30) er standard normal fordelingen og t-fordelingen stort set ens – hvilket jo lige præcis er det, der ses i fordelingerne for teststørrelserne. T-fordelingen afhænger af antal frihedsgrader og er derfor ikke fuldt tabellagt, kun nogle enkelte hale sandsynligheder er tabellagt. Derfor kan man ikke præcist beregne p-værdien, men må angive tal den ligger mellem. Computere bruger altid t-fordelingen selv når n>30, men man får altså næsten samme resultat som når man bruger normalfordelingen for n>30. I konfidens intervaller bruges ligeledes t-fordelingen og ikke normalfordelingen når n<30.

Opsamling –hvad skal I have styr på nu ;-) Hypotese test Opstille hypoteser Beregne test størrelser for middelværdi og andele Fortolke (og beregne) p-værdier Tage en beslutning omkring hypoteserne Type 1 og type 2 fejl