Statistik Lektion 7 Hypotesetest og kritiske værdier

Slides:



Advertisements
Lignende præsentationer
Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Advertisements

Hypotese test – kapitel 6 (Signifikans test)
Repræsentativitet Opsamling fra sidst Repræsentativitet (χ2-test)
Anvendt Statistik Lektion 3
Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Akademi Merkonomer Statistik Aften 5
Statistik og sandsynlighedsregning
Statistik Lektion 17 Multipel Lineær Regression
Program Informationer χ2-test (chi-i-anden) Projekt 3
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Statistik Lektion 8 Parrede test Test for forskel i andele
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 9
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Signifikanstest ved (en eller) to stikprøver
Test i to populationer Hypotesetest for parrede observationer
Learning Objectives 5 Steps of a Significance Test Assumptions
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Anvendt Statistik Lektion 7
Fejl  Afleveringen  Stikprøvestørrelse  Type I-II Fejl  Styrkefunktionen.
Grundlæggende teoretisk statistik
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 8 Parrede test Test for forskel i andele
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 6 Konfidensinterval for andele
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Statistik Lektion 14 Simpel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Konfidensintervaller og Hypotesetest
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Simpel Lineær Regression
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Statistik II 4. Lektion Logistisk regression.
Økonometri – lektion 6 Multipel Lineær Regression
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 4
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 3
Præsentationens transcript:

Statistik Lektion 7 Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Hypoteser og hypotesetest. En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable Fx ”Er middelhøjden af Oecon studerende 175cm?” I en hypotesetest testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data. For eksempel kan gennemsnittet af en stikprøve af jeres højder beregnes til 172,7 cm. Er det (signifikant) forskellig fra 175? Det er forskellig fra 175, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhængig af eksempelvis stikprøvestørrelsen? En hypotesetest består af 5 elementer: Antagelser Hypoteser Teststørrelser p-værdi Beslutning/konklusion

Eksempel: Test af middelværdi (to-sidet test) Antagelse: Test af m, X kvantitativ variabel, s2 kendt og n>30. Hypoteser: Stikprøvefordeling af når H0 er sand er approksimativ normal med middelværdi m0 og standard afvigelse Teststørrelse: standardisering

p-værdi og signifikansniveau a p-værdien af en test, er sandsynligheden for at observere en ny teststørrelse, der er mindst lige så fritisk for H0 som den allerede observerede teststørrelse, under antagelse af, at nul hypotesen er sand. Signifikansniveauet a er et tal, således at H0 forkastes, hvis p-værdien er mindre end a. a er normalvis 0.05 eller 0.01. a vælges før analysen foretages. Konklusion p-værdi H0 H1 p < α Forkast Accepter p > α Forkast ikke Accepter ikke Hvor lille et signifikans niveau man vælger, afhænger af hvilke konsekvenser beslutningen om at forkaste H0 har. Hvis det er et spørgsmål om liv eller død, for eksempel i medicinske forsøg, vælges α meget lille. Men hvis det ”bare” er at teste om et folketingsparti er større end et andet, kan man godt α større.

Eksempel Hypoteser: H0: m = 30 H1: m ≠ 30 Stikprøve: n = 50 = 31.5 Teststørrelse: Signifikansniveau: a=0.05 Fordelingen Z under H0: p-værdi: Da p-værdi < a forkastes H0. . 8 7 6 5 4 3 2 1 .017

Kritiske værdier I tilfælde, hvor man ikke kan bestemme p-værdien kan man typisk finde de kritiske værdier. De kritiske værdier svarer til teststørrelser, der har en p-værdi lig signifikansniveauet a. Eksempel: To-sidet test af middelværdien, s kendt, a=0.05. I dette tilfælde er de kritiske værdier -1.96 og 1.96 Tilsvarende kritiske værdier kan findes for andre fordelinger, fx t-fordelingen. Dvs. hvis eller , så ved vi at p-værdien ≤ 0.05. Hvis p-værdien ≤ 0.05 afviser vi H0.

Eksempel H0: m = 30 H1: mm 30 Signifikansniveau: a=0.05 Stikprøve: = 31.5 s = 5 Test størrelse: Kritiske værdi: Da 2,12 > 1,96 forkastes H0 (eller hvis den var mindre end -1,96) Hvis højresidet test, dvs. H1:μ>30: Da 2,12 > 1.645 forkastes H0 Hvis venstresidet test, dvs. H1:μ<30: Da 2,12 ikke er mindre end -1,645, forkastes H0 ikke

En- og to-sidet test af middelværdi for store eller normale stikprøver og kendt varians og signifikansniveau a. H0: m = m0 H1: m ≠ m0 Forkast H0, hvis |z| > Za/2 To-sidet test H0: m = m0 H1: m < m0 Forkast H0, hvis z < -Za En-sidet test H0: m = m0 H1: m > m0 Forkast H0, hvis z > Za I alle tre tilfælde er teststørrelsen

Type I og type II fejl Type I fejl: En sand H0 forkastes. Type II fejl: En falsk H0 forkastes ikke. Signifikans niveauet a er sandsynligheden for at begå en Type I fejl. Sandsynligheden for at begå en Type II fejl betegnes β. Sandsynligheden for Type I og Type II fejl er inverst relaterede, dvs. når den ene stiger, så falder den anden, så man kan ikke vælge begge to så lavt som muligt – se næste slide. Beslutning Forkast H0 Forkast ikke H0 Sand tilstand af H0 H0 sand Type I fejl Korrekt beslutning H0 falsk Type II fejl

Hvordan α og β afhænger af hinanden For forskellige n og et bestemt μ Typisk vælger man at fastsætte sandsynligheden for type II fejl, a, så man ikke begår store fejl. For eksempel hvis H0 er, at en eller anden medicinsk behandling er skadelig, er det bedre at være sikker på, at man ikke forkaster H0 selvom den er sand, end at være sikker på, at man ikke forkaster den, selvom den er falsk.

Beregning af  (for en venstre sidet test) Se på følgende hypoteser: H0:   1000 H1:   1000 Lad  = 5,  = 5%, og n = 100. Vi vil beregne  når  = 1 = 998. Se næste slide Figuren viser fordelingen af når  = 0 = 1000, og når  = 1 = 998. Bemærk at H0 vil blive forkastet, når er mindre end den kritiske værdi givet ved . Omvendt, H0 vil ikke blive forkastet, når er større end .

Beregning af  Fordeling af når m = m0. Fordeling af når m = m1.

Beregning af  Når  = 1 = 998, så er  sandsynligheden for ikke at forkaste H0, dvs. den er . Når  = 1, så vil følge en normal fordeling med middelværdi 1 og standard afvigelse = /n, så: Styrken (power) af en test, er sandsynligheden for at den falske nul hypotese bliver opdaget af testen. Styrken af testen = 1 – β = 1 – 0.0091 = 0.9909.

Test af middelværdi for ukendt varians Antagelse: Test af m, X normalfordelt variabel og σ² ukendt (estimeret ved s²). Hypoteser: Teststørrelse t er t-fordelt med (n-1) frihedsgrader: p-værdien: P( |t| > observeret t værdi) – kan ikke bestemmes ved tabel opslag. Venstre og højre sidet test efter samme princip som før.

Eksempel H0: m = 30 H1: mm 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: Svært at slå op i tabel. Ligger mellem 0.025 og 0.01. P-værdi: Lille p-værdi, så H0 forkastes. Fordeling: . 8 7 6 5 4 3 2 1 0=30 .020 x x-

Eksempel - fortsat H0: m = 30 H1: mm 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: Svært at slå op i tabel. Ligger mellem 0.025 og 0.01. I stedet for p-værdi, vælges signifikans niveau α, for eksempel α=0,05. Slå op i t-tabellen med 49 frihedsgrader under 0,025, da det er en 2-sidet test. t-værdien er cirka lig med 2.01. Da 2,12 er større end 2,01, forkastes H0. Hvis t=-2,12 skulle vi have sagt, da -2,12 er mindre end -2.01, forkastes H0.

Hypotesetest for middelværdi i R cmdr Statistics → Means → Single-sample t-test… Vælg mellem to- og en-sidede test Middelværdi under H0 antal frihedsgrader t-teststørrelse p-værdi H1 hypotese Da p-værdien mindre end 0.05 forkaster vi H0 hypotesen og accepterer H1 hypotesen, dvs. at m er forskellig fra 175.

Test af en Andel Antagelse: Test af populationsandel p, når np(1-p) > 9. Hypoteser: Stikprøvefordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: p-værdien: P( |Z| > beregnet z værdi) Højresidet og venstresidet test efter samme princip som før.

Test af Variansen Antagelse: Test af populations variansen σ², X normal fordelt. Hypoteser: Teststørrelse: P-værdi: p(|Χ²|> beregnet Χ² værdi) – kan ikke beregnes ved tabel opslag. Højresidet og venstresidet test efter samme princip som før.

Test af varians - Eksempel H0: s2=1 H1: s2<1 a=0.05 , s2=0.8659, n=25 Venstre sidet test, så H0 forkastes, hvis . Da kan vi ikke forkaste H0. 0.05 13.85 20.78 R cmdr: Distributions → Continuous Distributions → Chi-squared distribution → Chi-squared probabilities R: pchisq(20.78,df=24) Resultat: 0.3483

Sammenligning af to grupper Tjener mænd og kvinder lige meget? (Respons: Løn, Forklarende: Køn) Er andelen af helbredte kræftpatienter den samme for to forskellige typer kemoterapi? (Respons: helbredte patienter, Forklarende: Kemotype) Er andelen af overvægtige i 2006 den samme som andelen af overvægtige i 1999? (Forklarende: årstal, Respons: overvægtige) Kører en VW Touran og en Skoda det samme antal kilometer per liter? (Forklarende: Bilmærke, Respons: antal kilometer per l) Kører en VW Touran det samme antal kilometer per liter på almindelig benzin, som på bio benzin? (Forklarende: Benzin type, Respons: antal kilometer) Er der forskel på hvor hurtigt man løber 5 km, når man har originale Nike sko og Super Nike sko på?

Afhængige og uafhængige stikprøver Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe. Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper. Kilometer per liter: Tilfældig stikprøve af Touran’er og tilfældig stikprøve af Skoda’er. Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer. Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touran’er og test dem med de to forskellige typer benzin. Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.

Resten af forelæsningen Sammenligning af to middelværdier – kendt varians Hypotesetest Konfidensinterval Sammenligning af to middelværdier – ukendt varians

Sammenligning af to middelværdier – kendte varianser og store stikprøver eller populationer normalfordelte Population 1 Population 2

Stikprøvefordeling af

Sammenligning af to middelværdier – kendte varianser og store stikprøver eller populationer normalfordelte

Konfidensinterval

Eksempel – er der forskel på hvor langt bilerne kører på 25 l. benzin?

To Normalfordelte populationer med ukendt varians Hypoteser: H0: m1 = m2 H1: m1 ≠ m2 To situationer: s12 = s22 s12 ≠ s22 Hvis store stikprøver, bruges z i stedet for t-fordelingen. Bogen bruger z, når n1 og n2 er større end 30. SPSS regner altid med t-fordelingen

Eksempel Beslutning: Teststørrelse: Forskel på højden af drenge og piger Antag s12 = s22. Hypoteser: H0: m1 = m2 H1: m1 ≠ m2 Signifikansniveau: a = 0.05 Teststørrelse: Kritiske punkter: ±ta/2(n1+n2-2) = ±t0.025(17) = ±2.11 Beslutning: H0 afvises da 2.67 > 2.11 (antal drenge) (antal piger) (gennemsnitshøjde drenge) (gennemsnitshøjde piger) (est. varians drenge) (est. varians piger)

Konfidensintervaller for m1 - m2 Konfidensinterval for m1 - m2 når s12 = s22. v = Antal frihedsgrader Konfidensinterval for m1 - m2 når s12 ≠ s22.

R Commander Eksempel Forskel i middelvægt mellem mænd og kvinder? Statistics → Means → Independent samples t-test… Variablen der adskiller de to populationer. Her: Køn Variablen vi vil sammenligne middelværdi for. Her: Vægt Vi har ikke antaget ens varians i de to populationer En- eller to-sidet hypotese-test. Her to-sidet: H0: m1 = m2. Konfidens-niveau. Her (1-a) = 0.95.

R Commander Eksempel Output fra R Commander Da p-værdien = 2.2∙10 -16 < 0.05 afviser vi H0 - hypotesen. Dvs. der er en forskel på mænds og kvinders middelvægt. t-teststørrelse Antal frihedsgrader p-værdi H1-hypotesen 95% konfidens-interval for forskellen i middelværdi.

Parrede observationer For den i’te person har vi to observationer Xi,1 og Xi,2, fx. blodtryk før og efter behandling. For den i’te person definerer vi differencen Di = Xi,1-Xi,2. Forskelle mellem ”før” og ”efter” kan nu undersøges vha. hypotesetest af middeldifferencen, mD. Typisk antagelse er, at differencerne er normalfordelte, Di ~ N(mD, sD2). Estimaterne for hhv. middelværdi og varians betegnes og .

Parrede observationer Udregn differencer: Nike Super 20 17 18 15 16 Nike Original 21 19 Super-Original -1 -2 -5 1

Samme Historie I R Commander Statistics → Means → Paired t-test… p-værdi = 0.08345 > 0.05, dvs. vi kan ikke afvise H0. Dvs. vi kan ikke afvise at de to sko-typer er lige gode. Bemærk: 95% konfidensinterval for forskellen i middelværdi indeholder 0!