Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Konfidensintervaller og Hypotesetest

Lignende præsentationer


Præsentationer af emnet: "Konfidensintervaller og Hypotesetest"— Præsentationens transcript:

1 Konfidensintervaller og Hypotesetest
Konfidensinterval for andele c2-fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele

2 Repetition fra sidst: Konfidensintervaller
Et punkt-estimat estimerer værdien af en ukendt populations parameter ved en enkelt værdi. Fx: Middelhøjden blandt oecon studernde Et konfidens interval er et interval, der estimerer værdien af en ukendt populations parameter. Kaldes også et interval estimat. Sammen med intervallet gives et mål for, hvor sikker man er på, at den sande populations parameter ligger i intervallet. Dette mål kaldes for konfidens niveauet. Et punkt estimat indeholder ikke meget information om den faktiske værdi af μ – fx hvor sikkert er vores punkt estimat? Et interval estimat indeholder flere informationer, for eksempel: Vi er 95% sikre på, at intervallet [164,8 ; 180,7] indeholde den sande middelværdi μ. Eller vi er 90% sikre på, at intervallet [166,1 ; 179,3] indeholder den sande middelværdi μ.

3 Repetition fra sidst (1-α)100% konfidens interval for:
Populations middelværdi μ, når X er normal fordelt (eller stikprøven er stor) og σ er kendt: Populations middelværdi μ, når X er normal fordelt og σ er ukendt: Husk: n-1 frihedsgrader

4 Konfidensinterval for andele
Estimatet af populations-andelen, p, er stikprøve-andelen , ,dvs. andelen af succeser i stikprøven. Hvis np>5 og n(1-p)>5, så er stikprøve-fordelingen af stikprøve-andelen ca normalfordelt: Et (1-α)100% konfidensinterval for p er

5 Eksempel 6-4 For en given produkttype: Hvor stor en andel af det amerikanske marked er besat af udenlandske virksomheder? En stikprøve på 100 forbrugere udtages og 34 af disse bruger et udenlandske produkt; resten bruger et amerikanske produkt. Giv et 95% konfidensinterval for andelen af brugere af udenlandske produkter.

6 c2-fordelingen c2-fordelingen [ki-i-anden] er asymmetrisk og kun defineret for positive tal. c2-fordelingen er (li’som t-fordelingen) specificeret ved antal frihedsgrader (df). Notation: X~c2(n) [X følger en c2-fordelingenmed n frihedsgrader]. 2-fordelingen er sandsynligheds fordelingen for en sum af uafhængige kvadrerede standard normal fordelte stokastiske variable. 1 5 2 h i - S q u a r e D s t b o n : d f = , 3 df = 10 df = 30 df = 50 C Hvis X~c2(df) gælder: Middelværdien er lig med antallet af frihedsgraden, E(X)=df Variansen er lig med to gange antallet af frihedsgrader, V(X)=2df

7 2-fordelingen og stikprøvevariansen
er en central estimator for populations variansen σ². Konfidensintervaller for populations-variansen er baseret på 2-fordelingen. Hvis stikprøven er taget fra en normal-fordeling, så er den stokastiske variabel: c2-fordelt med n-1 frihedsgrader.

8 Sandsynligheder i 2 fordelingen Tabel 4 s778
Areal i højre hale (α)

9 Konfidens interval for populations variansen, s2
Et (1-)100% konfidens interval for populations variansen s2 (hvis populationen er normal fordelt) er givet som: hvor er fraktilen i 2 fordelingen og er fraktilen. Bemærk: Fordi 2 fordelingen er skæv, er konfidens-intervallet for populations-variansen ikke symmetrisk omkring s2.

10 Eksempel 6-5 En maskine fylder kaffekander (med kaffe ;-) Hvis det gennemsnitlige indhold er forskellig fra hvad det skal være, kan maskinen justeres. Hvis variansen er for høj, skal maskinen sendes til reparation. En stikprøve på 30 kander giver et varians estimat på s2 = 18,540. Giv et 95% konfidens interval for populations variansen, 2.

11 Eksempel 6-5 C h i - S q u a r e D i s t r i b u t i o n : d f = 2 9
. 6 . 5 0.95 . 4 ) 2 . 3 f ( . 2 0.025 . 1 0.025 . 1 2 3 4 5 6 7 2 Areal i højre hale df

12 Hypoteser og hypotesetest.
En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable Fx ”Er middelhøjden af de Oecon studerende lig 175cm?” I en hypotesetest testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 172,7 cm. Er det (signifikant) forskellig fra 175? Det er forskellig fra 175, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhængig af eksempelvis stikprøvestørrelsen? En hypotesetest består af 5 elementer: Antagelser Hypoteser Teststørrelser p-værdi Beslutning/konklusion

13 I: Antagelser Type af data: Se på om det er diskrete eller kontinuerte data. Populationsfordeling: Se på hvilken fordeling populationen har. Stikprøve: Hvilken metode er brugt til at indsamle data. Skal være en simpel stikprøve i de test vi bruger. Stikprøvestørrelse: Hvor stor er den stikprøve vi har til at beregne test størrelsen?

14 II: Hypoteser Eksempel: Nul- og alternativ-hypoteser for middelværdien Nul hypotesen H0: En påstand om en populationsparameter. Er sand indtil vi statistisk er bevist at den er sand. Den alternative hypotese H1: En påstand om alle situationer, der ikke er dækket af H0, dvs. det ”modsatte af H0”. Nul hypotesen er sand indtil det modsatte er bevist. Oecon eksempel: H0: μ = 175 vs H1: μ ≠ 175

15 III: Test størrelsen Teststørrelsen beregnes fra stikprøve data og bruges til at vurdere nul-hypotesen H0. Den indeholder typisk et punktestimat for den parameter, der indgår i nul hypotesen – for eksempel stikprøve gennemsnittet som punktestimat for middelværdien. Oecon eksempel: Stikprøvegennemsnittet er teststørrelsen til test af H0 hypotesen μ = 175. Konkret , hvilket er ufavorabelt for H0 , men er det bevis nok til at afvise H0 eller er det bare tilfældighedernes spil?

16 IV: p-værdi p-værdien er et mål for troværdigheden af H0 set i lyset af den aktuelle stikprøve. Formelt er p-værdien af en test, er sandsynligheden for at observere en ny teststørrelse, der er mindst lige så ufarvorabel for H0 som den observerede teststørrelse, når nul hypotesen er sand. Jo mindre p-værdi jo mere signifikant siger man testet er. Bemærk: Selvom H0 er sand kan man godt få en lille p-værdi – og omvendt.

17 V: Konklusion/beslutnings regel
En beslutningsregel for en hypotese test, er en regel for under hvilke betingelse nul hypotesen kan forkastes. Betragt H0: m=175. Beslutnings reglen kan her være at forkaste H0, når stikprøve gennemsnittet er under 170. Typisk bruges dog p-værdien for testen. Så en beslutningsregel er for eksempel at forkaste H0, når p-værdien er mindre end 0.05. Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand.

18 Signifikansniveau a Konklusion p-værdi H0 H1 p < α Forkast Accepter
Forkast ikke Accepter ikke Signifikansniveauet a er et tal, således at H0 forkastes, hvis p-værdien er mindre end a. a er normalvis 0.05 eller 0.01. Vælges før analysen foretages. Hvor lille et signifikans niveau man vælger, afhænger af hvilke konsekvenser beslutningen om at forkaste H0 har. Hvis det er et spørgsmål om liv eller død, for eksempel i medicinske forsøg, vælges α meget lille. Men hvis det ”bare” er at teste om et folketingsparti er større end et andet, kan man godt α større.

19 Test af middelværdi (to-sidet test)
Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøvefordeling af når H0 er sand er approksimativ normal med middelværdi m0 og standard afvigelse Teststørrelse: standardisering

20 Beregning af p-værdi Når H0 er sand, er fordelingen af Z approksimativt standard normal fordelt (dvs. normal fordelt med middelværdi 0 og standard afvigelse 1). p-værdien er sandsynligheden for at observere en teststørrelse mindst så ufavorabel, som den observerede, givet at H0 er sand. I formler: P( |Z| > beregnet z værdi), svarende til sandsynligheden for at observere et gennemsnit der er længere fra m0 end , hvis H0 er sand. Sansynligheden ovenfor bestemmes ved tabelopslag (det er derfor vi standardiserer). Meget nemmere at se ved hjælp af et eksempel…

21 Eksempel Hypoteser: H0: m = 30 H1: mm 30 Stikprøve: n = 50 = 31.5
Teststørrelse: p-værdi: Lille p-værdi, så H0 forkastes. Fordeling: . 8 . 7 . 6 . 5 . 4 . 3 . 2 .017 .017 . 1 .

22 Summe opgave H0: m = 30 H1: mm 30 Stikprøve: n = 20 = 31.5 s = 5
Beregn værdien af test størrelsen og p-værdien. H0: m = 30 H1: mm 30 Stikprøve: n = 100 = 31.5 s = 5 Beregn værdien af test størrelsen og p-værdien

23 Relation til konfidens intervaller
95% konfidensinterval for m, dvs. a = 0.05: 95% konfidensinterval omkring observeret middelværdi Middelværdi under H0 0 = 30 30.11 x = 31.5 32.88 Da (1-a)100% konfidensintervallet ikke overlapper m0 er p-værdien mindre end a=0.05, dvs. vi forkaster H0.

24 Hvorfor = i nul hypotesen

25 Højresidet test (et en-sidet test)
Antagelse: Test af m, X kontinuert variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi m og standard afvigelse Teststørrelse: P-værdien: p( Z > observeret z værdi)

26 Eksempel højresidet test
H0: m = 30 H1: m > 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: P-værdi: Lille p-værdi, så H0 forkastes. Fordeling: . 8 7 6 5 4 3 2 1 .017 Z=2,12 . 8 7 6 5 4 3 2 1 0=30 .017 x

27 Venstresidet test Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi m og standard afvigelse Teststørrelse: P-værdien: p( Z < observeret z værdi)

28 Eksempel venstresidet test
H0: m = 30 H1: m < 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: P-værdi: Stor p-værdi, så H0 forkastes ikke. Fordeling: . 8 7 6 5 4 3 2 1 1-.017 Z=2,12 . 8 7 6 5 4 3 2 1 0=30 1-.017 x

29 Test af middelværdi for ukendt varians
Antagelse: Test af m, X normalfordelt variabel og σ² ukendt (estimeret ved s²). Hypoteser: Teststørrelse t er t-fordelt med (n-1) frihedsgrader: p-værdien: p( |t| > observeret t værdi) – kan ikke bestemmes ved tabel opslag, men SPSS gør det! Venstre og højre sidet test efter samme princip som før.

30 Eksempel H0: m = 30 H1: mm 30 Stikprøve: n = 50 = 31.5 s = 5
Test størrelse: Svært at slå op i tabel. Ligger mellem og 0.01. P-værdi: Lille p-værdi, så H0 forkastes. Fordeling: . 8 7 6 5 4 3 2 1 0=30 .020 x x-

31 Eksempel - fortsat H0: m = 30 H1: mm 30 Stikprøve: n = 50 = 31.5 s = 5
Test størrelse: Svært at slå op i tabel. Ligger mellem og 0.01. I stedet for p-værdi, vælges signifikans niveau α, for eksempel α=0,05. Slå op i t-tabellen med 49 frihedsgrader under 0,025, da det er en 2-sidet test. t-værdien er cirka lig med Da 2,12 er større end 2,01, forkastes H0. Hvis t=-2,12 skulle vi have sagt, da -2,12 er mindre end -2.01, forkastes H0.

32 Hypotesetest for middelværdi i SPSS
SPSS: Analyze > Compare Means > One Sample T-Test Angiver (1-a)100% konfidensinterval (1-a)100% konfidens- interval for m - m0 m0 i H0 hypotesen Typisk output af spss p-værdi for to-sidet t-test, dvs. H1: m ≠ m0

33 Test af en andel Antagelse: Test af populations andel p, når np>5 og n(1-p)>5. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: P-værdien: p( |Z| > beregnet z værdi) Højresidet og venstresidet test efter samme princip som før.

34 Test af variansen Antagelse: Test af populations variansen σ², X normal fordelt. Hypoteser: Teststørrelse: P-værdi: p(|Χ²|> beregnet Χ² værdi) – kan ikke beregnes ved tabel opslag. Højresidet og venstresidet test efter samme princip som før.

35 Test af varians - eksempel
H0: s2=1 H1: s2<1 a=0.05 , s2=0.8659, n=25 Venstre sidet test, så H0 forkastes, hvis Da kan vi ikke forkaste H0. 0.05 13.85 20.78


Download ppt "Konfidensintervaller og Hypotesetest"

Lignende præsentationer


Annoncer fra Google