Signifikanstest ved (en eller) to stikprøver

Name: Signifikanstest ved (en eller) to stikprøver
Uploaded: 2017-06-29T20:22:40+00:00
Duration: PTM14S18
Channel: Filippa Laustsen
Description: Signifikanstest ved (en eller) to stikprøver

Signifikanstest ved (en eller) to stikprøver
Fremgangsmåde – de fem trin Forudsætninger Hypoteseformulering Beregning af en teststørrelse, fx z-score Omregning af teststørrelsen til en P-værdi Konklusion 1

Uafhængige stikprøver (independent samples)
To stikprøver, hvor observationerne i den ene stikprøve er u-afhængige af ditto i den anden. Eksempel: Et antal personer udtaget simpel tilfældigt deles tilfældigt i to grupper hvorefter, de bedes vurdere to forskellige hjemmesider (eksperiment). Eksempel: Personerne til en meningsmåling udtages simpelt tilfældigt til en stikprøve og deles yderligere op, f.eks. efter deres køn. 2 2

Afhængige stikprøver (dependent samples)
Afhængige stikprøver forekommer, når data i stikprøv-erne kan matches parvis: Hver person i den ene stik-prøve kan matches med en person i den anden. Eksempel: Der indsamles data om samme person på to forskellige tidspunkter. Mao. består de to stikprøver af de samme personer (og disse kan matches). Eksempel: Tvillinger ved det klassiske studie af arv og miljø. 3 3

Eksempel: Mobilapplikation og hvilepuls
En applikation til en mobiltelefon skal motivere sine brugere til jævnlig fysisk træning. I en undersøgelse sammenlignes den gennemsnitlige hvilepuls blandt personer der har hhv. ikke har applikationen. Hvilkepuls n Gns. Std.afv. Har applikationen 29 66 7,3 Har den ikke 31 70 5,5 Er det to afhængige eller uafhængige stikprøver? 4 4

Sml. af gns. fra to uafhængige stikprøver
Forudsætninger En signifikanstest forudsætter, at data er skabt ved simpel tilfældig udvælgelse. Andre forudsætninger kan vedrøre Stikprøvestørrelsen F.eks. forudsætter teststørrelsen z, at n > 30. Teststørrelsen t minder meget om z og anvendes, når n<30. Populationens fordeling F.eks. forudsætter teststørrelsen t, at popula-tionen er normalfordelt.Det gør z ikke, men z kræver, at n > 30 (hvorfor?) 5 5

2. Hypoteser Nulhypotesen er hypotesen om “ingen forskel” eller “ingen effekt”: H0: (µ1- µ2) =0 idet µ1 = µ2 => µ1- µ2 = 0 Alternativhypotesen er en af følgende: Ha: (µ1- µ2) ≠ 0 (to-sidet test) Ha: (µ1- µ2) < 0 (et-sidet test) Ha: (µ1- µ2) > 0 (et-sidet test) 6 6

3. Teststørrelse Test af middelværdi i 1 stikprøve Test af middelværdier i 2 uafhængige stikprøver: 7 7

4. P-værdi: Sandsynligheden for at observere test-størrelsen (hvis nulhypotesen er sand). Sandsynlig-heden findes v.hj.a. Excel. 5. Konklusion: Små P-værdier er beviser mod nulhypotesen H0 (til støtte for Ha). 8 8

Eksempel: Test af gns. fra to uafhængige stikprøver
Hvilepuls n Gns. Std.afv. 1. Har applikationen 29 66 7,3 2. Har den ikke 31 70 5,5 Har applikationsbrugere en lavere hvilepuls? Nulhypotesen er “ingen forskel” eller “ingen effekt”: H0: (µ1- µ2) =0 Alternativhypotesen er en lavere hvilepuls: Ha: (µ1- µ2) < 0 Test H0 på et 5% signifikansniveau 9 9

Hvilepuls n Gns. Std.afv. 1. Har applikationen 29 66 7,3 2. Har den ikke 31 70 5,5 10 10

11 11

Konklusion: P-værdien på 0,0087 er mindre end 5 %. H0 afvises. ”Beviserne” er stærke nok til at konkludere, at der er forskel på den gennemsnitlige hvilepuls for personer med og uden applikationen. I følge testen er der grund til at tro på, at den gennemsnitlige hvilepuls er lavere for personer, der benytter sig af applikationen. Hvad er forskellen på test i en stikprøve og test i to uafhængige stikprøver? 12 12

Opgave: Load tider Efter skift til et nyt webhotel er download tiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt.Downloadtiderne målt i millisekunder fremgår af tabellen. Download tid n Gns. Std.afv. Før 81 110 16 Efter 64 102 17 Er den gns. downloadtid blevet mindre? 13 13

Afhængige stikprøver (dependent samples)
Afhængige stikprøver forekommer, når data i stikprøv-erne kan matches parvis. Dvs. at hver person i den ene stikprøve matches direkte med en person i den anden. Eksempel: Der indsamles data om samme person på to forskellige tidspunkter. De to stikprøver består dermed af samme personer (matchende par). Eksempel: Tvillinger ved det klassiske studie af arv og miljø. 14 14

Test af gns. fra to afhængige stikprøver
Den statistiske analyse af mobilapplikationen blev gennemført med to uafhængige stikprøver. Den ene gruppe (forsøgsgruppen) benyttede applikationen. Den anden gruppe (kontrolgruppen) benyttede ikke applikationen. Et alternativt design benytter de samme testpersoner i begge stikprøver; først uden og siden med applikationen. Hvorfor denne rækkefølge? Hvilepulsen måles før anvendelse og f.eks. efter en måneds brug. Hvordan tages stikprøven i praksis? 15 15

Eksempel: Test af gns. fra to afhængige stikprøver
Data. Benytter testpersonen applikationen? Ja, Nej, D=Diff. Id. J N D 1 69 70 -1 9 68 73 -5 ... 2 66 78 -12 10 67 61 6 3 71 5 11 63 64 4 80 -13 12 56 75 -19 27 60 -7 13 52 -15 28 85 16 76 -9 14 72 29 62 65 -3 7 30 - 8 54 -6 31 16 16

Differencen mellem de to stikprøvers gennemsnit ( – ) er lig gennemsnittet af differencerne, , for de matchende par. Differencen mellem populationernes gennemsnit (µ1 – µ2) er lig parameteret µd, dvs. differencernes populations- gennemsnit. Det statistiske test af de parvise differencer er et special tilfælde af det statistisk test vedrørende en populations gennemsnit, baseret på en enkelt stikprøve. 17 17

Hvad er fordelen ved afhængige stikprøver? Procedure ved sammenligning af gennemsnit i 2 afhængige stikprøver: For hvert matchende par beregnes differencen, d d = (hvilepuls uden applikationen) – (hvilepuls med applikationen) Differencerne kalder vi 18 18

For at teste hypotesen om ens gennemsnit, H0: µ1 = µ2, tester man H0: µd = 0, svarende til differencen (µ1-µ2). Man tester på samme måde som ved en enkelt stikprøve. Teststørrelsen er: 19 19

1. Forudsætninger Stikprøven er udvalgt simpelt tilfældigt. For n < 30 forudsættes, at populationen er normalfordelt. Dette er vigtigt ved små stikprøver 20 20

2. Hypoteser H0: µd = 0 (hvilket er dss., at de to populations gennemsnit er ens) Ha: µd < 0 3. Teststørrelse 21 21

4. Omregning til en P-værdi z = -1,98 P = (z < -1,98) ≈ 2 % 22 22

5. Konklusion P-værdien er under 5 %, hvorfor nul-hypotesen afvises. Der er gode beviser mod nul-hypotesen, hvorfor den afvises. Der er grund til at tro, at den gennemsnitlige hvilepuls er lavere for brugere af applikationen. 23 23

Opgave: Load tider Efter skift til et nyt webhotel er download tiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt.Downloadtiderne målt i millisekunder fremgår af tabellen. Download tid n Gns. Std.afv. Før 81 110 16 Efter 64 102 17 Er den gns. downloadtid blevet mindre? 24 24

Signifikanstest ved (en eller) to stikprøver

Lignende præsentationer

Præsentationer af emnet: "Signifikanstest ved (en eller) to stikprøver"— Præsentationens transcript:

Lignende præsentationer

Om projektet

Feedback

Log ind

Logge ind via sociale netværk:

Signifikanstest ved (en eller) to stikprøver

Lignende præsentationer

Præsentationer af emnet: "Signifikanstest ved (en eller) to stikprøver"— Præsentationens transcript:

Lignende præsentationer

Om projektet

Feedback