Signifikanstest ved (en eller) to stikprøver

Slides:



Advertisements
Lignende præsentationer
Case: Tekst på Call-To-Action link
Advertisements

Dagens program Resumé - Normalfordelingen χ2-test (chi-i-anden)
Dagens program Informationer χ2-test (chi-i-anden) Øvelser
Hypotese test – kapitel 6 (Signifikans test)
Repræsentativitet Opsamling fra sidst Repræsentativitet (χ2-test)
Anvendt Statistik Lektion 3
Dagens program Kursusevaluering Information Spørgsmål om eksamen
Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Program Informationer χ2-test (chi-i-anden) Projekt 3
Dagens program Informationer Opsamling χ2-test (chi-i-anden)
Formularer (Access, del 3)
Bolig selskabernes Landsforening– Almene lejeboliger - Maj/Juni Almene lejeboliger - Danmarkspanelet - Maj/Juni 2010.
Trivselsundersøgelse og ledelsesevaluering
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 9
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Statistik.
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Dagens program 1.Information Hvordan går det med projekt 3 Evaluering 2.Opsamling Hvad er forudsætningerne for kausalitet? 3.Om eksperimenter 4.Variansanalyse,
Statistik og kvantitativ metode Politik & Administration og Samfundsfag 3. semester 2007 Lektion 5, tirsdag den 23. oktober Punkt- og intervalestimering.
Case.
Dagens program Kursusevaluering Repetition One way hhv. two way anova
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Pleje og Sundhed Gennemførte719 Inviterede895 Svarprocent80% FREDERICIA KOMMUNE MTU og Psykisk APV 2012 Rapportspecifikationer.
Learning Objectives 5 Steps of a Significance Test Assumptions
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Trivselsundersøgelse og ledelsesevaluering Anæstesiologisk Afdeling Flere ledere
Dagens program Test of Independence (chi-i-anden) Videre med projekt 3
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Grundlæggende teoretisk statistik
Globaliseringsredegørelsen 24.mar. 14 Figurer fra Danmark tiltrækker for få udenlandske investeringer i Sådan ligger landet
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Rapporter (Access, del 5). RHS – Informationsteknologi – Udgangspunkt Vi har oprettet en database Vi har defineret en eller flere tabeller, og.
Grunde til at jeg elsker dig
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 28. september 2004.
Samarbejde mellem matematik og samfundsfag. Disposition Indledning Hvorfor skal vi bruge 2 i samfundsfag? Hvordan kan matematikken bruges? Eksempel. Oplæg.
Videnskabeligt projekt
Anvendt Statistik Lektion 4
Anvendt Statistik Lektion 6
Præsentationens transcript:

Signifikanstest ved (en eller) to stikprøver Fremgangsmåde – de fem trin Forudsætninger Hypoteseformulering Beregning af en teststørrelse, fx z-score Omregning af teststørrelsen til en P-værdi Konklusion 1

Uafhængige stikprøver (independent samples) To stikprøver, hvor observationerne i den ene stikprøve er u-afhængige af ditto i den anden. Eksempel: Et antal personer udtaget simpel tilfældigt deles tilfældigt i to grupper hvorefter, de bedes vurdere to forskellige hjemmesider (eksperiment). Eksempel: Personerne til en meningsmåling udtages simpelt tilfældigt til en stikprøve og deles yderligere op, f.eks. efter deres køn. 2 2

Afhængige stikprøver (dependent samples) Afhængige stikprøver forekommer, når data i stikprøv-erne kan matches parvis: Hver person i den ene stik-prøve kan matches med en person i den anden. Eksempel: Der indsamles data om samme person på to forskellige tidspunkter. Mao. består de to stikprøver af de samme personer (og disse kan matches). Eksempel: Tvillinger ved det klassiske studie af arv og miljø. 3 3

Eksempel: Mobilapplikation og hvilepuls En applikation til en mobiltelefon skal motivere sine brugere til jævnlig fysisk træning. I en undersøgelse sammenlignes den gennemsnitlige hvilepuls blandt personer der har hhv. ikke har applikationen. Hvilkepuls n Gns. Std.afv. Har applikationen 29 66 7,3 Har den ikke 31 70 5,5 Er det to afhængige eller uafhængige stikprøver? 4 4

Sml. af gns. fra to uafhængige stikprøver Forudsætninger En signifikanstest forudsætter, at data er skabt ved simpel tilfældig udvælgelse. Andre forudsætninger kan vedrøre Stikprøvestørrelsen F.eks. forudsætter teststørrelsen z, at n > 30. Teststørrelsen t minder meget om z og anvendes, når n<30. Populationens fordeling F.eks. forudsætter teststørrelsen t, at popula-tionen er normalfordelt.Det gør z ikke, men z kræver, at n > 30 (hvorfor?) 5 5

Sml. af gns. fra to uafhængige stikprøver 2. Hypoteser Nulhypotesen er hypotesen om “ingen forskel” eller “ingen effekt”: H0: (µ1- µ2) =0 idet µ1 = µ2 => µ1- µ2 = 0 Alternativhypotesen er en af følgende: Ha: (µ1- µ2) ≠ 0 (to-sidet test) Ha: (µ1- µ2) < 0 (et-sidet test) Ha: (µ1- µ2) > 0 (et-sidet test) 6 6

Sml. af gns. fra to uafhængige stikprøver 3. Teststørrelse Test af middelværdi i 1 stikprøve Test af middelværdier i 2 uafhængige stikprøver: 7 7

Sml. af gns. fra to uafhængige stikprøver 4. P-værdi: Sandsynligheden for at observere test-størrelsen (hvis nulhypotesen er sand). Sandsynlig-heden findes v.hj.a. Excel. 5. Konklusion: Små P-værdier er beviser mod nulhypotesen H0 (til støtte for Ha). 8 8

Eksempel: Test af gns. fra to uafhængige stikprøver Hvilepuls n Gns. Std.afv. 1. Har applikationen 29 66 7,3 2. Har den ikke 31 70 5,5 Har applikationsbrugere en lavere hvilepuls? Nulhypotesen er “ingen forskel” eller “ingen effekt”: H0: (µ1- µ2) =0 Alternativhypotesen er en lavere hvilepuls: Ha: (µ1- µ2) < 0 Test H0 på et 5% signifikansniveau 9 9

Eksempel: Test af gns. fra to uafhængige stikprøver Hvilepuls n Gns. Std.afv. 1. Har applikationen 29 66 7,3 2. Har den ikke 31 70 5,5 10 10

Eksempel: Test af gns. fra to uafhængige stikprøver 11 11

Eksempel: Test af gns. fra to uafhængige stikprøver Konklusion: P-værdien på 0,0087 er mindre end 5 %. H0 afvises. ”Beviserne” er stærke nok til at konkludere, at der er forskel på den gennemsnitlige hvilepuls for personer med og uden applikationen. I følge testen er der grund til at tro på, at den gennemsnitlige hvilepuls er lavere for personer, der benytter sig af applikationen. Hvad er forskellen på test i en stikprøve og test i to uafhængige stikprøver? 12 12

Opgave: Load tider Efter skift til et nyt webhotel er download tiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt.Downloadtiderne målt i millisekunder fremgår af tabellen. Download tid n Gns. Std.afv. Før 81 110 16 Efter 64 102 17 Er den gns. downloadtid blevet mindre? 13 13

Afhængige stikprøver (dependent samples) Afhængige stikprøver forekommer, når data i stikprøv-erne kan matches parvis. Dvs. at hver person i den ene stikprøve matches direkte med en person i den anden. Eksempel: Der indsamles data om samme person på to forskellige tidspunkter. De to stikprøver består dermed af samme personer (matchende par). Eksempel: Tvillinger ved det klassiske studie af arv og miljø. 14 14

Test af gns. fra to afhængige stikprøver Den statistiske analyse af mobilapplikationen blev gennemført med to uafhængige stikprøver. Den ene gruppe (forsøgsgruppen) benyttede applikationen. Den anden gruppe (kontrolgruppen) benyttede ikke applikationen. Et alternativt design benytter de samme testpersoner i begge stikprøver; først uden og siden med applikationen. Hvorfor denne rækkefølge? Hvilepulsen måles før anvendelse og f.eks. efter en måneds brug. Hvordan tages stikprøven i praksis? 15 15

Eksempel: Test af gns. fra to afhængige stikprøver Data. Benytter testpersonen applikationen? Ja, Nej, D=Diff. Id. J N D 1 69 70 -1 9 68 73 -5 ... 2 66 78 -12 10 67 61 6 3 71 5 11 63 64 4 80 -13 12 56 75 -19 27 60 -7 13 52 -15 28 85 16 76 -9 14 72 29 62 65 -3 7 30 - 8 54 -6 31 16 16

Test af gns. fra to afhængige stikprøver Differencen mellem de to stikprøvers gennemsnit ( – ) er lig gennemsnittet af differencerne, , for de matchende par. Differencen mellem populationernes gennemsnit (µ1 – µ2) er lig parameteret µd, dvs. differencernes populations- gennemsnit. Det statistiske test af de parvise differencer er et special tilfælde af det statistisk test vedrørende en populations gennemsnit, baseret på en enkelt stikprøve. 17 17

Test af gns. fra to afhængige stikprøver Hvad er fordelen ved afhængige stikprøver? Procedure ved sammenligning af gennemsnit i 2 afhængige stikprøver: For hvert matchende par beregnes differencen, d d = (hvilepuls uden applikationen) – (hvilepuls med applikationen) Differencerne kalder vi 18 18

Test af gns. fra to afhængige stikprøver For at teste hypotesen om ens gennemsnit, H0: µ1 = µ2, tester man H0: µd = 0, svarende til differencen (µ1-µ2). Man tester på samme måde som ved en enkelt stikprøve. Teststørrelsen er: 19 19

Test af gns. fra to afhængige stikprøver 1. Forudsætninger Stikprøven er udvalgt simpelt tilfældigt. For n < 30 forudsættes, at populationen er normalfordelt. Dette er vigtigt ved små stikprøver 20 20

Test af gns. fra to afhængige stikprøver 2. Hypoteser H0: µd = 0 (hvilket er dss., at de to populations gennemsnit er ens) Ha: µd < 0 3. Teststørrelse 21 21

Test af gns. fra to afhængige stikprøver 4. Omregning til en P-værdi z = -1,98 P = (z < -1,98) ≈ 2 % 22 22

Test af gns. fra to afhængige stikprøver 5. Konklusion P-værdien er under 5 %, hvorfor nul-hypotesen afvises. Der er gode beviser mod nul-hypotesen, hvorfor den afvises. Der er grund til at tro, at den gennemsnitlige hvilepuls er lavere for brugere af applikationen. 23 23

Opgave: Load tider Efter skift til et nyt webhotel er download tiden på forskellige elementer (tekstsider, billeder, videoer etc.) på en hjemmeside blevet målt.Downloadtiderne målt i millisekunder fremgår af tabellen. Download tid n Gns. Std.afv. Før 81 110 16 Efter 64 102 17 Er den gns. downloadtid blevet mindre? 24 24