Repræsentativitet Opsamling fra sidst Repræsentativitet (χ2-test) Chi-i-anden Goodness-of-Fit test Øvelse 1
Population og stikprøve Stikprøveenhed og population En population består af samtlige relevante enheder / objekter, f.eks. personer eller ting, som man vil udtale sig om. Stikprøve En stikprøve er den delmængde af populationen, som rent faktisk deltager i undersøgelsen. Det er ikke nok, at enheden er blevet inviteret/rekrutteret til at deltage. Stikprøveramme En stikprøveramme er det operationelle udtryk for populationen. Hvis en population består af studerende (=stikprøveenhederne) på et hold, kan stikprøverammen være dem, som er til stede i dag. Stikprøven er dem fra stikprøverammen, som jeg får til at svare på undersøgelsen.
Sandsynlighed for krone ved kast med 12 mønter
Undersøgelse af en stikprøves repræsentativitet Land Population, N N i % Stikprøve, n Danmark 2.880 52% 48 Sverige 1.540 28% 30 Norge 1.100 20% 22 Total 5.520 100% 100
Goodness-of-Fit test Forudsætninger Hypoteser Beregning af X2-værdi Simpel tilfældig udvælgelse. Mindst fem forventede observationer i cellerne Hypoteser H0: Observerede = Forventede Ha: Observerede ≠ Forventede Beregning af X2-værdi Vi kender det observerede antal observationer i hver celle Vi beregner det forventede antal observationer i hver celle (= det antal, der vil forekomme, hvis nul hypotesen er sand). Land Forventet Observeret Difference Diff. ^ 2 (Diff. ^ 2) / Forventet Danmark 52 48 4 16 0,31 Sverige 28 30 -2 0,14 Norge 20 22 0,20 Sum 0,65 5
Omregning af Chi-i-anden til en P-værdi 4. Omregning af X2-værdien til en sandsynlighed kræver at vi kender antallet af frihedsgrader, df, (degrees of freedom), i tabellen. Antallet af frihedsgrader i en tabel som ovenstående er lig antal rækker minus 1, dvs. df = antal rækker – 1. Ved opslag i Excel får man arealet (=sandsynligheden) til højre for den observerede teststørrelse. 6 6
Trin 5: Konklusion Store værdier af χ2 svarer til små sandsynligheder. Sandsynligheden for en χ2 på 0,65 eller større er 72% (ved 2 frihedsgrader). Vi afviser, når sandsynligheden er mindre end 5%. I dette tilfælde opretholder vi. Eller mao.: Forskellene i fordelingerne (mellem de faktiske og de forventede) er så små, at det meget vel kan skyldes tilfældigheder som følge af stikprøven. Se mere på www.frividen.dk under matematik og statistik ”Chi i anden test Goodness of fit GOF”. Se også ”Population og stikprøve”. 7 7
Er min stikprøve repræsentativ på landsplan 8 8
Opgave i Godness-of-Fit test ITU studerende, som kommer med en bachelor fra et andet universitet, fordeler sig som følger mht. baggrund: 20% kommer fra naturvidenskabelige uddannelser 40% fra samfundsvidenskabelige uddannelser 40% fra humanistiske uddannelser Der er gennemført en undersøgelse blandt ITU studerende. Stikprøven på 42 studerende har følgende sammensætning: 7 fra naturvidenskabelige uddannelser (17%) 19 fra samfundsvidenskabelige uddannelser (45%) 16 fra humanistiske uddannelser (38%) Er stikprøven repræsentativ for populationen? 9 9