Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt χ2-test (chi-i-anden) Goodness-of-Fit test (kan bruges til at undersøge om en stikprøve er repræsentativ) Øvelse (Korrelationskoefficient) 1
Sandsynlighed for krone ved kast med 12 mønter
Population Forsikring Population, N N i % Stikprøve, n Auto 2.880 52% 48 Indbo 1.540 28% 30 Ulykke 1.100 20% 22 Total 5.520 100% 100
Goodness-of-Fit test Forudsætninger Hypoteser Beregning af X2-værdi Simpel tilfældig udvælgelse. Mindst fem forventede observationer i cellerne Hypoteser H0: Observerede = Forventede Ha: Observerede ≠ Forventede Beregning af X2-værdi Vi kender det observerede antal observationer i hver celle Vi beregner det forventede antal observationer i hver celle (= det antal, der vil forekomme, hvis nul hypotesen er sand). Produkt Forventet Observeret Difference Diff. ^ 2 (Diff. ^ 2) / Forventet Auto 52 48 4 16 0,31 Indbo 28 30 -2 0,14 Ulykke 20 22 0,2 Sum 0,65 4
Omregning af Chi-i-anden til en P-værdi 4. Omregning af X2-værdien til en sandsynlighed kræver at vi kender antallet af frihedsgrader, df, (degrees of freedom), i tabellen. Antallet af frihedsgrader i en tabel som ovenstående er lig antal rækker minus 1, dvs. df = antal rækker – 1. Ved opslag i Excel får man arealet (=sandsynligheden) til højre for den observerede teststørrelse. 5 5
Trin 5: Konklusion Store værdier af χ2 svarer til små sandsynligheder. Sandsynligheden for en χ2 på 0,65 eller større er 72% (ved 2 frihedsgrader). Vi afviser, når sandsynligheden er mindre end 5%. I dette tilfælde opretholder vi. Eller mao.: Forskellene i fordelingerne (mellem de faktiske og de forventede) er så små, at det meget vel kan skyldes tilfældigheder som følge af stikprøven. Se mere på www.frividen.dk under matematik og statistik ”Chi i anden test Goodness of fit GOF”. Se også ”Population og stikprøve”. 6 6
Opgave i Godness-of-Fit test ITU studerende, som kommer med en bachelor fra et andet universitet, fordeler sig som følger mht. baggrund: 20% kommer fra naturvidenskabelige uddannelser 40% fra samfundsvidenskabelige uddannelser 40% fra humanistiske uddannelser Der er gennemført en undersøgelse blandt ITU studerende. Stikprøven på 42 studerende har følgende sammensætning: 7 fra naturvidenskabelige uddannelser (17%) 19 fra samfundsvidenskabelige uddannelser (45%) 16 fra humanistiske uddannelser (38%) Er stikprøven repræsentativ for populationen? 7 7