Dagens program Test of Independence (chi-i-anden) Videre med projekt 3

Slides:



Advertisements
Lignende præsentationer
Case: Tekst på Call-To-Action link
Advertisements

Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Dagens program Resumé - Normalfordelingen χ2-test (chi-i-anden)
Dagens program Informationer χ2-test (chi-i-anden) Øvelser
Hypotese test – kapitel 6 (Signifikans test)
Repræsentativitet Opsamling fra sidst Repræsentativitet (χ2-test)
Dagens program Kursusevaluering Information Spørgsmål om eksamen
Analyse af kontingenstabeller
Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Statistik og sandsynlighedsregning
Program Informationer χ2-test (chi-i-anden) Projekt 3
Dagens program Informationer Opsamling χ2-test (chi-i-anden)
Anvendt Statistik Lektion 6
Statistik og sandsynlighed
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 6
Statistik og sandsynlighedsregning
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Dagens program 1.Information Hvordan går det med projekt 3 Evaluering 2.Opsamling Hvad er forudsætningerne for kausalitet? 3.Om eksperimenter 4.Variansanalyse,
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Statistik Lektion 6 Konfidensinterval for andele og varians
Program Korrelation Gamma Pearsons r Regression Kausalitet 1.
Sandsynlighedsregning Analyse af kontingenstabeller
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Signifikanstest ved (en eller) to stikprøver
Learning Objectives 5 Steps of a Significance Test Assumptions
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 5. Lektion Log-lineære modeller.
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.
Anvendt Statistik Lektion 7
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri – lektion 7 Multipel Lineær Regression
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Videnskabeligt projekt
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 6
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Dagens program Test of Independence (chi-i-anden) Videre med projekt 3 Teori Regning af opgave 1

Test of Independence Afhænger brugervenligheden, BV, af antal billeder på en hjemmeside? Billeder \ BV Lav BV Middel Høj BV Antal Mange billeder 46% 43% 11% 131 Få billeder 59% 35% 6% 49 Total 49% 41% 10% 180 Tabelopstilling Responsvariablen (den afhængige) sættes i kolonnerne. Den forklarende variabel (den uafhængige) sættes i rækkerne. Beregn betingede procentfordelinger. Vis antallet som procenterne er beregnet på. 2 2

Test of Independence Afhænger brugervenligheden, BV, af antal billeder på en hjemmeside? Definition To variable er uafhængige, hvis de betingede fordelinger er ens (statistisk set) i populationen. To variable er afhængige, hvis de betingede fordelinger afviger betydeligt fra hinanden (statistisk set) i populationen. Tabellen viser resultater fra en stikprøve og de afviger mere eller mindre fra populationens. Billeder \ BV Lav BV Middel Høj BV Antal Mange billeder 46% 43% 11% 131 Få billeder 59% 35% 6% 49 Total 49% 41% 10% 180 3 3

Test of Independence Forudsætninger Hypoteser Simpel tilfældig udvælgelse. Mindst fem forventede observationer i cellerne Hypoteser H0: De to variable er uafhængige Ha: De to variable er afhængige Beregning af teststørrelse Vi kender det observerede antal observationer i hver celle Vi beregner det forventede antal observationer i hver celle for det tilfælde, at de to variable er uafhængige. Billeder \ BV Lav BV Middel Høj BV Total Mange billeder 60 56 15 131 Få billeder 29 17 3 49 89 73 18 180 4 4

Det forventede antal observationer Sandsynligheder P(Mange billeder) = 131/180, P(Få billeder) = 49/180 P(Lav BV) = 89/180, P(Middel) = 73/180, P(Høj BV) = 18/180 Forventede antal observationer P(Mange) x P(Lav BV) x 180 = (131/180) x (89/180) x 180 = (131 x 89) / 180 = 64,77 Hvis de to variable er uafhængige, forventer vi at finde 64,77 ≈ 65 observationer i celle 1 (hvor vi faktisk observerer 60). Generel skivemåde: Billeder \ BV Lav BV Middel Høj BV Total Mange billeder 60 56 15 131 Få billeder 29 17 3 49 89 73 18 180 5 5

Test of Independence 3. Beregning af Chi-i-anden teststørrelsen Chi-i-anden beregnes for hver celle. Chi-i-anden teststørrelsen er summen heraf. Den sammenfatter, hvor langt de faktiske antal ligger fra de forventede antal (nul-hypotesens ”forventning”). χ2 for den første celle: (60 – 64,8) = -4,8 (-4,8)2 = 23,04 23,04 / 64,8 = 0,35 Sum (0,35 +...+ 0,74) = 2,87 Observeret Lav Middel Høj Total Mange billeder 60 56 15 131 Få billeder 29 17 3 49 89 73 18 180 Chi-i-anden Lav Middel Høj Mange 0,35 0,16 0,28 Få billeder 0,94 0,42 0,74 Forventet Lav Middel Høj Total Mange 64,8 53,1 13,1 131 Få 24,2 19,9 4,9 49 89 73 18 180 6

Test of Independence 4. Omregning af teststørrelsen til en P-værdi kræver at vi kender antallet af frihedsgrader, df, (degrees of freedom), i tabellen. Antallet beregnes efter formlen: df = (r-1) x (k-1)=(2-1) x (3-1) = 2. P findes ved opslag i Excel. På dansk hedder funktionen CHI2.FORD.RT. Denne returnerer sandsynligheden i den højre hale (RT=right tail). Dvs. P(X2>obs.værdi), ssh. for den observerede værdi af teststørrelse eller større. Billeder \ BV Lav Middel Høj Antal Mange billeder 46% 43% 11% 131 Få billeder 59% 35% 6% 49 Total 49% 41% 10% 180 7 7

Test of Independence Konklusion: Med P værdi på 24% opretholdes H0. Det vil sige, at brugervenligheden ikke kan formodes at afhænge af billed-brugen. Forskellene i fordelingerne kan skyldes tilfældigheder som følge af stikprøven. Store værdier af χ2 giver små P-værdier. Små P-værdier er beviser mod nul-hypotesen H0. Med en χ2 på 2,87 og 2 frihedsgrader bliver P-værdien 24%. Vi afviser H0, når P er mindre end 5%. I dette tilfælde opretholder vi derfor H0. Hvad sker der med chi-i-anden teststørrelsen, hvis to kolonner byttes om? Hvad forskellen på Goodness of Fit test og Test of Independence? Billeder \ BV Lav Middel Høj Antal Mange billeder 46% 43% 11% 131 Få billeder 59% 35% 6% 49 Total 49% 41% 10% 180 8 8

Opgave i Test of Independence Har personer, der angrer, større risiko for at få hjertesygdomme end personer, der ikke angrer? En undersøgelse har belyst risikoen for en bestemt type hjertesygdom. Hjertesygdom Grad af anger Ja Nej Total Lav 31 3.079 3.110 Middel 63 4.668 4.731 Højt 18 615 633 Opgaver Beregn de betingede fordelinger og beskriv i ord, hvad du ser. Test (slavisk, dvs. i de fem trin) om der er sammenhæng (asso-ciation) mellem responsvariablen og den forklarende variabel. Skriv en konklusion Kilde: http://www.sjsu.edu/faculty/gerstman/StatPrimer/crosstabs-exercises.htm (opgave 10.11, løsning i bunden af siden) 9 9