Log lineære modeller for kontingenstabeller Kontingenstabeller Test for uafhængighed af inddelingskriterier Sammenligning med logistisk regression Odds.

Slides:



Advertisements
Lignende præsentationer
Dummyvariabler 13. oktober 2006
Advertisements

Statistik Lektion 18 Multipel Linear Regression
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 9
Anvendt Statistik Lektion 6
Repetition: likelihood ratio test Test af hvorvidt faktorer med flere end 2 niveauer (mere end 1 parameter) kan udelades fra model: likelihood ratio test.
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Anvendt Statistik Lektion 8
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Statistik II 5. Lektion Log-lineære modeller.
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 1. oktober 2004.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
Kvantitative metoder 2: F21 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 7. februar 2007.
Økonometri – lektion 5 Multipel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 5. oktober 2004.
Økonometri – lektion 8 Multipel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Simpel Lineær Regression
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Kvalitative variable 8. marts 2006.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Statikstik II 4. Lektion Generelle Lineære Modeller.
Statikstik II 3. Lektion Multipel Logistisk regression Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Log lineære modeller for 3- og flervejskontingenstabeller
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Lineær og logistisk regression - fortsat
Logistisk regression - fortsat
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
Log-lineære modeller ● Analyse af symmetriske sammenhænge mellem kategoriske variable. ● Ordinal information ignoreres.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel.
Den multiple regressionsmodel 21. september 2005
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 6
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Log lineære modeller for kontingenstabeller Kontingenstabeller Test for uafhængighed af inddelingskriterier Sammenligning med logistisk regression Odds and odds ratios Goodness-of-fit/BIC Log lineære modeller

Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer i klasser givet ved krydstabellering af et antal variable. Tovejs tabel (Powers and Xie side 89): holdning/uddannelseImod sex før ægteskabSex før ægteskab ok Highschool or less college or above

Notation holdning/uddannel se Imod sex før ægteskab Sex før ægteskab ok række total High school or less f_11f_12f_1+=f_11+f_12 College or abovef_21f_22f_2+=f_21+f_22 Søjle totalf_+1=f_11+f_21f_+2=f_12+f_22f_++=f_+1 + f_+2 =f_1+ + f_2+ f_ij: observeret antal i ij’te celle f_i+: observeret antal i i’te række F_ij: forventet antal i ij’te celle (ukendt parameter) F_i+ = F_i1+F_i2: forventet antal i i’te række (ukendt parameter)

Test for uafhængighed

Relation til logistisk regression

X^2 for ens binomialfordelinger: ( )^2/(2063*0.37*0.63)+( )/(1741*0.37*0.63)=55.48 Ex.

Generel to-vejstabel Ækvivalens med logistisk regressionsmodel kun hvis I=2 eller J=2) A/B12…..JTotal (row) 1f_11f_12f_1Jf_1+ 2f_21f_22…f_2Jf_2+ ………f_ij…… If_I1f_I2…f_IJf_I+ Total (column) f_+1f_+2…f_+Jf_++

Eksempel X^2=94.4 (15-6=9 frihedsgrader)

Odds ratios Holdning/uddanNæsten altid imodNogen gange imod Less than HS99141 HS gange 2 undertabel: Estimeret odds ratio for næsten altid versus nogen gange: Less than HS: (99/240)/(141/240)=99/141=0.70 HS: 129/258=0.50 Odds ratio=0.5/0.7=0.71 dvs mindre odds for imod når HS. NB: odds ratio=1 hvis uafhængighed !

Modeller for kontingenstabeller

Ex: likelihood ratio uafh. model vs. mættet model.

Bayesian information criterion Skelne mellem signifikante effekter og relevante effekter ! alle effekter er signifikante når antal observationer er stort nok. BIC=G^2- antal frihedsgrader * log antal obs. Lille værdi af BIC betyder bedre model. Straffer modeller med mange parametre (=lille antal frihedsgrader) og straffer mere hvis mange observationer.

Log lineære modeller

Fortolkning via odds/odds ratios

Eksempel: kørekort vs. antal biler