Log lineære modeller for kontingenstabeller Kontingenstabeller Test for uafhængighed af inddelingskriterier Sammenligning med logistisk regression Odds and odds ratios Goodness-of-fit/BIC Log lineære modeller
Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer i klasser givet ved krydstabellering af et antal variable. Tovejs tabel (Powers and Xie side 89): holdning/uddannelseImod sex før ægteskabSex før ægteskab ok Highschool or less college or above
Notation holdning/uddannel se Imod sex før ægteskab Sex før ægteskab ok række total High school or less f_11f_12f_1+=f_11+f_12 College or abovef_21f_22f_2+=f_21+f_22 Søjle totalf_+1=f_11+f_21f_+2=f_12+f_22f_++=f_+1 + f_+2 =f_1+ + f_2+ f_ij: observeret antal i ij’te celle f_i+: observeret antal i i’te række F_ij: forventet antal i ij’te celle (ukendt parameter) F_i+ = F_i1+F_i2: forventet antal i i’te række (ukendt parameter)
Test for uafhængighed
Relation til logistisk regression
X^2 for ens binomialfordelinger: ( )^2/(2063*0.37*0.63)+( )/(1741*0.37*0.63)=55.48 Ex.
Generel to-vejstabel Ækvivalens med logistisk regressionsmodel kun hvis I=2 eller J=2) A/B12…..JTotal (row) 1f_11f_12f_1Jf_1+ 2f_21f_22…f_2Jf_2+ ………f_ij…… If_I1f_I2…f_IJf_I+ Total (column) f_+1f_+2…f_+Jf_++
Eksempel X^2=94.4 (15-6=9 frihedsgrader)
Odds ratios Holdning/uddanNæsten altid imodNogen gange imod Less than HS99141 HS gange 2 undertabel: Estimeret odds ratio for næsten altid versus nogen gange: Less than HS: (99/240)/(141/240)=99/141=0.70 HS: 129/258=0.50 Odds ratio=0.5/0.7=0.71 dvs mindre odds for imod når HS. NB: odds ratio=1 hvis uafhængighed !
Modeller for kontingenstabeller
Ex: likelihood ratio uafh. model vs. mættet model.
Bayesian information criterion Skelne mellem signifikante effekter og relevante effekter ! alle effekter er signifikante når antal observationer er stort nok. BIC=G^2- antal frihedsgrader * log antal obs. Lille værdi af BIC betyder bedre model. Straffer modeller med mange parametre (=lille antal frihedsgrader) og straffer mere hvis mange observationer.
Log lineære modeller
Fortolkning via odds/odds ratios
Eksempel: kørekort vs. antal biler