Log-lineære modeller ● Analyse af symmetriske sammenhænge mellem kategoriske variable. ● Ordinal information ignoreres.

Slides:

Advertisements

Lignende præsentationer

Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Advertisements

Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Dummyvariabler 13. oktober 2006

Statistik Lektion 18 Multipel Linear Regression

Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Anvendt Statistik Lektion 6

Anvendt Statistik Lektion 9

Anvendt Statistik Lektion 5

Variansanalyse Modelkontrol

Anvendt Statistik Lektion 6

SPSS II: lineære modeller

KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.

Variansanalyse Modelkontrol

Anvendt Statistik Lektion 8

Statistik Lektion 5 Log-lineære modeller.

Anvendt Statistik Lektion 8

Statistik II Lektion 5 Modelkontrol

Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Økonometri 1: Dummy variable

Statistik II 5. Lektion Log-lineære modeller.

Statistik II Lektion 4 Generelle Lineære Modeller

Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.

Anvendt Statistik Lektion 9

Statikstik II 2. Lektion Lidt sandsynlighedsregning

Simpel Lineær Regression

Opsamling Simpel/Multipel Lineær Regression Logistisk Regression

Multipel Lineær Regression

Statikstik II 2. Lektion Lidt sandsynlighedsregning

Statistik Lektion 16 Multipel Lineær Regression

Poissonfordelte observationer Deskriptiv analyse Jens Friis, AAU.

Økonometri – lektion 7 Multipel Lineær Regression

Økonometri – lektion 5 Multipel Lineær Regression

Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.

Økonometri – lektion 8 Multipel Lineær Regression

Anvendt Statistik Lektion 10  Regression med både kvantitative og kvalitative forklarende variable  Modelkontrol 1.

Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.

Simpel Lineær Regression

Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Kvalitative variable 8. marts 2006.

Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.

Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.

Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.

Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.

Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.

Statikstik II 4. Lektion Generelle Lineære Modeller.

Statikstik II 3. Lektion Multipel Logistisk regression Generelle Lineære Modeller.

Statistik II 4. Lektion Logistisk regression.

Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.

Log lineære modeller for kontingenstabeller Kontingenstabeller Test for uafhængighed af inddelingskriterier Sammenligning med logistisk regression Odds.

Økonometri – lektion 6 Multipel Lineær Regression

Log lineære modeller for 3- og flervejskontingenstabeller

Statistik II Lektion 5 Modelkontrol Modelkontrol Modelsøgning Større eksempel.

Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.

Lineær og logistisk regression - fortsat

Logistisk regression - fortsat

Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.

Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.

Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel.

Lineære funktioner og udviklingsforløb. Tillægsspørgsmål  Tillægsspørgsmål 1: En særlig linje er tangenten. Redegør for hvordan man bestemmer tangentligningen.

Ellen Holm, Forskningscafé

Anvendt Statistik Lektion 8

Titel på naturvidenskabsprojekt

Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Niveau 2: Hypotesetestning

Anvendt Statistik Lektion 4

Program – dag 2 (11. april 2011) Dag 2:

Anvendt Statistik Lektion 6

Anvendt Statistik Lektion 3

Titel på videnskabeligt projekt

Videnskabeligt projekt

Videnskabeligt projekt

Præsentationens transcript:

Log-lineære modeller ● Analyse af symmetriske sammenhænge mellem kategoriske variable. ● Ordinal information ignoreres.

Kontingenstabel ● Contingency: mulighed/tilfælde ● Kontingenstabel: antal observationer (frekvenser) i klasser givet ved krydstabullering af et antal variable. ● Tovejs tabel (Powers and Xie side 89): college or above Highschool or less Sex før ægteskab okImod sex før ægteskabholdning/uddannelse Er der en sammenhæng mellem udd. og holdning?

Log-lineær model Antag vi har n personer og to kategoriske variable U og H. Sandsynligheden for at en tilfældig person har holding h og uddannelse u er Den forventede frekvens for U=u og H=h er da

Log-lineær model Generelt antager vi at de log forventede frekvenser er givet ved Som sædvanligt, så er hver kategorisk variabel udstyret med en reference kategori. Parametre der referere til en eller flere reference kategorier er sat lig nul.

Uafhængighed Definitionen på at U og H er uafhængige er at For den log-lineære model betyder det at

Pearson χ 2 -test Optil H 0 hypotese, fx uafhængighed. Lad F uh være de forventede frekvenser under H 0 og f uh være de observerede frekvenser. Da er Pearsons χ 2 -test givet ved Jo større χ 2, jo mindre tror vi på H 0. Som sædvanlig afgør P-værdien/signifikans- sandsynligheden, hvornår χ 2 er ”for stor”.

Modelformel En modelformel er et praktisk alternativ til en matematisk modelformel. Den matematiske formulering har en ækvivalent modelformel: R + C + R*C Da vi overholder det hierarkiske princip kan vi nøjes med at skrive R*C

Modelopbygning ● Først vælger vi variable af interesse. ● Dernæst specificerer vi en startmodel, der overholder det hierarkiske princip. ● Hvis startmodellen indeholder et interaktionsled, hvor alle variable indgår er startmodellen en såkaldt mættet model. ● Herefter tester vi modelled væk under hensynstagen til det hierarkiske princip. ● Vi fjerner det led med størst P-værdi over ● Resultatet kalder vi slutmodellen.

Eksempel Analyse af samvariationen af fire kategoriske variable: ● B:Boligstandard:0=dårlig, 1=acceptabel, 2=god ● H:Helbred:0=godt, 1=dårligt ● I:Isoleret:0=ja, 1=nej ● A:Angst:0=nej, 1=ja

Krydstabel SPSS:analyze – descriptive statistics – crosstabs. H i row, B i column, I i layer 1 og A i layer 2.

Som startmodel bruger vi den mættede model. Matematisk formulering: Modelformel: ABHI

Fortolkning af slutmodel ● Uafhængighed: Hvis A indgår i modelformlen, men A ikke ingår i andre led (fx A*B, A*H*I, osv), så er A uafhængig. ● Forklaret sammenhæng: Hvis B og H ikke indgår i samme led, så er sammenhængen mellem B og H forklaret af andre variable. Dvs. slutmodellen må ikke indeholde B*H, B*H*A, B*H*I og A*B*H*I.

Fortolkning fortsat... ● Homogen sammenhæng: Hvis A*H indgår i modellen, men A*H ikke indgår i mere komplicerede led, så er sammenhængen mellem A og H homogen. Dvs. modellen må ikke indeholde A*H*I, A*B*H, A*B*H*I ● Heterogen sammenhæng: Hvis A*H indgår i modellen som en del af et mere kompliceret led, så er sammenhængen mellem A og H heterogen. Dvs. modellen skal indeholde A*B*I, A*B*H eller A*B*H*I.

Grafisk fortolkning 1) Tegn en cirkel for hver variabel 2) Forbind variable der indgår i samme led ● En isoleret variabel er uafhængig ● To nabo-variable med fælles nabo har en heterogen sammenhæng. ● To nabo-variable uden fælles nabo har en homogen sammenhæng. ● To forbundne ikke-nabo variable har en sammenhæng forklaret af de variable der ligger på ”stier” der forbinder dem.

Eksempel Antag at slutmodellen har modelformelen: A*B + B*H*I Fortolkning: ● Homogen samh. ml. A og B ● Heterogen samh. ml. B og H, B og I, og H og I ● Samh. ml A og I forklaret af B ● Samh. ml. A og H forklaret af B

Modelopbygning i SPSS ● SPSS: Analyze – Loglinear – Model selection... ● Placer relevante (kategoriske) variable under 'Factor' og definer 'Range' for hver (trælst...). ● Under 'Model...' vælg 'Custom' ● Angiv kun de meste komplicerede interaktioner i jeres startmodel (max 5-vejs interaktion). Resten følger af det hierarkiske princip. ● Klik 'OK'

Slutmodel: B*I + H*I + I*A + B*H + B*A + H*A Alle to-vejs interaktioner er med, men ingen tre- vejs interaktioner. Dvs. mellem alle par af variable er der en homogen sammenhæng. Slutmodellen matematisk formuleret:

Parameter estimater + model kontrol ● SPSS: Analyze – Loglinear – General ● Under 'Model' vælg 'Custom' og specificer slutmodellen i fandt med 'Model selection' ● Under 'Options' vælge 'Estimates' ● Alle parametre der refererer til en eller flere reference kategorier er sat til nul. ● Som standard er sidste kategori reference. ● Dvs da B=2 er reference. ● Under 'Options' vælge de to plot for 'Adjusted residuals'

Hvad er den forventede frekvens for kombinationen A=0, B=1, H=0, I=1?

Forventede vs observede frekvenser Ideelt: Expected Counts ≈ Observed Counts

Residualer: Q-Q plot 'Adjusted Residuals' bør være normalfordelte. I såfald vil ”prikkerne” ligge usystematisk omkring en ret linie.