Repetition: likelihood ratio test Test af hvorvidt faktorer med flere end 2 niveauer (mere end 1 parameter) kan udelades fra model: likelihood ratio test.

Slides:



Advertisements
Lignende præsentationer
Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Advertisements

Hypotese test – kapitel 6 (Signifikans test)
Dummyvariabler 13. oktober 2006
Statistik Lektion 18 Multipel Linear Regression
SQL sortering og gruppering. RHS – IT A 2 SQL - sortering Hvis en forespørgsel returnerer mange rækker, kan det være bekvemt at sortere resultatet SQL.
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 19. oktober 2004.
Anvendt Statistik Lektion 6
Logistisk regression Den lineære sandsynlighedsmodel
SPSS II: lineære modeller
Statistik 1 – Lektion 5 By, energi & miljø, forår 2010 v. Morten Skou Nicolaisen.
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Statistik II 5. Lektion Log-lineære modeller.
Binær responsmodeller: Logit og probit 12. maj 2003
Statistik II Lektion 4 Generelle Lineære Modeller
Begreber og Redskaber 5. Plan for idag Overblik over klasser,objekter,nedarvning –Repetition fra Dat A/Indledende programmering –Centrale begreber om.
Anvendt Statistik Lektion 7
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Multipel Lineær Regression
Repetition Fortolkning af odds Test i logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 16 Multipel Lineær Regression
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri – lektion 5 Multipel Lineær Regression
KM2: F151 Kvantitative metoder 2 Funktionel form. Goodness-of-fit. Prediktioner og residualer 26. marts 2007.
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Økonometri – lektion 8 Multipel Lineær Regression
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Statikstik II 3. Lektion Multipel Logistisk regression Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Eksamensopgave i statistik for FSV-kandidatstuderende – maj 2002
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Log lineære modeller for kontingenstabeller Kontingenstabeller Test for uafhængighed af inddelingskriterier Sammenligning med logistisk regression Odds.
Økonometri – lektion 6 Multipel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Log lineære modeller for 3- og flervejskontingenstabeller
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Lineær og logistisk regression - fortsat
Logistisk regression - fortsat
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Log-lineære modeller ● Analyse af symmetriske sammenhænge mellem kategoriske variable. ● Ordinal information ignoreres.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel.
Ellen Holm, Forskningscafé
Analyse af skæve fordelinger med Mplus
Heteroskedasticitet 25. oktober 2005
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 6
Præsentationens transcript:

Repetition: likelihood ratio test Test af hvorvidt faktorer med flere end 2 niveauer (mere end 1 parameter) kan udelades fra model: likelihood ratio test. Likelihood: sandsynlighed for at observere data anskuet som en funktion af de ukendte parametre. Maximum likelihood estimater: de parameter- værdier, som maximerer likelihood-funktionen. Jo større likelihood des bedre passer model til data.

sammenlign maximal likelihood L0 for model uden faktor med maximal likelihood L1 for model indeholdende faktoren. Likelihood ratio L0/L1 mindre end 1 og L0/L1 lille det samme som -2 (log L0- log L1) stor. Dvs. store værdier af -2 (log L0- log L1) kritiske for H0.

Eksempel: coronary heart disease Tilpasser logistisk regression med separat sandsynlighed for chd i hver aldersgruppe. NB: agrp signifikant NB: -2log likelihood for null model og aktuelle model

Goodness of fit Goodness of fit test: H0: “aktuel model passer”. Deviance -2 (log L0-log L1) : sammenligner L0: maximal likelihood under aktuelle model med L1: maximal likelihood for “mættet” model. NB: i dette tilfælde er mættet model=aktuel model dvs. Pearson og Deviance er begge nul.

Model med age som covariate ? Husk: parameterestimater giver logit(p) ! Ex (agrp=5): logit(p5)= = dvs. p5=0.462 Jvf. plots sidste gang kunne det se ud som logit(p) lineær funktion af alder.

Age som covariate NB: her stemmer wald og likelihood ratio overens. NB: odds ratio når alder øges 1 år: exp(0.11)=1.117

Goodness of fit Pas på: mange grupper med kun 1 observation… kan gøre goodness of fit testet upålideligt. Goodness of fit test ikke signifikant – ikke evidens mod aktuelle model.

Model med agrp eller age bedst ? - 2 log likelihood med agrp: log likelihood med age: Men forskellig gruppering (finere gruppering med age!) - 2 loglikelihood med agrp og samme gruppering som for age:

Akaikes Informations Kriterie (AIC) AIC= - 2 log likelihood + 2 * antal parametre Antal parametre: modellens kompleksitet - 2 log likelihood: modellens fit Jo mindre AIC des bedre (godt fit og lille kompleksitet) AIC for agrp model: *8 AIC for age model: *2 Dvs model med age som covariate er at foretrække !

Regressions-modeller: opsummering Typer af variable Lineær/multipel regression Logistisk regression Eksempel

Respons/afhængig variabel Kontinuert/kvantitativ: lineær/multipel regression. Kategorisk/binær: logistisk regression Valg af model afhænger af responsvariablen !

Multipel regression Modellerer den forventede værdi af observationerne: NB: forklarende variable kan både være kategoriske (faktorer) og kontinuerte (kovariater) NB: likelihood ratio tests kaldes F-tests !

Logistisk regression Respons y er binomial fordelt. Modellerer logit til sandsynlighedsparameteren: NB: forklarende variable kan både være kategoriske (faktorer) og kontinuerte (kovariater)

Eksempel: prestige score for arbejde Sociologisk studie fra USA Undersøge respondents arbejdsprestige scores afhængighed af alder og race og køn.

Nogle plots

Model med age som kategorisk Danner kategorisk age-variabel: 60 Slutmodel (efter trinvis modelselektion): sex+race+race*sex

Profil plot

Residual plot Checker om fejl er normalfordelte: Normalfordeling rimelig approximation.