Binær responsmodeller: Logit og probit 12. maj 2003 Økonometri 1 Binær responsmodeller: Logit og probit 12. maj 2003 Økonometri 1: Binær responsmodeller: Logit og probit
Økonometri 1: Binær responsmodeller: Logit og probit Plan: Modeller med en binær afhængig variabel: Afsnit 17.1. Sidste gang: Modeller for binær respons (p. 554-557). Link-funktioner: Logistisk, normalfordelt, lineær. Latent variabel motivation. Partielle effekter: Kontinuert/diskret variabel. Maximum likelihood estimation (p. 557-559). I dag: Fortolkning og sammenligning af binær respons modeller (p. 559-565). Respons-sandsynligheder: Ex. 17.1 fortsat Tommelfingerregler for sammenligning mellem modeller Goodness-of-fit Eksempel: Data fra spørgeskemaerne. Økonometri 1: Binær responsmodeller: Logit og probit
Modeller for binær respons variabler Model for kvalitativ variabel med to udfald: Modellerer respons-sandsynligheden: Forklarende variabler indgår som et lineært index: kan indeholde transformationer (log, kvadratiske, interaktionsled,…) Ikke-lineær model (i parameteren ) som følge af funktionsform for (”link-funktionen”). Logit: Probit: Økonometri 1: Binær responsmodeller: Logit og probit
Partielle effekter på respons-sandsynligheden Kontinuert forklarende variabel: Alt-andet-lige effekt af en marginal ændring af på respons-sandsynligheden: Diskret forklarende variabel: øges til : Med udgangspunkt i hvilken værdi af ? Gennemsnit for stikprøven, : Diskrete variabler: Referenceperson (som er velrepræsenteret i stikprøven: kvinde, samlevende, et barn, mellemlang uddannelse,…). Økonometri 1: Binær responsmodeller: Logit og probit
Økonometri 1: Binær responsmodeller: Logit og probit Partielle effekter på respons-sandsynligheden: Sammenligning af modeller Koefficienter i det lineære indeks kan ikke sammenlignes direkte. Ex. Samlevende amerikanske kvinder deltagelse i arbejdsstyrken: Forklaret ved samlevers indkomst, uddannelse, arbejdsmarkedserfaring, alder, (små) børn,…(Ex. 17.1). Fokus: Effekten af småbørn (under skolealder), kidslt6 (antal børn under 6 år), og effekten af samlevers indkomst, nwifeinc. Uddrag af koefficienter i de tre modeller (afh. Variabel: inlf) Variabel Lineær sandsynlighedsm. Logit Probit nwifeinc -0.0034 (0.0015) -0.021 (0.008) -0.012 (0.005) kidslt6 -0.262 (0.034) -1.443 (0.204) -0.868 (0.119) Økonometri 1: Binær responsmodeller: Logit og probit
Partielle effekter på respons-sandsynligheden: Sammenligning (2) Referenceperson: Ex. 17.1. Kvantitative variabler: nwifeinc=20.13, exper=10.6, expersq=112.36, age=42.5 Kvalitative variabler: kidsge6=1, kidslt6=0 P(y=1|x-ref) Lineær sandsynlighedsm. Logit Probit educ=5 0.388 0.320 0.333 educ=12.3 0.665 0.703 0.700 educ=17 0.844 0.870 0.873 Økonometri 1: Binær responsmodeller: Logit og probit
Partielle effekter på respons-sandsynligheden: Sammenligning (3) Referenceperson: nwifeinc=20.13, exper=10.6, expersq=112.36, age=42.5, kidsge6=1, kidslt6=0. Marginal effekt af at øge kontinuert variabel nwifeinc: P(y=1|x) Lineær sandsynlighedsm. Logit Probit educ=5 -0.0034 -0.0046 -0.0044 educ=12.3 -0.0042 educ=17 -0.0024 -0.0025 Økonometri 1: Binær responsmodeller: Logit og probit
Partielle effekter på respons-sandsynligheden: Sammenligning (4) Referenceperson: nwifeinc=20.13, exper=10.6, expersq=112.36, age=42.5, kidsge6=1. Partiel effekt af at øge kidslt6 med 1: LPM Logit Probit Øges fra: educ =5 =12.3 =17 -0.262 -0.220 -0.344 -0.257 -0.235 -0.335 -0.266 1 -0.074 -0.242 -0.341 -0.082 -0.253 -0.332 2 -0.025 -0.191 -0.014 -0.094 -0.204 Økonometri 1: Binær responsmodeller: Logit og probit
Partielle effekter på respons-sandsynligheden: Sammenligning (5) Signifikans: Direkte på Sammenligning mellem logit-og probit-estimater: Skalering Tommelfingerregel: Sammenligningsfaktor: 0.4/0.25 = 1.6. Tommelfingerregel for sammenligning med LPM: Faktor 4 i forhold til logit Faktor 2.5 i forhold til probit I arbejdsudbudseksemplet: Økonometri 1: Binær responsmodeller: Logit og probit
Økonometri 1: Binær responsmodeller: Logit og probit Goodness of fit (1) To mulige udfald: y=1 eller y=0 Prediktion fra logit eller probit model: Pseudo-R2 mål: Sammenlign med model uden forklarende variabler: Reminder: Topunkts-fordelingen: Maximeret log-likelihoodværdi: Økonometri 1: Binær responsmodeller: Logit og probit
Økonometri 1: Binær responsmodeller: Logit og probit Goodness of fit (2) Maximeret log-likelihoodværdi for logit/probit: Pseudo R2 baseret på max log likelihood (LR-index): Egenskaber: Økonometri 1: Binær responsmodeller: Logit og probit
Økonometri 1: Binær responsmodeller: Logit og probit Goodness of fit (3) Andel korrekt predikterede observationer: Optæl korrekt predikterede observationer, dvs. de individer hvor eller Andel ukorrekt predikterede observationer: Økonometri 1: Binær responsmodeller: Logit og probit
Økonometri 1: Binær responsmodeller: Logit og probit Goodness of fit (4) Benchmark for andel korrekt predikterede observationer naiv prediktion): Andel ukorrekt naivt predikterede observationer: Prediktionsbaseret goodness of fit mål: Naiv model har altid mere end 50% korrekte: Ikke altid særligt oplysende mål. Økonometri 1: Binær responsmodeller: Logit og probit
Eksempel: Data fra spørgeskemaerne. Statistiske resultater for binær responsmodeller er asymptotisk begrundede. Konsistens Asymptotisk normalitet af Men vi vil alligevel (forsøgsvist) prøve at se lidt mere på resultater for spørgeskemaerne (n<100). SAS kørsler for spørgeskemadata. Økonometri 1: Binær responsmodeller: Logit og probit
Økonometri 1: Binær responsmodeller: Logit og probit Næste gang: Mandag 19. maj Afslutningsforelæsning. At udføre et empirisk projekt: Kap. 19. Sammenfatning af faget: Ekstern evaluering. Mere eksamensinfo. Økonometri 1: Binær responsmodeller: Logit og probit