Gentagne tværsnit og panel data II 9. maj 2007 Kvantitative metoder 2 Gentagne tværsnit og panel data II 9. maj 2007 KM2: F24
Gentagne tværsnit og paneldata I dag: To-periode panel data: Følger de samme individer over to perioder (13.3-4) ”Unobserved effects model”: Fejlleddet opdeles i en tids-invariant og en ”idiosynkratisk” effekt Udeladt variabel bias (heterogenitetsbias) Første-differens estimation Politikanalyse med to-periode paneldata KM2: F24
Datastruktur Panel data: Samme n individer i periode 1 og periode 2. Totalt: 2n observationer af n individer Periode 2 kan være flere år (måneder, uger, …) efter periode 1 Kaldes også longitudinale data. Simpelt tilfælde: En regressor. Ønsker at estimere effekten af x på y, alt andet lige. KM2: F24
”Unobserved effects” model Tidsdummy: samme værdi for alle individer (”makroeffekt”) Sammensat fejlled: Uobserveret ”fixed effect” (uobserveret heterogenitet): Tids-invariant Specifik for hvert individ Idiosynkratisk fejl: Varierer tilfældigt både over individer og tid: Det ”sædvanlige” fejlled KM2: F24
Antagelser på modellen for T=2: Tilfældig stikprøve (ingen korrelation mellem individ i og j). Sammensat fejlled: Betinget middelværdi, givet regressorerne og individ-specifik effekt: Implicerer at det ”idiosynkratiske” fejlled er ukorreleret med de observerede regressorer og med den uobserverede individ-specifikke effekt NB: Vi gør ingen antagelser om : ”Fixed effects” tilgang. KM2: F24
Korreleret uobserveret heterogenitet Uobserveret individ-specifik effekt kan meget vel være korreleret med de observerede variabler: ”Pooling” af observationer og estimation med OLS: Vil være en inkonsistent estimator når . Hvis data kun består af et enkelt tværsnit af og kan problemet ikke løses uden yderligere antagelser. Gentagne observationer af samme individer giver mulige løsninger. ”Fixed effect” paneldata løsning: Estimér en model hvor: Parameteren af interesse, , er identificeret og… …”fixed effekten”, , ikke indgår. En metode der opfylder disse betingelser er første-differens (FD) estimation. KM2: F24
Første-differens estimation KM2: F24
Første-differens estimation Mere generelt tilfælde: Flere observerede regressorer. Nogle kan være tids-invariante. KM2: F24
Første-differens estimation KM2: F24
Politikanalyse med paneldata (”programevaluering”) Paneldata kan være endnu mere nyttige for politikanalyse end gentagne tværsnit. Programevaluering: Ønsker at måle effekten af, at et individ deltager i et program ”Aktiv arbejdsmarkedspolitik” program Subsidier for at få virksomheder til at blive mere innovative, mere produktive, begynde at eksportere, …. Effektvariabler: Løn (efter programmet), R&D udgifter, produktivitet, eksport intensitet, … Problem: Individer/virksomheder vælger sig ofte ind i programmet… … Eller de bliver udskrevet til programmet … på grundlag af nogle karakteristika, som kan være relaterede til den variabel, der måler programmets effekt. KM2: F24
Politikanalyse med paneldata Antag at et antal af de observerede individer gennemgår ”programmet” i periode 2, resten gør ikke. Effekten måles fra periode 1 til periode 2. Definerer en ”treatment” dummy: Deltagere ( ) Ikke-deltager ( ) Model: Panel data tillader en fejlledsstruktur: Kontrollerer for tids-invariante karakteristika af deltagere og ikke-deltagere, inklusiv variabler som må formodes at påvirke beslutningen om at deltage i programmet. KM2: F24
Politikanalyse med paneldata Første-differens model: Deltagelse finder kun sted i periode 2 (”før-efter”) så og OLS estimatet bliver Diff-in-diff: Differensen over tid er nu ”indenfor” samme individ. Panelstruktur: Ingen antagelser er nødvendige på Må stadig antage at og er ukorrelerede for at sikre konsistens. KM2: F24
Politikanalyse med paneldata: Eksempel (W s. 468-69) Eksempel: Effekt af subsidier til virksomheders efteruddannelsesprogram Formål: At øge produktiviteten for arbejderne i virksomheden. Effektmål: ”Scrap rate” (andel af produkter med fejl): Mange fejl = lavt gennemsnitligt produktivitetsniveau i virks. i Få fejl = høj produktivitet. Model: Hvordan opnår vi et konsistent estimat af effekten, , af subsidieprogrammet? KM2: F24
Politikanalyse med panel data: Eksempel Problem: Deltagelse i subsidieprogrammet kan være relateret til uobserverede virksomhedseffekter (ledelsesevner, mængden af kapital i virksomheden,…). Uobserverede effekter er potentielt relaterede til produktivitet. OLS på ”pooled” sæt af observationer: Diff-in-diff metode: KM2: F24
Politikanalyse med panel data: Eksempel Er der tegn på heterogenitetsbias her? I hvilken retning er der mest sandsynligt bias? Kan vi sige noget om, hvad der får virksomheder til at vælge at deltage i programmet? KM2: F24
NB’er Paneldata gør det muligt at korrigere for uobserverede individ-specifikke effekter, som er konstante over tid: ”Fixed effects” ”Fixed effects” metoder, fx førstedifferens estimation, kan give konsistente parameterestimater uden antagelser omkring korrelationen mellem den uobserverede individ-specifikke effekt og de observerede forklarende variabler i modellen. ”Fixed effects” metoder identificerer kun koefficienter til variabler, som faktisk varierer over tid (for nogle af individerne). KM2: F24
Næste gang Mandag: Sidste emne i kurset: Instrumentvariabel estimation KM2: F24