Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.

Lignende præsentationer


Præsentationer af emnet: "Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006."— Præsentationens transcript:

1 Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006

2 Gentagne tværsnit og panel data I 2 Opsamling af selektion, bortfald og ekstreme observationer Dataudvælgelse baseret på:  Variabler, som er uafhængige af fejlleddet: Exogent dataudvalg eller stratificeret dataudvalg. OLS estimaterne er som udgangspunkt middelrette og konsistente  Den afhængige variabel eller andre variabler, der korreleret med fejlleddet: Endogen dataudvælgelse. OLS estimaterne er ikke middelrette eller konsistente  Bortfald (manglende observationer): Afgørende hvorfor observationerne mangler. Ekstreme observationer: Observationer med stor betydning for OLS estimaterne.  Hvis de skyldes fejl i data, bør de ekstreme observationer udelades  Hvis ikke det er en oplagt fejl, er der ingen nemme løsninger Estimer modellen med og uden de ekstreme observationer Robuste estimatorer

3 Gentagne tværsnit og panel data I 3 Gentagne tværsnit og paneldata: Oversigt Observationer over individuelle enheder og tid: Wooldridge kapitel 13 og 14. Uafhængige tværsnit: Sammensætning af observationer over tid (kap. 13.1-2). Paneldata: Følger de samme individer over tid:  To-periode paneldata (W 13.3-4)  Generelt tilfælde: To eller flere perioder Fixed effects estimation (W 13.5, 14.1) Random effects estimation (W 14.2)  Andre datastrukturer (W 14.3) Ugeseddel 11 (startes op i uge 17)

4 Gentagne tværsnit og panel data I 4 Gentagne tværsnit Datastruktur: Slides fra sidste forelæsning Lønregression: Eksempel 13.2 To uafhængige tværsnit: 1978-CPS, 1985-CPS Data for log(wage), educ, exper, expersq, union, female for 1,084 arbejdere. Definer tidsdummy y85 (brug 1978-tværsnit som referencegruppe). Inkluder ovenstående variabler og y85, y85*educ, y85*female Data i CPS78_85 på hjemmesiden. Spørgsmål:  Har ”afkastet af uddannelse” eller ”løngabet” mellem kønnene ændret sig mellem 1978 og 1985?  Chow test af samlet regression: Har det interesse her? Hvorfor (ikke)?

5 Gentagne tværsnit og panel data I 5 Politikanalyse med gentagne tværsnit Udnytte at vi har information både før og efter et ”politikindgreb”. Eksempel 13.3: Effekt på huspriserne af placeringen af et forbrændingsanlæg (”incinerator”) i et boligkvarter. Hypotese: Placering af et forbrændingsanlæg tæt på huset giver et fald i husprisen, alt andet lige. Data: Priser og karakteristika af huse med forskellig afstand til forbrændingsanlægget. To tværsnit: 1978 og 1981. Før og ”efter” bygning af anlægget i 1981.

6 Gentagne tværsnit og panel data I 6 Politikanalyse med gentagne tværsnit Naiv metode: Brug 1981 tværsnit til estimation af modellen rprice er husets pris (deflateret med et generelt husprisindeks for Boston-området), nearinc er en dummy variabel som antager værdien 1, hvis huset ligger tæt på anlægget, 0 ellers. OLS estimater på grundlag af 1981 tværsnit: Giver det et ”godt” estimat af effekten af, at et hus ligger tæt på forbrændingsanlægget? Nej! Anlægget kan være blevet placeret i et område, hvor husene i forvejen (i 1978) var relativt billige. OLS estimater på grundlag af 1978 tværsnit:

7 Gentagne tværsnit og panel data I 7 Politikanalyse med gentagne tværsnit ”Differenser-af-differenser” metode:  Huspriserne er steget mellem 1978 og 1981 for de fleste huse. Uanset om de ligger tæt på eller fjernt fra den faktiske placering af anlægget.  Relevant spørgsmål: Har stigningen været mindre for huse, der ligger tæt på anlægget?  Vi vil se på forskelle i ”rum” (tæt på/fjernt fra) af forskelle over tid (mellem 1978 og 1981): Diff-in-diff. Ækvivalent regressionstilgang (tavlegennemgang):

8 Gentagne tværsnit og panel data I 8 Politikanalyse med gentagne tværsnit Model: Fælles ændring over tid (uanset placering) ”Præ-indgreb”-forskellen i huspriser Forskel i huspriser på grund af forbrændingsanlægget Test af hypotesen om, at bygning af anlægget har en negativ betydning for prisen på huse i nærheden:

9 Gentagne tværsnit og panel data I 9 Politikanalyse med gentagne tværsnit: Eksempel 13.3 KoefficientStandard fejl Simpel model-127.50.17 Fuldt sæt af ”kontrolvariabler” -1450.66

10 Gentagne tværsnit og panel data I 10 ”Quasi-eksperimenter” og naturlige eksperimenter Efterligne kontrollerede eksperimenter indenfor naturvidenskab ved at se på et indgreb, som sker ”naturligt” for en gruppe af individuelle enheder (personer, familier, firmaer,…), men ikke for en anden. ”Behandlet” (treated) gruppe: Huse tæt på placeringen af forbrændingsanlægget. ”Kontrol” gruppe: Huse der ligger langt fra anlægget. Sammenligning af grupperne før og efter ”indgreb:” ”Treatment” i form af den faktiske placering af forbrændingsanlægget.

11 Gentagne tværsnit og panel data I 11 Ny datastruktur: Panel data Panel data: Samme n individer i periode 1 og periode 2.  Periode 1:  Periode 2:  Totalt: 2n observationer af n individer  Periode 2 kan være flere år (måneder, uger, …) efter periode 1 Kaldes også longitudinale data. Simpelt tilfælde: En regressor. Ønsker at estimere effekten af x på y, alt andet lige.

12 Gentagne tværsnit og panel data I 12 ”Unobserved effects” model Model: Tidsdummy: samme værdi for alle individer (”makroeffekt”) Sammensat fejlled: Uobserveret ”fixed effect” (uobserveret heterogenitet):  Tids-invariant  Specifik for hvert individ Idiosynkratisk fejl:  Varierer tilfældigt både over individer og tid: Det ”sædvanlige” fejlled

13 Gentagne tværsnit og panel data I 13 Antagelser på modellen for T=2: Tilfældig stikprøve (ingen korrelation mellem individ i og j). Sammensat fejlled: Betinget middelværdi, givet regressorerne og individ-specifik effekt: Implicerer at det ”idiosynkratiske” fejlled er ukorreleret  med de observerede regressorer  og med den uobserverede individ-specifikke effekt NB: Vi gør ingen antagelser om (indtil videre): ”Fixed effects” tilgang.

14 Gentagne tværsnit og panel data I 14 Korreleret uobserveret heterogenitet Uobserveret individ-specifik effekt kan meget vel være korreleret med de observerede variabler: ”Pooling” af observationer og estimation med OLS: Vil være en inkonsistent estimator når. Hvis data kun består af et enkelt tværsnit af og kan problemet ikke løses uden yderligere antagelser. Gentagne observationer af samme individer giver mulige løsninger. ”Fixed effect” paneldata løsning: Estimér en model hvor:  Parameteren af interesse,, er identificeret og…  …”fixed effekten”,, ikke indgår. En metode der opfylder disse betingelser er første-differens (FD) estimation.

15 Gentagne tværsnit og panel data I 15 Næste gang Fredag d. 7. april. NB! Panel data: Observationer over tid for de samme individuelle enheder. Kap. 13.3-13.4: To-periode paneler Første-differens estimation


Download ppt "Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006."

Lignende præsentationer


Annoncer fra Google