Økonometri 1 Gentagne tværsnit og panel data I 9. November 2005.

Slides:



Advertisements
Lignende præsentationer
Dummyvariabler 13. oktober 2006
Advertisements

KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Gentagne tværsnit og panel data II 9. maj 2007
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 14. april 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Økonometri 1 Gentagne Tværsnit og Paneldata II. Gentagne tværsnit og paneldata II 2 Gentagne tværsnit (W ): Opsamling.  Kombinerer tværsnit indsamlet.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Økonometri 1 Gentagne tværsnit og panel data I. 2 Gentagne tværsnit og paneldata: Oversigt Observationer over individuelle enheder og tid: Wooldridge.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 10. december 2004.
Avancerede Paneldata Metoder I
Økonometri 1: Afslutningsforelæsning1 Økonometri 1 Afslutningsforelæsning 19. maj 2003.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Økonometri 1 Gentagne tværsnit og panel data I 13. november 2006.
KM2: F221 Kvantitative metoder 2 Gentagne tværsnit og panel data I 7. maj 2007.
Økonometri 1 Gentagne Tværsnit og Paneldata II 20. november 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 7. december 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Instrumentvariabel estimation 21. maj 2007
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 28. april 2006.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation III Prøveeksamen 3. maj 2006.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
Økonometri 1 Avancerede Paneldata Metoder II. 2 Paneldata metoder Sidste gang: Paneldata med to eller flere perioder og ”fixed effects” estimation. Første-differens.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 24. april 2003.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 30. november 2004.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 7. december 2004.
Økonometri 1 Avancerede Paneldata Metoder II 23. November 2005.
F18: Avancerede Paneldata Metoder I1 Økonometri 1 Avancerede Paneldata Metoder I 24.november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation IV 10. maj 2006.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

Økonometri 1 Gentagne tværsnit og panel data I 9. November 2005

Gentagne tværsnit og panel data I 2 Oversigt Afrunding af selektion og dataproblemer (kap. 9.4) Observationer over individuelle enheder og tid: Wooldridge kapitel 13 og 14. Uafhængige tværsnit: Sammensætning af observationer over tid (kap ). Paneldata: Følger de samme individer over tid:  To-periode paneldata (W )  Generelt tilfælde: To eller flere perioder Fixed effects estimation (W 13.5, 14.1) Random effects estimation (W 14.2) Fire forelæsninger til at dække disse emner. Ugeseddel 11.

Gentagne tværsnit og panel data I 3 Prøveeksamen Prøveeksamensopgaven udleveres i uge 46 (d. 18/11). Vejledende besvarelse udleveres 29/11 og gennemgås 30/11. Prøveeksamen Eksempel på eksamen (halv størrelse i kap 1-9) Afsæt ca. 10 timer i løbet af uge 47. Opgaven skal ikke afleveres

Gentagne tværsnit og panel data I 4 Data problemer Indtil nu har vi antaget, at MLR 2 altid er opfyldt Dvs. vi har antaget, at data stammer fra en tilfældig stikprøve Der er mange grunde til, at denne antagelse ikke er opfyldt  Manglende observationer  Ikke tilfældige data

Gentagne tværsnit og panel data I 5 Manglende observationer Er manglende observationer for en eller flere variable et problem? Manglende observationer vil reducere antallet af observationer i analysen Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observationerne mangler Hvis observationerne mangler ”tilfældigt”, er det et mindre problem -> mere upræcise estimater

Gentagne tværsnit og panel data I 6 Ikke tilfældig stikprøve Der er forskellige måder hvorpå stikprøven ikke er tilfældig (dvs. antagelse MLR 2 ikke er opfyldt):  Eksogen dataudvælgelse  Endogen dataudvælgelse  Stratificeret dataudvælgelse Det er ikke alle typer af ikke tilfældig dataudvælgelse, som giver anledning til ikke middelrette og ikke konsistente OLS estimater

Gentagne tværsnit og panel data I 7 Ikke tilfældig stikprøve Eksogen dataudvælgelse Dataudvælgelse baseret på en af de forklarende variable Denne type af dataudvælgelse vil under forudsætninger af nok variation i de forklarende variable stadig give middelrette og konsistente OLS etimater Dataudvælgelse baseret på variable, som er uafhængige af fejlleddet, giver stadig, at OLS estimaterne er middelrette og konsistente

Gentagne tværsnit og panel data I 8 Ikke tilfældig stikprøve Endogen dataudvælgelse Dataudvælgelse baseret på den afhængige variabel Eksempler  Formue (kun baseret på folk med en lille formue)  Lønrelationen (kun baseret på folk som arbejder) OLS estimator er ikke middelret og ikke konsistent

Gentagne tværsnit og panel data I 9 Ikke tilfældig stikprøve Stratificeret dataudvælgelse Populationen er delt i grupper (disjunkte grupper som udgør hele populationen) Nogle af grupperne er udvalgt mere hyppigt end andre, sammenlignet med deres andel af populationen OLS er middelret og konsistent, hvis gruppeopdelingen er baseret på eksogene variable

Gentagne tværsnit og panel data I 10 Ekstreme observationer Ekstreme observationer er observationer, som har stor betydning på værdien af OLS estimaterne En ekstrem observation får stor betydning på OLS estimater, da OLS bestemmes ved at minimere de kvadrerede residualer Hvorfor er der ekstreme observationer:  Fejl i data  Enkelte enheder i populationen er meget forskellige fra resten

Gentagne tværsnit og panel data I 11 Ekstreme observationer Hvad gør man ved ekstreme observationer: Hvis man er sikker på, at de skyldes fejl i data, bør de ekstreme observationer udelades Hvis ikke det er en oplagt fejl, er der ingen nemme løsninger  Estimer modellen med og uden de ekstreme observationer  Der findes estimatorer, som er mere robuste overfor ekstreme observationer

Gentagne tværsnit og panel data I 12 Datastrukturer og definitioner Tværsnit (”cross section”): Observationer af et sæt af variabler i en given periode, t, for individuelle enheder i=1,2,…,n: Antager at tværsnittet er en tilfældig stikprøve fra populationen på tidspunkt t To-periode tilfældet:  Periode-1 tværsnit:  Periode-2 tværsnit: Hvad er sammenhængen mellem periode-1 og periode-2 tværsnittene?  Uafhængige tværsnit: To uafhængige tilfældige stikprøver fra populationen: (Generelt) forskellige individer i periode 1 og periode 2.  Panel data: Samme n individer i periode 1 og periode 2.

Gentagne tværsnit og panel data I 13 Gentagne tværsnit Uafhængige tværsnit for to perioder:  Sammensætning af data fra to tværsnit:  En mulighed: Estimation af samlet model:  Alternativt: Se på data i hvert tværsnit for sig:  ”Partial pooling”: Kombinere tværsnit men tillade at koefficienter for visse variabler ændres mellem tværsnittene.

Gentagne tværsnit og panel data I 14 Gentagne tværsnit Tillade at koefficienterne til nogle af variablerne ændres over tid: Et specialtilfælde af strukturelle skift (Ugeseddel 8) Brug dummy variabler (kap. 7): Tidsdummier (fx årsdummier) To perioder: Dummyvariabel (sædvanligvis for periode 2) indeholder information om tidspunkt for observationen: Ofte: Tillad at konstantleddet ændres Tillade at andre koefficienter også kan ændres mellem tværsnit: Interaktionsled.

Gentagne tværsnit og panel data I 15 Gentagne tværsnit: Test Test: Er koefficienten til konstant over tid? Sædvanligt t-test for i Tillad alle koefficienter at ændres over tid: Ingen gevinst fra ”pooling” af tværsnittene Fuldt sæt af interaktionsled i regression: F-test for Nem udgave af F-statistic: SSRs fra poolede og separate regressioner (”Chow test”)

Gentagne tværsnit og panel data I 16 Gentagne tværsnit: Hjemmeopgave Lønregression: Eksempel 13.2 To uafhængige tværsnit: 1978-CPS, 1985-CPS Data for log(wage), educ, exper, expersq, union, female for 1,084 arbejdere. Definer tidsdummy y85 (brug 1978-tværsnit som referencegruppe). Inkluder ovenstående variabler og y85, y85*educ, y85*female Data i CPS78_85 på hjemmesiden. Spørgsmål:  Har ”afkastet af uddannelse” eller ”løngabet” mellem kønnene ændret sig mellem 1978 og 1985?  Chow test af samlet regression: Har det interesse her? Hvorfor (ikke)?

Gentagne tværsnit og panel data I 17 Politikanalyse med gentagne tværsnit Udnytte at vi har information både før og efter et ”politikindgreb”. Eksempel 13.3: Effekt på huspriserne af placeringen af et forbrændingsanlæg (”incinerator”) i et boligkvarter. Hypotese: Placering af et forbrændingsanlæg tæt på huset giver et fald i husprisen, alt andet lige. Data: Priser og karakteristika af huse med forskellig afstand til forbrændingsanlægget. To tværsnit: 1978 og Før og ”efter” bygning af anlægget i 1981.

Gentagne tværsnit og panel data I 18 Politikanalyse med gentagne tværsnit Naiv metode: Brug 1981 tværsnit til estimation af modellen rprice er husets pris (deflateret med et generelt husprisindeks for Boston-området), nearinc er en dummy variabel som antager værdien 1, hvis huset ligger tæt på anlægget, 0 ellers. OLS estimater på grundlag af 1981 tværsnit: Giver det et ”godt” estimat af effekten af, at et hus ligger tæt på forbrændingsanlægget? Nej! Anlægget kan være blevet placeret i et område, hvor husene allerede i 1978 var relativt billige. OLS estimater på grundlag af 1978 tværsnit:

Gentagne tværsnit og panel data I 19 Politikanalyse med gentagne tværsnit ”Differenser-af-differenser” metode:  Huspriserne er steget mellem 1978 og 1981 for de fleste huse i området. Uanset om de ligger tæt på eller fjernt fra den faktiske placering af anlægget.  Relevant spørgsmål: Har ændringen været større for huse, der ligger fjernt fra anlægget?  Vi vil se på forskelle i ”rum” (tæt på/fjernt fra) af forskelle over tid (mellem 1978 og 1981): Diff-in-diff. Ækvivalent regressionstilgang (tavlegennemgang):

Gentagne tværsnit og panel data I 20 Politikanalyse med gentagne tværsnit Model: Fælles ændring over tid (uanset placering) ”Præ-indgreb”-forskellen i huspriser Forskel i huspriser på grund af forbrændingsanlægget Test af hypotesen at anlæggets placering har en negativ betydning for prisen på huse i nærheden:

Gentagne tværsnit og panel data I 21 Politikanalyse med gentagne tværsnit: Eksempel 13.3 KoefficientStandard fejl Simpel model Fuldt sæt af ”kontrolvariabler”

Gentagne tværsnit og panel data I 22 ”Quasi-eksperimenter” og naturlige eksperimenter Efterligne kontrollerede eksperimenter indenfor naturvidenskab ved at se på et indgreb, som sker ”naturligt” for en gruppe af individuelle enheder (personer, familier, firmaer,…), men ikke for en anden. ”Behandlet” (treated) gruppe: Huse tæt på placeringen af forbrændingsanlægget. ”Kontrol” gruppe: Huse der ligger langt fra anlægget. Sammenligning af grupperne før og efter ”indgreb:” ”Treatment” i form af den faktiske placering af forbrændingsanlægget.

Gentagne tværsnit og panel data I 23 Næste gang Onsdag d. 16. november Panel data: Observationer over tid for de samme individuelle enheder. Kap : To-periode paneler Tænk lidt over hjemmeopgaven (ex. 13.2)