Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.

Slides:



Advertisements
Lignende præsentationer
Inferens i den lineære regressionsmodel 19. marts 2007
Advertisements

Dummyvariabler 13. oktober 2006
Heteroskedasticitet 23. oktober 2006
KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Gentagne tværsnit og panel data II 9. maj 2007
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 10. december 2004.
Økonometri 1: Afslutningsforelæsning1 Økonometri 1 Afslutningsforelæsning 19. maj 2003.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 21. september 2004.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri 1: F91 Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006.
KM2: F151 Kvantitative metoder 2 Funktionel form. Goodness-of-fit. Prediktioner og residualer 26. marts 2007.
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 5. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 28. april 2006.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
KM2: F251 Kvantitative metoder 2 Instrumentvariabel estimation 14. maj 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1 Gentagne tværsnit og panel data I 9. November 2005.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 24. april 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 30. november 2004.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 24. marts 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 7. december 2004.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation IV 10. maj 2006.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006

Økonometri 1: F14 2 Program for de to næste forelæsninger Emnet er specifikation og dataproblemer (Wooldridge kap. 9) Fejlleddet kan være korreleret med de forklarende variabler: Endogene regressorer og MLR.4 holder ikke; OLS er hverken middelret eller konsistent. Fokus er her på de forskellige problemtyper og på test. Mulige løsninger i kap Misspecifikation af den funktionelle form Brug af proxy-variabler Betydning af målefejl Dataudvælgelse:  Manglende observationer  Endogen og eksogen dataudvælgelse  Ekstreme og indflydelsesrige observationer

Økonometri 1: F14 3 Funktionel form misspecifikation Hvad nu, hvis man benytter en forkert funktionel form?  Generelt vil OLS estimaterne ikke være middelrette og ikke konsistente  Forkert funktionel form kan opfattes som udeladte variable Eksempel: Antag, at i den sande model er y beskrevet ved et 2. gradspolynomium i x: Antag, vi benytter en lineær funktion i x til estimationen (forkert funktionel form) Det kvadratiske led er en udeladt variabel, som generelt vil give biased estimater

Økonometri 1: F14 4 Funktionel form misspecifikation Lønrelation: Antag at den sande model er Modellen, som estimeres, er OLS estimaterne er ikke middelrette og konsistente Fortolkningen af afkastet af erfaring er forkert  I den sande model:  I den ”forkerte” model”:

Økonometri 1: F14 5 Funktionel form misspecifikation Problemer med funktionel form opstår fordi økonomisk teori ikke giver præcise anvisninger på den funktionelle form Forkert funktionel form:  Den afhængige variabel har forkert funktionel form: Log(y) i stedet for y  Forklarende variabel har forkert funktionel form: Log(x) i stedet for x eller exp(x) i stedet for x mangler Mangler interaktionsled mellem og  Men bemærk: Vi observerer de relevante variabler

Økonometri 1: F14 6 Funktionel form misspecifikation Problem med funktionel misspecifikation betragtes derfor som mindre fatalt end ”ægte” udeladte variabler (som man typisk ikke har information om) I tilfælde med forkert funktionel form har man i princippet mulighed for at opstille den rigtige model Man kan lave forskellige test og grafiske plot, som undersøger for misspecifikation.

Økonometri 1: F14 7 Grafiske undersøgelser af misspecifikation Hvordan undersøger man, om modellen er korrekt specificeret: Estimer modellen med OLS Udregn residualerne Plot residualerne mod de forklarende variabler Kig efter et systematisk mønster i residualerne. I givet fald er der noget som tyder på misspecifikation Grafiske test kan ikke altid afsløre den rigtige specifikation

Økonometri 1: F14 8 Formelle test for misspecifikation af de forklarende variabler Udgangspunkt i at hvis MLR.1- MLR.4 er opfyldt og man tilføjer fx kvadratiske led af regressorerne, bør disse være insignifikante. Generelt kan man approksimere en ukendt funktionel form med et polynomium Antag at modellen er givet ved og opfylder MLR.1-4. Simpelt test: Tilføj kvadratiske led af de forklarende variabler og interaktionsled. Udfør et sædvanligt F-test af deres signifikans: Ej signifikante hvis specifikationen er OK.

Økonometri 1: F14 9 RESET Specialiseret test af funktionel forms misspecifikation: REgresssion Specification Error Test (RESET) Antag: Modellen opfylder MLR.1- MLR.4 I RESET tilføjes et polynomium i de predikterede værdier i y Testet af korrekt funktionel form er et test for hypotesen Teststørrelsen er approx. F-fordelt (2, n-k-3)

Økonometri 1: F14 10 Test af ”ikke-nestede” alternativer ”To nest”: To put inside one another: to nest boxes. Udenfor den almindelige testteori: Model under nulhypo- tesen er ikke specialtilfælde af model under alternativet. Ex. Model 1: Model 2: Tilgang 1: Estimér omfattende model (Mizon og Richard) Her kan vi teste flg. to hypoteser:

Økonometri 1: F14 11 Test af ”ikke-nestede” alternativer Tilgang 2: Tilføje prediktion fra alternativ model (Davidson-MacKinnon) Hjælperegression 1: Hypotese: Hjælperegression 2: Hypotese:

Økonometri 1: F14 12 Test af ”ikke-nestede” alternativer Konklusionen er ikke nødvendigvis entydig. Begge modeller kan blive afvist:  Prøv en tredje funktionel form Ingen af de to modeller kan afvises:  Brug andre kriterier for modelvalg, fx Selvom en model ikke kan afvises, er det ikke nødvendigvis den ”sande” model. Ikke-nestede alternativer med forskellige afhængige variabler er et (endnu mere) kompliceret problem.

Økonometri 1: F14 13 Proxy variabler Proxy variabler kan bruges, når den variabel, som man egentlig er interesseret i at korrigere for (men ikke måle effekten af), er uobserverbar. Proxy variablen indgår som erstatning for den ”sande” variabel. Ideen er at fjerne/-minimere problemet med udeladte variabel bias Eksempler:  Tilbagetrækning fra arbejdsmarkedet: Alder, uddannelse og indkomst som forklarende variabler. Helbred spiller en rolle og”self-reported health status” bruges som proxy  Løn-uddannelses relation: IQ som proxy for ”evner”

Økonometri 1: F14 14 Proxy variabler Tavlegennemgang

Økonometri 1: F14 15 Proxy variabler Eksempel: Lønrelation (på US data) Se tabel 9.2 I alle lønestimationer er der problemer med, at ”evner” ikke er medtaget. Kan være korreleret med både løn, erfaring og uddannelse Giver ikke middelrette/konsistente estimater (specielt problem med uddannelse) IQ bruges som en proxy for evner Resultaterne viser, at estimatet på uddannelse falder, når proxyen medtages Er det som forventet?

Økonometri 1: F14 16 Proxy variabler ”Lagget” variabel som proxy: Sidste periodes værdier I nogle tilfælde kan man kontrollere for udeladte variabler ved at korrigere med laggede værdier af den afhængige variabel Den laggede afhængige variabel kan her opfattes som en proxy for udeladte variabler:  vil være korreleret med de udeladte variabler i sidste periode  må ikke være korreleret med denne periodes fejlled

Økonometri 1: F14 17 NB’er Funktionel form misspecifikation: De relevante variabler er til rådighed, men formen kendes ikke. RESET er et test for misspecifikation af den funktionelle form, ikke for fx ”ægte” udeladte variabler eller for heteroskedasticitet. Proxyvariabler bruges som erstatning for udeladte variabler, men proxyens ”effekt” på y har sjældent nogen selvstændig interesse. Der må argumenteres for proxyvariablens gyldighed i hvert enkelt tilfælde.

Økonometri 1: F14 18 Næste gang Næste forelæsning er fredag den 10. november Mere om kapitel 9:  Målefejl  Dataudvælgelse