Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.

Slides:



Advertisements
Lignende præsentationer
Dummyvariabler 13. oktober 2006
Advertisements

KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Gentagne tværsnit og panel data II 9. maj 2007
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 14. april 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Økonometri 1 Gentagne Tværsnit og Paneldata II. Gentagne tværsnit og paneldata II 2 Gentagne tværsnit (W ): Opsamling.  Kombinerer tværsnit indsamlet.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 10. december 2004.
Avancerede Paneldata Metoder I
Økonometri 1: Afslutningsforelæsning1 Økonometri 1 Afslutningsforelæsning 19. maj 2003.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Økonometri 1 Gentagne tværsnit og panel data I 13. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 21. september 2004.
Økonometri 1 Gentagne Tværsnit og Paneldata II 20. november 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
KM2: F151 Kvantitative metoder 2 Funktionel form. Goodness-of-fit. Prediktioner og residualer 26. marts 2007.
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 28. april 2006.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Økonometri – lektion 8 Multipel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
Økonometri 1 Avancerede Paneldata Metoder II. 2 Paneldata metoder Sidste gang: Paneldata med to eller flere perioder og ”fixed effects” estimation. Første-differens.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1 Gentagne tværsnit og panel data I 9. November 2005.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 24. april 2003.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 24. marts 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 7. december 2004.
F18: Avancerede Paneldata Metoder I1 Økonometri 1 Avancerede Paneldata Metoder I 24.november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
Økonometri 1: F71 Økonometri 1 Inferens i den lineære regressionsmodel 29. september 2006.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006

Økonometri 1: F15 2 Program Info om ”prøveeksamen” Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Mere om brug af proxy-variabler Betydning af målefejl Dataudvælgelse:  Manglende observationer  Endogen og eksogen dataudvælgelse  Ekstreme og indflydelsesrige observationer

Økonometri 1: F15 3 Info om ”prøveeksamen” Ugeseddel 10 er en frivillig ”prøveeksamen”. Formål: I får lejlighed til - under eksamensrealistiske forhold - at: Løse en opgave af samme type som eksamensopgaven (men ca. halv størrelse) Afprøve ”infrastrukturen” omkring download og upload af data og programmer Afprøve den computer og SAS-installation som I har tænkt jer at løse eksamensopgaven på Forløb: ”Prøveeksamens”-opgaven udleveres/downloades ved øvelserne i uge 47 (21/11 hhv. 23/11). Opgaven afsluttes ved øvelserne i uge 48. Anbefalet samlet tidsforbrug i løbet af uge 47/48: 10 timer. Besvarelsen skal ikke afleveres, men upload af SAS-programmer og datafiler afprøves. Vejledende besvarelse udleveres på hjemmesiden fredag den 1. december. Opgaven bliver gennemgået ved forelæsningen den 4. december.

Økonometri 1: F15 4 Målefejl Der må ofte antages at være målefejl i økonomiske data Grunde til at målefejl opstår:  Spørgeskemaundersøgelser – retrospektiv information  Præcis information, der svarer til det teoretiske begreb, findes ikke  Tastefejl To hovedtilfælde:  Målefejl i afhængig variabel  Målefejl i forklarende variabler

Økonometri 1: F15 5 Målefejl i den afhængige variabel Antag følgende model Modellen opfylder MLR.1-MLR.4 Desværre observerer man ikke y*, i stedet observeres y hvor kan opfattes som en målefejl For at kunne estimere modellen skal y* erstattes med y:

Økonometri 1: F15 6 Målefejl i den afhængige variabel Fejlleddet i den ”nye” model: Hvornår giver OLS middelrette og konsistente estimater af ? Under antagelserne  Middelværdien af målefejlene er 0  Målefejlene er uafhængige af de forklarende variable vil den ”nye” model med y opfylde MLR.1-MLR.4, og derfor er OLS middelret og konsistent Hvis målefejlene ikke har middelværdi 0, men stadig er uafhængige af de forklarende variabler, vil OLS blot give et skævt estimat af

Økonometri 1: F15 7 Målefejl i den afhængige variabel Variansen i det nye fejlled: Normalt antager man, at variansen af målefejlen er konstant. Så er antagelsen MLR.5 også opfyldt for den ”nye” model... Hvis ikke giver det anledning til heteroskedasticitet Hvis målefejlene og u er ukorrelerede, er variansen Variansen er større med målefejl -> større varians af parameterestimaterne.

Økonometri 1: F15 8 Målefejl i den afhængige variabel Multiplikative målefejl Målefejl som er proportionale med den afhængige variabel Hvis den afhængige variabel transformeres med log fås

Økonometri 1: F15 9 Målefejl i de forklarende variabler Antag følgende model: x* er uobserverbar. I stedet observeres x, som er givet ved Antagelserne om målefejl: x kan opfattes som en proxy for x* OLS er middelret og konsistent

Økonometri 1: F15 10 Målefejl i de forklarende variabler At målefejlen er ukorreleret med det observerede x, er ofte en urealistisk antagelse Klassiske målefejl: Målefejlen er ukorreleret med den sande værdi af variablen. Antagelser: Disse antagelser er ofte mere naturlige. Desværre giver de anledning til alvorlige problemer.

Økonometri 1: F15 11 Målefejl i de forklarende variabler Egenskaber ved OLS estimatoren  OLS ikke konsistent Tavlegennemgang I kapitel 15 ser vi på, hvordan man kan få konsistente estimater når der er målefejl

Økonometri 1: F15 12 Data problemer Indtil nu har vi antaget, at MLR.2 altid er opfyldt Vi har antaget, at data stammer fra en tilfældig stikprøve Der er mange grunde til, at denne antagelse ikke er opfyldt i praksis:  Manglende observationer: Tilfældigt eller ej?  Ikke-tilfældig dataudvælgelse: Exogent eller endogent.

Økonometri 1: F15 13 Manglende observationer Er manglende observationer for en eller flere variabler et problem? Manglende observationer vil reducere antallet af brugbare observationer i analysen Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observationerne mangler Hvis observationerne mangler ”tilfældigt”, er det et mindre problem -> mindre præcise estimater

Økonometri 1: F15 14 Ikke-tilfældig dataudvælgelse Der er forskellige måder hvorpå stikprøven kan være ikke-tilfældig (dvs. antagelse MLR.2 ikke er opfyldt):  Eksogen dataudvælgelse  Endogen dataudvælgelse  Stratificeret dataudvælgelse Det er ikke alle typer af ikke-tilfældig dataudvælgelse, som giver anledning til skæve eller inkonsistente OLS estimater

Økonometri 1: F15 15 Ikke-tilfældig dataudvælgelse Eksogen dataudvælgelse:  Dataudvælgelse baseret på en af de forklarende variabler  Denne type af dataudvælgelse vil (under forudsætninger af nok variation i de forklarende variabler) stadig give middelrette og konsistente OLS etimater  Dataudvælgelse baseret på variabler, som er uafhængige af fejlleddet giver stadig, at OLS estimaterne er middelrette og konsistente

Økonometri 1: F15 16 Ikke-tilfældig dataudvælgelse Endogen dataudvælgelse:  Dataudvælgelse baseret på den afhængige variabel eller variabler, der er korrelerede dermed  Eksempler Formue i model for investeringsstrategier blandt aktieinvestorer (kun baseret på folk med formue under 0,5 mill. kr.) Lønrelationen (kun baseret på folk som arbejder)  OLS estimator er ikke middelret og ikke konsistent

Økonometri 1: F15 17 Ikke-tilfældig dataudvælgelse Stratificeret dataudvælgelse: Populationen er delt i grupper (disjunkte grupper som udgør hele populationen) Nogle af grupperne er udvalgt mere hyppigt end andre, sammenlignet med deres andel af populationen OLS er middelret og konsistent, hvis gruppeopdelingen er baseret på eksogene variabler

Økonometri 1: F15 18 Ekstreme observationer Ekstreme observationer er observationer, som har stor betydning på værdien af OLS estimaterne En ekstrem observation får stor betydning på OLS estimater, da OLS bestemmes ved at minimere de kvadrerede residualer Hvorfor er der ekstreme observationer:  Fejl i data  Enkelte enheder i populationen er meget forskellige fra resten

Økonometri 1: F15 19 Ekstreme observationer Hvad gør man ved ekstreme observationer:  Hvis man er sikker på, at de skyldes fejl i data: Ekstreme observationer udelades  Hvis det ikke er en oplagt fejl, er der ingen nemme løsninger: Estimér modellen med og uden de ekstreme observationer og sammenlign resultaterne Der findes estimatorer, som er mere robuste overfor ekstreme observationer end OLS

Økonometri 1: F15 20 NB’er Målefejl i den afhængige variabel giver oftest anledning til mindre præcis estimation, men berører sædvanligvis ikke konsistensen af OLS estimation. Klassiske målefejl: Mest rimelige antagelse i mange tilfælde. Desværre giver dette tilfælde anledning til alvorlige problemer (inkonsistente OLS estimater). Dataudvælgelse der er baseret på information, der er relateret til den afhængige variabel, giver ofte anledning til bias.

Økonometri 1: F15 21 Næste gang Næste forelæsning er mandag den 13. november Nyt emne: Gentagne tværsnit og paneldata: Kapitel i Wooldridge.