KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.

Slides:



Advertisements
Lignende præsentationer
Dummyvariabler 13. oktober 2006
Advertisements

Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Gentagne tværsnit og panel data II 9. maj 2007
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Økonometri 1 Gentagne Tværsnit og Paneldata II. Gentagne tværsnit og paneldata II 2 Gentagne tværsnit (W ): Opsamling.  Kombinerer tværsnit indsamlet.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Økonometri 1: Afslutningsforelæsning1 Økonometri 1 Afslutningsforelæsning 19. maj 2003.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 21. september 2004.
KM2: F261 Kvantitative metoder 2 Instrumentvariabel estimation 16. maj 2007.
KM2: F221 Kvantitative metoder 2 Gentagne tværsnit og panel data I 7. maj 2007.
Økonometri 1 Gentagne Tværsnit og Paneldata II 20. november 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
KM2: F151 Kvantitative metoder 2 Funktionel form. Goodness-of-fit. Prediktioner og residualer 26. marts 2007.
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Instrumentvariabel estimation 21. maj 2007
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 28. april 2006.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Økonometri – lektion 8 Multipel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
KM2: F251 Kvantitative metoder 2 Instrumentvariabel estimation 14. maj 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Kvantitative metoder 2: Inferens i den lineære regressionsmodel1 Kvantitative metoder 2 Inferens i den lineære regressionsmodel 14. marts 2007.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1 Gentagne tværsnit og panel data I 9. November 2005.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 24. april 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 24. marts 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 7. december 2004.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
Økonometri 1: F71 Økonometri 1 Inferens i den lineære regressionsmodel 29. september 2006.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007

KM2: F222 Program Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Betydning af målefejl Dataudvælgelse: –Manglende observationer –Endogen og eksogen dataudvælgelse –Ekstreme og indflydelsesrige observationer Multiple choice: 4 spørgsmål (20 min.).

KM2: F223 Målefejl Der må ofte antages at være målefejl i økonomiske data Mange grunde til at målefejl opstår: –Spørgeskemaundersøgelser – retrospektiv information –Den præcise information, der svarer til det teoretiske begreb, findes ikke –Tastefejl To hovedtilfælde: –Målefejl i afhængig variabel –Målefejl i en eller flere forklarende variabler

KM2: F224 Målefejl i den afhængige variabel Antag følgende model Modellen opfylder MLR.1-MLR.4 Desværre observerer man ikke y*. I stedet observeres y hvor kan opfattes som en målefejl For at kunne estimere modellen skal y* erstattes med y:

KM2: F225 Målefejl i den afhængige variabel Fejlleddet i den ”nye” model: Hvornår giver OLS middelrette og konsistente estimater af ? Under antagelserne –Middelværdien af målefejlene er 0 –Målefejlene er uafhængige af de forklarende variable vil den ”nye” model med y opfylde MLR.1-MLR.4, og derfor er OLS middelret og konsistent. Hvis målefejlene ikke har middelværdi 0, men stadig er uafhængige af de forklarende variabler, vil OLS blot give et skævt estimat af

KM2: F226 Målefejl i den afhængige variabel Variansen i det nye fejlled: Normalt antager man, at variansen af målefejlen er konstant. Så er antagelsen MLR.5 også opfyldt for den ”nye” model. … Hvis ikke giver det anledning til heteroskedasticitet Hvis målefejlene og u er ukorrelerede, er variansen Variansen er større med målefejl -> større varians af parameterestimaterne.

KM2: F227 Målefejl i den afhængige variabel Multiplikative målefejl Målefejl som er proportionale med den afhængige variabel Hvis den afhængige variabel transformeres med log fås

KM2: F228 Målefejl i de forklarende variabler Antag følgende model: x* er uobserverbar. I stedet observeres x, som er givet ved Antagelserne om målefejl: x kan opfattes som en proxy for x* OLS er middelret og konsistent

KM2: F229 Målefejl i de forklarende variabler At målefejlen er ukorreleret med det observerede x, er ofte en urealistisk antagelse Klassiske målefejl: Målefejlen er ukorreleret med den sande værdi af variablen. Antagelser: Disse antagelser er ofte mere naturlige. Desværre giver de anledning til alvorlige problemer.

KM2: F2210 Målefejl i de forklarende variabler Egenskaber ved OLS estimatoren –OLS ikke konsistent Tavlegennemgang I kapitel 15 ser vi på, hvordan man kan få konsistente estimater når der er målefejl

KM2: F2211 Data problemer Indtil videre har vi antaget, at MLR.2 altid er opfyldt Vi har antaget, at data stammer fra en tilfældig stikprøve Der er mange grunde til, at denne antagelse ikke er opfyldt i praksis: –Manglende observationer: Tilfældigt eller ej? –Ikke-tilfældig dataudvælgelse: Exogent eller endogent.

KM2: F2212 Manglende observationer Er manglende observationer for en eller flere variabler et problem? Manglende observationer vil reducere antallet af brugbare observationer i analysen Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observationerne mangler Hvis observationerne mangler ”tilfældigt”, er det et mindre problem -> mindre præcise estimater

KM2: F2213 Ikke-tilfældig dataudvælgelse Der er forskellige måder hvorpå stikprøven kan være ikke-tilfældig (dvs. antagelse MLR.2 ikke er opfyldt): –Eksogen dataudvælgelse –Endogen dataudvælgelse –Stratificeret dataudvælgelse Det er ikke alle typer af ikke-tilfældig dataudvælgelse, som giver anledning til skæve eller inkonsistente OLS estimater

KM2: F2214 Ikke-tilfældig dataudvælgelse Eksogen dataudvælgelse: –Dataudvælgelse baseret på værdien af en af de forklarende variabler –Denne type af dataudvælgelse vil (under forudsætninger af nok variation i de forklarende variabler) stadig give middelrette og konsistente OLS etimater –Generelt: Dataudvælgelse baseret på variabler, som er uafhængige af fejlleddet giver stadig, at OLS estimaterne er middelrette og konsistente

KM2: F2215 Ikke-tilfældig dataudvælgelse Endogen dataudvælgelse: –Dataudvælgelse baseret på den afhængige variabel (eller variabler, der er korrelerede dermed) –Eksempler Formue i model for investeringsstrategier blandt aktieinvestorer (kun baseret på folk med formue under 0,5 mill. kr.) Lønrelationen (kun baseret på folk som arbejder) –OLS estimator er ikke middelret og ikke konsistent

KM2: F2216 Ikke-tilfældig dataudvælgelse Stratificeret dataudvælgelse: Populationen er delt i grupper (disjunkte grupper som udgør hele populationen) Nogle grupper er udvalgt mere hyppigt end andre, sammenlignet med deres andel af populationen OLS er middelret og konsistent, hvis gruppeopdelingen er baseret på eksogene variabler

KM2: F2217 Ekstreme observationer Ekstreme observationer er observationer, som har stor betydning på værdien af OLS estimaterne En ekstrem observation kan få stor betydning på OLS estimaterne, da OLS bestemmes ved at minimere de kvadrerede residualer Hvorfor er der ekstreme observationer: –Fejl i data: Kommafejl (tal i 1000’er i stedet for millioner) –Enkelte enheder i populationen er meget forskellige fra resten: AP Møller Mærsk i en tilfældig stikprøve af danske virksomheder.

KM2: F2218 Ekstreme observationer Hvad gør man ved ekstreme observationer: –Hvis man er sikker på, at de skyldes fejl i data: Ekstreme observationer udelades –Hvis det ikke er en oplagt fejl, er der ingen nemme løsninger: Estimér modellen med og uden de ekstreme observationer og sammenlign resultaterne: Robusthedsanalyse Der findes estimatorer, som i sig selv er mere robuste overfor ekstreme observationer end OLS

KM2: F2219 NB’er Målefejl i den afhængige variabel giver oftest anledning til mindre præcis estimation, men berører sædvanligvis ikke konsistensen af OLS estimation. Klassiske målefejl: Mest rimelige antagelse i mange tilfælde. Desværre giver dette tilfælde anledning til alvorlige problemer (inkonsistente OLS estimater). Dataudvælgelse der er baseret på information, der er relateret til den afhængige variabel, giver ofte anledning til bias.

KM2: F2220 Næste gang Næste forelæsning er mandag den 7. maj Nyt emne: Gentagne tværsnit og paneldata: Kapitel 13 i Wooldridge.