Download præsentationen
Præsentation er lastning. Vent venligst
Offentliggjort afBjørn Bendtsen Redigeret for ca. et år siden
1
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005
2
Økonometri 1: Specifikation og dataproblemer 2 Dagens program Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.2-9.4) Proxy variable (kap 9.2) Målefejl (kap 9.3) Manglende observationer Dataudvælgelse Ekstreme observationer
3
Økonometri 1: Specifikation og dataproblemer 3 Proxy variable Proxy variable kan bruges, når den variabel, som man egentlig er interesseret i, er uobserverbar Proxy variablen er så en erstatning for den ”sande” variabel Ideen med at inkludere variablen er at fjerne/minimere problemet med udeladte variable bias Eksempel: Indkomst - helbred
4
Økonometri 1: Specifikation og dataproblemer 4 Proxy variable tavlegennemgang
5
Økonometri 1: Specifikation og dataproblemer 5 Proxy variable Eksempel: Lønrelation (på US data) Se tabel 9.2 I alle lønestimationer er der problemer med, at ”evner” ikke medtaget – altså udeladte variable Dette vil sandsynligvis give ikke middelrette/konsistente estimater (specielt problem med uddannelse) IQ bruges som en proxy for evner Resultaterne viser, at estimatet på uddannelse falder, når proxyen medtages Er det som forventet?
6
Økonometri 1: Specifikation og dataproblemer 6 Proxy variable Opgave Antag at den sande model er Hvordan skal modellen estimeres?
7
Økonometri 1: Specifikation og dataproblemer 7 Proxy Laggede variable som proxy I nogle tilfælde kan man kontrollere for udeladte variable ved at korrigere laggede variable af den afhængige variabel Den laggede afhængige variabel kan opfattes som en proxy for udeladte variable
8
Økonometri 1: Specifikation og dataproblemer 8 Målefejl Der er ofte målefejl i økonomiske data Grunde til at målefejl opstår Spørgeskemaundersøgelser – retrospektiv information Den præcise information findes ikke
9
Økonometri 1: Specifikation og dataproblemer 9 Målefejl i den afhængige variabel Antag følgende model Denne model opfylder MLR 1-MLR 4 Desværre observerer man ikke y*, i stedet observeres y hvor e kan opfattes som en målefejl
10
Økonometri 1: Specifikation og dataproblemer 10 Målefejl i den afhængige variabel For at kunne estimere modellen skal y* erstattes med y: Fejlleddet i den ”nye” model er u+e Denne model kan nu estimeres
11
Økonometri 1: Specifikation og dataproblemer 11 Målefejl i den afhængige variabel Hvornår vil OLS give middelrette og konsistente estimater af ? Under antagelserne Middelværdien af målefejlene er 0 Målefejlene er uafhængige med de øvrige forklarende variable Hvis disse antagelser er opfyldt, vil den ”nye” model med y opfylde MLR1-MLR 4, og derfor er OLS middelret og konsistent
12
Økonometri 1: Specifikation og dataproblemer 12 Målefejl i den afhængige variabel Er det oplagt, at de to antagelser om målefejl er opfyldt? Hvis målefejlene ikke har middelværdi 0, men stadig er uafhængige af de øvrige forklarende variable, vil OLS give et ikke middelret estimat af
13
Økonometri 1: Specifikation og dataproblemer 13 Målefejl i den afhængige variabel Variansen i det nye fejlled Normalt antager man, at variansen af fejlleddet er konstant. Så er antagelsen MLR 5 også opfyldt.. Hvis ikke giver det anledning til heteroskedasticitet Hvis målefejlene og u er uafhængige, er variansen Variansen er større med målefejl -> større varians af parameterestimaterne
14
Økonometri 1: Specifikation og dataproblemer 14 Målefejl i den afhængige variabel Multiplikative målefejl Målefejl som er proportionale med den afhængige variabel Hvis den afhængige variabel transformeres med log fås
15
Økonometri 1: Specifikation og dataproblemer 15 Målefejl i de forklarende variable Antag følgende model x* er uobserverbar, og i stedet observeres x, som er givet ved Antagelserne om målefejl X kan opfattes som en proxy for x* OLS er middelret og konsistent
16
Økonometri 1: Specifikation og dataproblemer 16 Målefejl i de forklarende variable Antagelsen om, at målefejlen er ukorreleret med x, er ofte urealistisk Klassiske målefejl Antagelser Disse antagelser er mere naturlige, når man opfatter
17
Økonometri 1: Specifikation og dataproblemer 17 Målefejl i de forklarende variable Egenskaber ved OLS estimatoren OLS ikke konsistent Bevis (se tavlegennemgang) I kapitel 15 ser man på hvordan man kan få konsistente estimater når der er målefejl
18
Økonometri 1: Specifikation og dataproblemer 18 Data problemer Indtil nu har vi antaget, at MLR 2 altid er opfyldt Dvs. vi har antaget, at data stammer fra en tilfældig stikprøve Der er mange grunde til, at denne antagelse ikke er opfyldt Manglende observationer Ikke tilfældige data
19
Økonometri 1: Specifikation og dataproblemer 19 Manglende observationer Er manglende observationer for en eller flere variable et problem? Manglende observationer vil reducere antallet af observationer i analysen Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observationerne mangler Hvis observationerne mangler ”tilfældigt”, er det et mindre problem -> mere upræcise estimater
20
Økonometri 1: Specifikation og dataproblemer 20 Ikke tilfældig stikprøve Der er forskellige måder hvorpå stikprøven ikke er tilfældig (dvs. antagelse MLR 2 ikke er opfyldt): Eksogen dataudvælgelse Endogen dataudvælgelse Stratificeret dataudvælgelse Det er ikke alle typer af ikke tilfældig dataudvælgelse, som giver anledning til ikke middelrette og ikke konsistente OLS estimater
21
Økonometri 1: Specifikation og dataproblemer 21 Ikke tilfældig stikprøve Eksogen dataudvælgelse Dataudvælgelse baseret på en af de forklarende variable Denne type af dataudvælgelse vil under forudsætninger af nok variation i de forklarende variable stadig give middelrette og konsistente OLS etimater Dataudvælgelse baseret på variable, som er uafhængige af fejlleddet, giver stadig, at OLS estimaterne er middelrette og konsistente
22
Økonometri 1: Specifikation og dataproblemer 22 Ikke tilfældig stikprøve Endogen dataudvælgelse Dataudvælgelse baseret på den afhængige variabel Eksempler Formue (kun baseret på folk med en lille formue) Lønrelationen (kun baseret på folk som arbejder) OLS estimator er ikke middelret og ikke konsistent
23
Økonometri 1: Specifikation og dataproblemer 23 Ikke tilfældig stikprøve Stratificeret dataudvælgelse Populationen er delt i grupper (disjunkte grupper som udgør hele populationen) Nogle af grupperne er udvalgt mere hyppigt end andre, sammenlignet med deres andel af populationen OLS er middelret og konsistent, hvis gruppeopdelingen er baseret på eksogene variable
24
Økonometri 1: Specifikation og dataproblemer 24 Ekstreme observationer Ekstreme observationer er observationer, som har stor betydning på værdien af OLS estimaterne En ekstrem observation får stor betydning på OLS estimater, da OLS bestemmes ved at minimere de kvadrerede residualer Hvorfor er der ekstreme observationer: Fejl i data Enkelte enheder i populationen er meget forskellige fra resten
25
Økonometri 1: Specifikation og dataproblemer 25 Ekstreme observationer Hvad gør man ved ekstreme observationer: Hvis man er sikker på, at de skyldes fejl i data, bør de ekstreme observationer udelades Hvis ikke det er en oplagt fejl, er der ingen nemme løsninger Estimer modellen med og uden de ekstreme observationer Der findes estimatorer, som er mere robuste overfor ekstreme observationer
26
Økonometri 1: Specifikation og dataproblemer 26 Næste gang Onsdag d. 9. november Starter på del 3 i Woodridge: kap 13.1-13.2: Paneldata.
Lignende præsentationer
© 2023 SlidePlayer.dk Inc.
All rights reserved.