Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.

Slides:



Advertisements
Lignende præsentationer
Kvantitative metoder 2 Dummyvariabler 28. marts 2007 KM2: F16.
Advertisements

Inferens i den lineære regressionsmodel 19. marts 2007
Dummyvariabler 13. oktober 2006
KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 19. oktober 2004.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Økonometri 1 Gentagne tværsnit og panel data I. 2 Gentagne tværsnit og paneldata: Oversigt Observationer over individuelle enheder og tid: Wooldridge.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
KM2: F141 Kvantitative metoder 2 Inferens i den lineære regressionsmodel Funktionel form 21. marts 2007.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Økonometri 1 Gentagne tværsnit og panel data I 13. november 2006.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 1. oktober 2004.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 21. september 2004.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
KM2: F221 Kvantitative metoder 2 Gentagne tværsnit og panel data I 7. maj 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri 1: F91 Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006.
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Kvalitative variable 8. marts 2006.
Økonometri 1: Flere emner i den multiple regressionsmodel1 Økonometri 1 Flere emner i den multiple regressionsmodel 13. marts 2003.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 30. november 2004.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 24. marts 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri – lektion 6 Multipel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: F71 Økonometri 1 Inferens i den lineære regressionsmodel 29. september 2006.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004

Økonometri 1: Dummyvariabler 2 Dagens program Emnet for denne forelæsning er kvalitative egenskaber i den multiple regressionsmodel (Wooldridge kap ) Kvalitative variabler generelt Dummy variable for kvalitative variable med to kategorier Dummy variable for kvalitative variable med flere end to kategorier Interaktionsled med kvantitative variabler Chow test Dummyvariabel som afhængig variabel: Lineær sandsynlighedsmodel

Økonometri 1: Dummyvariabler 3 Interne evalueringer af forelæsninger 5 har svaret på de interne evalueringer!!! Konklusioner:  Studerendes forudsætninger for at følge faget: gode  Pensum: svært/højt fagligt niveau  Forelæsninger: gode  Udbytte af undervisningen: stort Andre kommentarer til forelæsningerne?

Økonometri 1: Dummyvariabler 4 Kvalitative variabler Indtil nu har vi (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst).. Men hvad med kvalitative variabler? Kvalitative variabler:  Diskrete variabler Eksempler:  Køn  Kommune  Sektor  Arbejdstid (ikke arbejde, halvtid, fuld tid)  Helbred (dårligt, middel, godt)

Økonometri 1: Dummyvariabler 5 Kvalitative variabler I nogle tilfælde kan udfaldene af den kvalitative variabel rangordnes. Variablen kaldes så for ordinal Eksempler: arbejdstid og helbred

Økonometri 1: Dummyvariabler 6 Kvalitative variabler med to kategorier For kvalitative variabler med to kategorier laves ofte en dummy variabel Dummy variabler  Diskret variabel  Antager kun værdien 0 og 1. Normalt antages værdien 1, når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde ellers 0  Dummy variable benyttes meget i regressionsmodeller  Kategorien hvor Dummy = 0 kaldes reference-kategorien  Dummy variable kaldes også for indikator variable og binære variable

Økonometri 1: Dummyvariabler 7 Kvalitative variable med to kategorier Dummy variable kan inkluderes i den multiple regressionsmodel som alm. forklarende variable Eks: lønrelationen hvor kvinde er en dummy variabel Lønforskellen mellem mænd og kvinder (med samme uddannelse og erfaring) og når antagelse MLR. 3 er opfyldt

Økonometri 1: Dummyvariabler 8 Kvalitative variable med to kategorier Dummy variable kan inkluderes i den multiple regressionsmodel som alm. forklarende variable Eks: lønrelationen hvor kvinde er en dummy variabel Lønforskellen mellem mænd og kvinder (med samme uddannelse og erfaring) og når antagelse MLR. 3 er opfyldt

Økonometri 1: Dummyvariabler 9 Kvalitative variabler med to kategorier Fortolkning af parameteren til dummy variablen:  Parameteren til dummy variablen måler forskellen mellem de to kategorier  Inkludering af en dummy variabel kan grafisk fortolkes som et skift i konstantleddet ..men afkast af de øvrige forklarende variabler er de sammen for de to grupper  Hvis den afh. var. er lineær -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)  Hvis den afh. var. i log -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)  Vil man have den eksakte procentuelle forskel skal følgende formel anvendes

Økonometri 1: Dummyvariabler 10 Kvalitative variabler med to kategorier Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy for mand? Man kan blot omparametrisere så får man den samme model (Husk ) Begge variable kan ikke inkluderes (hvis der også er et konstantled i modellen) -> Perfekt multikollinaritet

Økonometri 1: Dummyvariabler 11 Evaluering af programmer Et meget vigtigt eksempel på dummy variabler er ”program evaluation” Eks: Effekten af jobtræningskurser Simpelt tilfælde: to grupper  ”Treatment” (forsøgs-) gruppen: dem som deltager i programmet  ”control” (kontrol) gruppen: dem som ikke deltager Parameteren til dummy variablen for ”treatment” gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen (pga. den måde økonomiske data fremkommer)

Økonometri 1: Dummyvariabler 12 Kvalitative variabler med flere end to kategorier Hvad hvis den kvalitative variabel har m kategorier (og m>2)  Generelt skal man lave m-1 dummy variabler  Den kategori hvortil der ikke hører en dummy variabel kaldes reference kategorien  Hvis man inkluderer m dummy variabler og et konstantled er der perfekt multikollinaritet Parametrene til dummy variablerne angiver forskellen mellem den pågældende kategori og reference kategorien Betyder valget af reference kategori noget?  Nej, ikke for estimation, prediktioner  Ja, fortolkningen af parametrene til dummy variablerne afhænger af reference kategorien

Økonometri 1: Dummyvariabler 13 Kvalitative variabler med flere end to kategorier Eksempel: Hvad hvis man brugte dummy variabler til at kontrollere for uddannelse Uddannelseskategorier for højeste fuldførte udd.:  Folkeskole (udd<=9)  10. klasse (udd=10)  Gymnasial ungdomsudd./erhvervsfaglig grundudd. (udd=11,12,13)  Videregående uddannelse (udd>13) Model

Økonometri 1: Dummyvariabler 14 Kvalitative variabler med flere end to kategorier (fortsat) Hvilke fordele/ulemper er der ved at bruge dummy variabler? Fordele: generelt mere fleksibel form Ulempe: flere variabler i regressionen (tab af frihedsgrader) Test for betydning af den kvalitative variabel udføres ved et F-test for at alle parametrene til dummyerne er lig 0

Økonometri 1: Dummyvariabler 15 Kvalitative variable med flere end to kategorier (fortsat) Eksempel: sammenligning af effekten af uddannelse

Økonometri 1: Dummyvariabler 16 Interaktionsled med to dummy variable Interaktionsled med dummy variable er helt analogt til interaktionsled med kvantitative variable og ofte anvendt Eksempel: Arbejdsudbud  Denne model er meget restriktiv (urealistisk), fordi man antager, at effekten af børn er uafhængig af køn  Denne restriktion kan fjernes ved at introducere et interaktionsled

Økonometri 1: Dummyvariabler 17 Interaktionsled med to dummy variable Eksempel: lønrelationen – interaktion mellem køn og ægteskabelig status Hvorfor skal ægteskabelig status med i en lønrelation? Skal der en interaktionseffekt mellem køn og ægteskabelig status med?

Økonometri 1: Dummyvariabler 18 Interaktionsled med dummy variable og kvantitative variable Interaktionsled mellem dummy variable og kvantitative variable kan fortolkes som forskellig effekt (eller afkast) af den kvantitative variabel Grafisk kan det illustreres ved forskellige hældninger (se figur 7.2) Eksempel: Lønrelationen - afkastet af erfaring afhænger af køn

Økonometri 1: Dummyvariabler 19 Interaktionsled med dummy variable og kvantitative variable Tests Samme afkast af erfaring: Ingen forskel på mænd og kvinder:

Økonometri 1: Dummyvariabler 20 Chow test Test for om der er forskel mellem to grupper Modellen kan formuleres ved brug af dummy’er (d=1 for gruppe 2) Hypotesen kan formuleres som Hvis der er mange forklarende variable kan modellen skrives som hvor g=1,2 (to forskellige grupper) Hypotese  k+1 restriktioner

Økonometri 1: Dummyvariabler 21 Chow test (fortsat) Teststørrelsen udregnes ved at lave tre regressioner af y på en konstant og (uden dummy- variabler) SSR størrelsen til hver af de tre regressioner noteres:  Regression for gruppe 1 alene -> SSR 1  Regression for gruppe 2 alene -> SSR 2  Regression for både gruppe 1 og 2 -> SSR P

Økonometri 1: Dummyvariabler 22 Chow test (fortsat) Teststørrelsen  Hvor n er det samlede antal obs. (både fra gruppe 1 og 2)  k+1 er antal restriktioner Teststørrelsen er F-fordelt med (k+1, n-2(k+1)) frihedsgrader NB: Dette test er det klassiske F-test

Økonometri 1: Dummyvariabler 23 Chow test (fortsat) Eksempel: Lønrelation med udd. og erfaring Grupper: Mænd og kvinder Model Teststørrelse (se SAS-output) F-fordelt med (3,1040) frihedsgrader

Økonometri 1: Dummyvariabler 24 Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)? Indtil nu har vi betragtet den afhængige variabel som en kvantitativ variabel (løn, priser, forbrug, indkomst) Afhængige variabel:  Diskret variabel med to værdier Eksempler:  Deltagelse på arbejdsmarkedet eller ej  Bestået et kursus eller ej  Om man har bil eller ej  Videregående udd. eller ej  Har investeret i aktier eller ej  Firma gået konkurs eller ej

Økonometri 1: Dummyvariabler 25 Lineær sandsynlighedsmodel Når den afhængige variabel er en kvalitativ variabel med to kategorier, kan man lave en dummyvariabel: y=0 eller y=1 Regressionsmodellen: Denne model kaldes den lineære sandsynligheds- model (på engelsk: Linear probability model, LPM) Fortolkningen af estimaterne i denne model er anderledes end i den ”alm.” lineære regressionsmodel  Parameteren kan ikke fortolkes som ændringen i y givet en enhedsændring i

Økonometri 1: Dummyvariabler 26 Lineær sandsynlighedsmodel Hvis antagelsen MLR.3 er opfyldt: Er den betingede middelværdi af y For binære variable gælder det Altså Hvor er respons sandsynligheden

Økonometri 1: Dummyvariabler 27 Lineær sandsynlighedsmodel Fortolkning af parameteren i en LPM: Parametrene angiver ændringen i sandsynligheden for y=1 som følge af, at de forklarende variable ændres med en enhed Sandsynligheden for y=0 (betinget på x) kan også udregnes som LPM kan estimeres med OLS Hvor skal fortolkes som den predikterede sandsynlighed (for y=1)

Økonometri 1: Dummyvariabler 28 Lineær sandsynlighedsmodel Ulemper ved LPM: Prediktionerne er ikke 0 eller 1, som de tilladte værdier af den afhængige variabel Predikterede sandsynligheder kan være negative eller overstige 1 Normalt ligger den predikterede sandsynlighed mellem 0 og 1, når man ser på værdier af de forklarende variable der ligger omkring gennemsnittet.

Økonometri 1: Dummyvariabler 29 Lineær sandsynlighedsmodel Gauss Markov antagelserne: MLR.1-4 kan godt være opfyldt for LPM LPM opfylder ikke antagelsen MLR.5 (Homoskedasticitet) Variansen af y betinget på x kan udregnes til Variansen afhænger altså af x

Økonometri 1: Dummyvariabler 30 Lineær sandsynlighedsmodel Egenskaber ved OLS estimatoren i LPM  OLS estimaterne er middelrette (givet MLR.1-4)  Standardfejlene af estimaterne er ikke middelrette  F og t test ikke pålidelige Problemet med heteroskedasticitet kan løses ved at korrigere standardfejlene (dette ser vi på i kap. 8): Sjældent noget alvorligt problem. Problemet med negative ssh. og ssh. over 1 kan kun løses ved at benytte en anden model end LPM. De nye modeller introduceres i økonometri 2

Økonometri 1: Dummyvariabler 31 Næste gang: Tirsdag d. 26/10. Heteroskedasticitet: Kapitel  Robuste test  Test for heteroskedasticitet