Økonometri 1: Dummy variable

Slides:



Advertisements
Lignende præsentationer
Kvantitative metoder 2 Dummyvariabler 28. marts 2007 KM2: F16.
Advertisements

Dummyvariabler 13. oktober 2006
KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 19. oktober 2004.
Grundlæggende teoretisk statistik
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Statistik Lektion 5 Log-lineære modeller.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Statistik II 5. Lektion Log-lineære modeller.
Økonometri 1 Gentagne tværsnit og panel data I. 2 Gentagne tværsnit og paneldata: Oversigt Observationer over individuelle enheder og tid: Wooldridge.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
KM2: F141 Kvantitative metoder 2 Inferens i den lineære regressionsmodel Funktionel form 21. marts 2007.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Multipel Lineær Regression
Økonometri 1 Gentagne tværsnit og panel data I 13. november 2006.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
KM2: F221 Kvantitative metoder 2 Gentagne tværsnit og panel data I 7. maj 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 7. december 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri 1: F91 Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006.
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 5. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 28. april 2006.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Kvalitative variable 8. marts 2006.
Økonometri 1 Gentagne tværsnit og panel data I 9. November 2005.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 24. marts 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri – lektion 6 Multipel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

Økonometri 1: Dummy variable 17. marts 2003 Økonometri 1: Dummy variable

Økonometri 1: Dummy variable Dagens program Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.1-7.4) HUSK EKSAMENSTILMELDING Kvalitative variable Dummy variable for kvalitative variable med to kategorier Dummy variable for kvalitative variable med flere end to kategorier Interaktionsled med dummy variable Chow testet Økonometri 1: Dummy variable

Økonometri 1: Dummy variable Kvalitative variable Indtil nu har vi (hovedsagligt) set på kvantitative variable (løn, priser, forbrug, indkomst) .. Men hvad med kvalitative variable? Kvalitative variable: Diskrete variable Eksempler: Køn Kommune Sektor Arbejdstid (ikke arbejde, halvtid, fuld tid) Helbred (dårligt, middel, godt) Økonometri 1: Dummy variable

Økonometri 1: Dummy variable Kvalitative variable I nogle tilfælde kan udfaldene af den kvalitative variabel rangordnes. Variablen kaldes så for ordinal Eksempler: arbejdstid og helbred Økonometri 1: Dummy variable

Kvalitative variable med to kategorier For kvalitative variable med to kategorier laves ofte en dummy variabel Dummy variable Diskret variabel Antager kun værdien 0 og 1. Normalt antages værdien 1, når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde ellers 0 Dummy variable benyttes meget i regressionsmodeller Kategorien hvor Dummy = 0 kaldes reference-kategorien Dummy variable kaldes også for indikator variable og binære variable Økonometri 1: Dummy variable

Kvalitative variable med to kategorier Dummy variable kan inkluderes i den multiple regressionsmodel som alm. forklarende variable Eks: lønrelationen hvor kvinde er en dummy variabel Lønforskellen mellem mænd og kvinder (med samme uddannelse og erfaring) og når antagelse MLR 3 er opfyldt Økonometri 1: Dummy variable

Kvalitative variable med to kategorier Fortolkning af parameteren til dummy variablen: Parameteren til dummy variablen måler forskellen mellem de to kategorier Inkludering af en dummy variabel kan grafisk fortolkes som et skift i konstantleddet ..men afkast af de øvrige forklarende variable er de sammen for de to grupper Hvis den afh. var. er lineær -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable) Hvis den afh. var. i log -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable) Vil man have den eksakte procentuelle forskel skal følgende formel anvendes Økonometri 1: Dummy variable

Kvalitative variable med to kategorier Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy for mand? Man kan blot omparametrisere så får man den samme model (Husk ) Begge variable kan ikke inkluderes (hvis der også er et konstantled i modellen) -> Perfekt multikollinaritet Økonometri 1: Dummy variable

Evaluering af programmer Et meget vigtigt eksempel på dummy variable er ”program evaluation” Eks: Effekten af jobtræningskurser Simpel tilfælde: to grupper ”Treatment” (forsøgs-) gruppen: dem som deltager i programmet ”control” (kontrol) gruppen: dem som ikke deltager Parameteren til dummy variablen for ”treatment” gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen (pga. den måde økonomiske data fremkommer) Økonometri 1: Dummy variable

Kvalitative variable med flere end to kategorier Hvad hvis den kvalitative variabel har m kategorier (og m>2) Generelt skal man lave m-1 dummy variable Den kategori hvortil der ikke hører en dummy variabel kaldes reference kategorien Hvis man inkluderer m dummy variable og et konstantled er der perfekt multikollinaritet Parametrene til dummy variablene angiver forskellen mellem den pågældende kategori og reference kategorien Betyder valget af reference kategori noget? Nej, ikke for estimation, prediktioner Ja, fortolkningen af parametrene til dummy variablene afhænger af reference kategorien Økonometri 1: Dummy variable

Kvalitative variable med flere end to kategorier Eksempel: Hvad hvis man brugte dummy variable til at kontrollere for uddannelse Uddannelseskategorier for højeste fuldførte udd.: Folkeskole (udd<=9) 10. klasse (udd=10) Gymnasial ungdomsudd./erhvervsfaglig grundudd. (udd=11,12,13) Videregående uddannelse (udd>13) Model Økonometri 1: Dummy variable

Kvalitative variable med flere end to kategorier (fortsat) Hvilke fordele/ulemper er der ved at bruge dummy variable? Fordele: generelt mere fleksibel form Ulempe: flere variable i regressionen (tab af frihedsgrader) Test for betydning af den kvalitative variabel udføres ved et F-test for at alle parametrene til dummyerne er lig 0 Økonometri 1: Dummy variable

Kvalitative variable med flere end to kategorier (fortsat) Eksempel: sammenligning af effekten af uddannelse Økonometri 1: Dummy variable

Interaktionsled med to dummy variable Interaktionsled med dummy variable er helt analogt til interaktionsled med kvantitative variable og ofte anvendt Eksempel: Arbejdsudbud Denne model er meget restriktiv (urealistisk), fordi man antager, at effekten af børn er uafhængig af køn Denne restriktion kan fjernes ved at introducere et interaktionsled Økonometri 1: Dummy variable

Interaktionsled med to dummy variable Eksempel: lønrelationen – interaktion mellem køn og ægteskabelig status Hvorfor skal ægteskabelig status med i en lønrelation? Skal der en interaktionseffekt mellem køn og ægteskabelig status med? Økonometri 1: Dummy variable

Interaktionsled med dummy variable og kvantitative variable Interaktionsled mellem dummy variable og kvantitative variable kan fortolkes som forskellig effekt (eller afkast) af den kvantitative variabel Grafisk kan det illustreres ved forskellige hældninger (se figur 7.2) Eksempel: Lønrelationen- afkastet af erfaring afhænger af køn Økonometri 1: Dummy variable

Interaktionsled med dummy variable og kvantitative variable Tests Samme afkast af erfaring: Ingen forskel på mænd og kvinder: Økonometri 1: Dummy variable

Økonometri 1: Dummy variable Chow test Test for om der er forskel mellem to grupper Modellen kan formuleres ved brug af dummy’er (d=1 for gruppe 2) Hypotesen kan formuleres som Hvis der er mange forklarende variable kan modellen skrives som hvor g=1,2 (to forskellige grupper) Hypotese k+1 restriktioner Økonometri 1: Dummy variable

Økonometri 1: Dummy variable Chow test (fortsat) Teststørrelsen udregnes ved at lave tre regressioner af y på en konstant og (uden dummy-variable), hvor SSR størrelsen noteres: Regression for gruppe 1 alene -> SSR1 Regression for gruppe 2 alene -> SSR2 Regression for både gruppe 1 og 2 ->SSRP Økonometri 1: Dummy variable

Økonometri 1: Dummy variable Chow test (fortsat) Teststørrelsen Hvor n er det samlede antal obs. (både fra gruppe 1 og 2) k+1 er antal restriktioner Teststørrelsen er F-fordelt med (k+1, n-2(k+1)) frihedsgrader NB: Dette test er det klassiske F-test Økonometri 1: Dummy variable

Økonometri 1: Dummy variable Chow test (fortsat) Eksempel: Lønrelation Grupper: mænd og kvinder Model Teststørrelse (se SAS-output) F-fordelt med (3,1040) frihedsgrader Økonometri 1: Dummy variable