Kvantitative metoder 2 Dummyvariabler 28. marts 2007 KM2: F16.

Slides:



Advertisements
Lignende præsentationer
Dummyvariabler 13. oktober 2006
Advertisements

KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 19. oktober 2004.
Grundlæggende teoretisk statistik
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Gentagne tværsnit og panel data II 9. maj 2007
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Statistik 1 – Lektion 5 By, energi & miljø, forår 2010 v. Morten Skou Nicolaisen.
Statistik Lektion 5 Log-lineære modeller.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Statistik II 5. Lektion Log-lineære modeller.
Økonometri 1 Gentagne tværsnit og panel data I. 2 Gentagne tværsnit og paneldata: Oversigt Observationer over individuelle enheder og tid: Wooldridge.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
KM2: F141 Kvantitative metoder 2 Inferens i den lineære regressionsmodel Funktionel form 21. marts 2007.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Forudsigelse i markedsanalyse Burns & Bush ch. 19 Carsten Stig Poulsen Mandag d. 6. april 2009.
Økonometri 1 Gentagne tværsnit og panel data I 13. november 2006.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
KM2: F221 Kvantitative metoder 2 Gentagne tværsnit og panel data I 7. maj 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri 1: F91 Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006.
KM2: F151 Kvantitative metoder 2 Funktionel form. Goodness-of-fit. Prediktioner og residualer 26. marts 2007.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 28. april 2006.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
KM2: F251 Kvantitative metoder 2 Instrumentvariabel estimation 14. maj 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Kvalitative variable 8. marts 2006.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 24. marts 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 7. december 2004.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri – lektion 6 Multipel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

Kvantitative metoder 2 Dummyvariabler 28. marts 2007 KM2: F16

Kvalitative egenskaber og dummyvariabler Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst,…) ... Men hvad med kvalitative egenskaber i regressionsmodellen? Køn Bopælskommune Sektor (offentlig/privat) Arbejdstid (ikke i arbejde, deltid, fuld tid) Helbred (dårligt, middel, godt) I nogle tilfælde kan udfaldene af den kvalitative egenskab rangordnes Kaldes så for ordinal Eksempler: arbejdstid, helbred KM2: F16

Kvalitativ egenskab med to kategorier For kvalitative egenskaber med to kategorier laves ofte en dummyvariabel Dummyvariabler: Diskret variabel Antager kun to værdier. Normalt antages værdien 1, når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde, ellers 0 Kategorien hvor dummy = 0 kaldes reference-kategorien Dummyvariabler for to kategorier kaldes også for indikatorvariabler eller binære variabler KM2: F16

Kvalitativ egenskab med to kategorier Dummyvariabler kan inkluderes i den multiple regressionsmodel som alm. forklarende variabler Eks: lønrelationen hvor kvinde er en dummyvariabel Lønforskellen mellem mænd og kvinder (med samme uddannelse og erfaring) og når antagelse MLR.4 er opfyldt KM2: F16

Eksempel på regressionsanalyse med kvalitativ egenskab: DJØF lønundersøgelse DJØF lavede i 2006 (baseret på september 2005-tal) en undersøgelse, hvor man sammenligner lønniveauet for mænd og kvinder i hhv. den offentlige sektor og den private sektor. ”Ingen kønsmæssig lønforskel i den offentlige sektor: Kvindelige og mandlige djøf’ere i den offentlige sektor har den samme løn, når de er på samme niveau og i samme funktion.” ”Kønsmæssig lønforskel på 4 pct. i den private sektor: Privatansatte kvindelige DJØFere i stillinger uden ledelsesansvar har en løn der udgør ca. 96 pct. af den løn deres mandlige kolleger får. I sammenligningen er der korrigeret for forskelle i ancienniet, uddannelse, branche mv. Selvom man korrigerer for disse forhold, er der således stadig en forskel på ca. 4 pct., der ikke umiddelbart kan forklares.” Se link til undersøgelsen på hjemmesiden. KM2: F16

DJØF lønundersøgelse Analysen laves ved en regressionsanalyse. I analysen blandt ikke-cheferne indgår alle de målelige forhold, der kan inddrages på basis af DJØF Privat’s lønstatistik. Følgende variabler indgår: • Uddannelsesgruppe • Geografi • Kandidatår • Branche • Køn Regressionsanalysen viser, at alle ovennævnte variabler har signifikant betydning for lønnen. Kønnet har altså betydning for lønnen. Betinget af de andre variabler udgør kvindernes løn 96,3 procent af mændenes løn. Når der er korrigeret for de målelige karakteristika, er der stadig en lønforskel på ca. 4 procent der ikke umiddelbart kan forklares. KM2: F16

Kvalitativ egenskab med to kategorier Fortolkning af parameteren til dummyvariablen: Koefficienten til dummyvariablen måler den forventede forskel mellem de to kategorier, alt andet lige Inkludering af en dummyvariabel kan grafisk fortolkes som et skift i konstantleddet ..men koefficienterne til de øvrige forklarende variabler er ens for de to grupper Hvis den afhængige variabel indgår: ”Lineært” (uden transformation) -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable) I logaritmer -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable) Vil man have den eksakte procentuelle forskel skal følgende formel anvendes KM2: F16

Kvalitativ egenskab med to kategorier Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy for mand? Man kan blot omparametrisere så får man den samme model (Husk ) Begge variabler kan ikke inkluderes samtidigt (hvis der også er et konstantled i modellen) -> Perfekt multikollinearitet (”dummyvariabelfælden”) KM2: F16

Evaluering af programmer Et meget vigtigt eksempel på dummyvariabler er ”program evaluering” Eks: Hvad er effekten af et jobtræningskursus? Simpelt tilfælde: to grupper ”Treatment” (forsøgs-) gruppen: dem som deltager i programmet ”Control” (kontrol-) gruppen: dem som ikke deltager Parameteren til dummyvariablen for ”treatment”- gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen (pga. den måde økonomiske data fremkommer) KM2: F16

Kvalitativ egenskab med flere end to kategorier Hvad hvis den kvalitative egenskab har m kategorier (og m>2) ? Generelt skal man lave m-1 dummy variabler Den kategori hvortil der ikke hører en dummy variabel kaldes reference kategorien Hvis man inkluderer m dummy variabler og et konstantled vil der være perfekt multikollinearitet Parametrene til dummy variablerne angiver forskellen mellem den pågældende kategori og referencekategorien Betyder valget af referencekategori noget? Nej, ikke for estimation, prediktioner, etc. Ja, fortolkningen af parametrene til dummyvariablerne afhænger af den konkrete referencekategori, der er valgt. KM2: F16

Kvalitativ egenskab med flere end to kategorier Eksempel: Hvad sker der hvis man bruger dummyvariabler til at kontrollere for uddannelse i lønligningen? Uddannelseskategorier for højeste fuldførte uddannelse: Folkeskole (udd<10) 10. klasse (udd=10) Gymnasial ungdomsudd./erhvervsfaglig grundudd. (udd=11,12,13) Videregående uddannelse (udd>13) m=4 kategorier: Definerer 3 dummyvariabler: Model: KM2: F16

Kvalitativ egenskab med flere end to kategorier Hvilke fordele/ulemper er der ved at bruge dummyvariabler? Fordele: Generelt mere fleksibel form Ulempe: Flere variabler i regressionen (tab af frihedsgrader) Test for betydning af den kvalitative egenskab udføres som et F-test for at alle parametrene til dummyerne er lig 0 KM2: F16

Kvalitativ egenskab med flere end to kategorier Eksempel: Effekten af uddannelse Sammenligning af effekt af uddannelse målt lineært og som fire grupper KM2: F16

NB’er Parameteren til en dummyvariabel måler forskellen til referencekategorien. Valget af referencekategori dikterer fortolkningen af parametre til dummyvariabler. Dummyvariabler kan bruges til at gøre modellen mindre restriktiv: Tillader en mere fleksibel funktionel sammenhæng. KM2: F16

Mandag Resten af kapitel 7: Næste gang: Mandag Resten af kapitel 7: Interaktionsled med dummyvariabler Chow test Lineær sandsynlighedsmodel Obligatorisk opgave 2: På hjemmesiden fredag kl. 14. Introduceres ved forelæsningen mandag. KM2: F16