Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.

Lignende præsentationer


Præsentationer af emnet: "Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005."— Præsentationens transcript:

1 Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005

2 Økonometri 1: Inferens i den lineære regressionsmodel 2 Dagens program Goodness of fit (kap. 6.3) Prediktioner (kap 6.4) Kvalitative variable (kap 7.1-7.3)

3 Økonometri 1: Inferens i den lineære regressionsmodel 3 Goodness-of-fit er et mål for modellens forklaringsgrad. Øges når der tilføjes variabler til modellen (med mindre de er perfekt kollineære med eksisterende regressorer). Uegnet til modelvalg. Høj er ikke nødvendig for en brugbar model. Korrigeret, betegnet, ”straffer” for at selvom større modeller tilpasser data bedre, sker dette ved hjælp af flere forklarende variabler. Tæller og nævner korrigeres for frihedsgrader ><

4 Økonometri 1: Inferens i den lineære regressionsmodel 4 Goodness-of-fit (fortsat) Hvis en variabel tilføjes til modellen vil øges hvis og kun hvis variablen har en t-værdi, der (numerisk) overstiger 1. Svarer til at lave et to-sidet signifikanstest med et signifikansniveau over 30 %! bruges i nogle tilfælde til at sammenligne ”ikke- nestede” modeller, hvor den ene model er ikke et specialtilfælde af den anden. Men begrænsninger: Samme venstre-side variabel (samme funktionel form).

5 Økonometri 1: Inferens i den lineære regressionsmodel 5 Goodness-of-fit (fortsat) Hvor mange variabler skal med i modellen?  Overvej hvilke variabler der fortolkningsmæssigt giver mening.  Ofte flere praktiske mål for samme teoretiske størrelse: Problematisk at inkludere flere mål og så lave ”alt-andet-lige” betragtning.  Høj korrelation mellem forklarende variabler giver multikollinearitetsproblem: Svært at skelne effekterne af de enkelte variabler fra hinanden.  Har man mulighed for at tilføje variabler, der er ukorrelerede med de allerede inkluderede, vil det entydigt nedbringe residualvariansen og give mere præcise estimater.

6 Økonometri 1: Inferens i den lineære regressionsmodel 6 Prediktioner (forudsigelser) Punktprediktion fra MLR: Tilpassede værdi: MLR.3: For givne værdier af et estimat af: er en estimator af den sande (men ukendte) middelværdi. For givne værdier af har prediktionen en standardfejl, der er afledt af standardfejlene på OLS estimaterne.

7 Økonometri 1: Inferens i den lineære regressionsmodel 7 Prediktioner (forudsigelser) Udregning af standardfejl på prediktionen:  Metoden beskrevet i Wooldrigde (side 203)  Vha. covariansmatricen (prediktionen er en lineære kombination af parametreestimaterne Kan vises at standardfejlen på prediktionen er mindst når sættes lig deres gennemsnit.

8 Økonometri 1: Inferens i den lineære regressionsmodel 8 Prediktioner (forudsigelser) (fortsat) Ofte af interesse at konstruere et konfidensinterval for en tænkt enhed (husholdning, virksomhed, …) med nogle givne karakteristika: Må også tage højde for variansen af fejlleddet, Prediktionsfejlen er: OLS er middelret og så

9 Økonometri 1: Inferens i den lineære regressionsmodel 9 Prediktioner (forudsigelser) (fortsat) Prediktionsfejlsvariansen: ukorreleret med så variansen splitter op i to komponenter: Vil ofte være domineret af leddet (især for store n) Prediktion af afledte variabler: Fx Y når vi modellerer y=log(Y). Husk at generelt med mindre f( ) er lineær. For log-transformation:

10 Økonometri 1: Inferens i den lineære regressionsmodel 10 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel Wooldridge afsnit 7.1-7.3 Kvalitative variabler generelt Dummy variable for kvalitative variable med to kategorier Dummy variable for kvalitative variable med flere end to kategorier

11 Økonometri 1: Inferens i den lineære regressionsmodel 11 Kvalitative variabler Indtil nu har vi (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst).. Men hvad med kvalitative variabler? Kvalitative variabler:  Diskrete variabler Eksempler:  Køn  Kommune  Sektor  Arbejdstid (ikke arbejde, halvtid, fuld tid)  Helbred (dårligt, middel, godt)

12 Økonometri 1: Inferens i den lineære regressionsmodel 12 Kvalitative variabler I nogle tilfælde kan udfaldene af den kvalitative variabel rangordnes. Variablen kaldes så for ordinal Eksempler: arbejdstid og helbred

13 Økonometri 1: Inferens i den lineære regressionsmodel 13 Kvalitative variabler med to kategorier For kvalitative variabler med to kategorier laves ofte en dummy variabel Dummy variabler  Diskret variabel  Antager kun værdien 0 og 1. Normalt antages værdien 1, når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde ellers 0  Dummy variable benyttes meget i regressionsmodeller  Kategorien hvor Dummy = 0 kaldes reference-kategorien  Dummy variable kaldes også for indikator variable og binære variable

14 Økonometri 1: Inferens i den lineære regressionsmodel 14 Kvalitative variable med to kategorier Dummy variable kan inkluderes i den multiple regressionsmodel som alm. forklarende variable Eks: lønrelationen hvor kvinde er en dummy variabel Lønforskellen mellem mænd og kvinder (med samme uddannelse og erfaring) og når antagelse MLR. 3 er opfyldt

15 Økonometri 1: Inferens i den lineære regressionsmodel 15 Eksempel på regressionsanalyse: Djøf undersøgelse Djøf har d. 8/9 offentlig gjort en undersøgelse hvor man har sammenlignet lønniveauet for mænd og kvinder i den offentlige sektor. ”Ingen kønsmæssig lønforskel i off. Sektor Kvindelige og mandlige djøfere i den offentlige sektor har den samme løn, når de er på samme niveau og i samme funktion.” Se http://www.djoef.dk/online/view_SHTML?ID=6634&a ttr_folder=F http://www.djoef.dk/online/view_SHTML?ID=6634&a ttr_folder=F

16 Økonometri 1: Inferens i den lineære regressionsmodel 16 Kvalitative variabler med to kategorier Fortolkning af parameteren til dummy variablen:  Parameteren til dummy variablen måler forskellen mellem de to kategorier  Inkludering af en dummy variabel kan grafisk fortolkes som et skift i konstantleddet ..men afkast af de øvrige forklarende variabler er de sammen for de to grupper  Hvis den afh. var. er lineær -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)  Hvis den afh. var. i log -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)  Vil man have den eksakte procentuelle forskel skal følgende formel anvendes

17 Økonometri 1: Inferens i den lineære regressionsmodel 17 Kvalitative variabler med to kategorier Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy for mand? Man kan blot omparametrisere så får man den samme model (Husk ) Begge variable kan ikke inkluderes (hvis der også er et konstantled i modellen) -> Perfekt multikollinaritet

18 Økonometri 1: Inferens i den lineære regressionsmodel 18 Evaluering af programmer Et meget vigtigt eksempel på dummy variabler er ”program evaluation” Eks: Effekten af jobtræningskurser Simpelt tilfælde: to grupper  ”Treatment” (forsøgs-) gruppen: dem som deltager i programmet  ”control” (kontrol) gruppen: dem som ikke deltager Parameteren til dummy variablen for ”treatment” gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen (pga. den måde økonomiske data fremkommer)

19 Økonometri 1: Inferens i den lineære regressionsmodel 19 Kvalitative variabler med flere end to kategorier Hvad hvis den kvalitative variabel har m kategorier (og m>2)  Generelt skal man lave m-1 dummy variabler  Den kategori hvortil der ikke hører en dummy variabel kaldes reference kategorien  Hvis man inkluderer m dummy variabler og et konstantled er der perfekt multikollinaritet Parametrene til dummy variablerne angiver forskellen mellem den pågældende kategori og reference kategorien Betyder valget af reference kategori noget?  Nej, ikke for estimation, prediktioner  Ja, fortolkningen af parametrene til dummy variablerne afhænger af reference kategorien

20 Økonometri 1: Inferens i den lineære regressionsmodel 20 Kvalitative variabler med flere end to kategorier Eksempel: Hvad hvis man brugte dummy variabler til at kontrollere for uddannelse Uddannelseskategorier for højeste fuldførte udd.:  Folkeskole (udd<=9)  10. klasse (udd=10)  Gymnasial ungdomsudd./erhvervsfaglig grundudd. (udd=11,12,13)  Videregående uddannelse (udd>13) Model

21 Økonometri 1: Inferens i den lineære regressionsmodel 21 Kvalitative variabler med flere end to kategorier (fortsat) Hvilke fordele/ulemper er der ved at bruge dummy variabler? Fordele: generelt mere fleksibel form Ulempe: flere variabler i regressionen (tab af frihedsgrader) Test for betydning af den kvalitative variabel udføres ved et F-test for at alle parametrene til dummyerne er lig 0

22 Økonometri 1: Inferens i den lineære regressionsmodel 22 Kvalitative variable med flere end to kategorier (fortsat) Eksempel: sammenligning af effekten af uddannelse

23 Økonometri 1: Inferens i den lineære regressionsmodel 23 Næste gang: Husk næste forelæsning er i morgen (onsdag d. 12/10) Mere om kvalitative variable (resten af kap 7) Husk eksamenstilmelding i perioden10/10-30/10 på Punkt KU (se http://www.econ.ku.dk/polit/studerende/eksa men/#tilmelding http://www.econ.ku.dk/polit/studerende/eksa men/#tilmelding Husk kursusevaluering frem til d. 23/10 (se http://www.econ.ku.dk/polit/studerende/eval ) http://www.econ.ku.dk/polit/studerende/eval


Download ppt "Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005."

Lignende præsentationer


Annoncer fra Google