KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.

Slides:



Advertisements
Lignende præsentationer
Dummyvariabler 13. oktober 2006
Advertisements

KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Gentagne tværsnit og panel data II 9. maj 2007
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 14. april 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
KM2: F141 Kvantitative metoder 2 Inferens i den lineære regressionsmodel Funktionel form 21. marts 2007.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Multipel Lineær Regression
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 1. oktober 2004.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
KM2: F261 Kvantitative metoder 2 Instrumentvariabel estimation 16. maj 2007.
Økonometri 1 Gentagne Tværsnit og Paneldata II 20. november 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 7. december 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
KM2: F151 Kvantitative metoder 2 Funktionel form. Goodness-of-fit. Prediktioner og residualer 26. marts 2007.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 28. april 2006.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
KM2: F251 Kvantitative metoder 2 Instrumentvariabel estimation 14. maj 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
F21: Instrumentvariabelestimation III1 Økonometri 1 Instrumentvariabelestimation III 8. december 2006.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 24. april 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 30. november 2004.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 24. marts 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 7. december 2004.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
Økonometri 1: F71 Økonometri 1 Inferens i den lineære regressionsmodel 29. september 2006.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007

KM2: F4 2 Program for næste emne: Den simple regressionsmodel – SLR Regressionsmodel med en forklarende variabel (W.2) F4 (i dag): W2.1-3, App2A  Motivation af lineær regressionsmodel  Udledning af OLS estimatoren  Ex: Løn og uddannelse på danske data F5 & F6 (næste uge): W2.3-6  Funktionel form af variabler i modellen  ”Mekaniske” egenskaber ved OLS estimatoren  Statistiske egenskaber Middelret estimation Variansen på OLS estimatoren Estimator for variansen på OLS estimatoren

KM2: F4 3 Motivation for en simpel regressionsmodel (SLR) Vi vil beskæftige os med modeller, hvor vi ønsker at forklare  variationen i en variabel, y,  med variationen i en anden variabel, x. Eksempler: Hvordan påvirker kunstgødning udbyttet af sojabønner (Ex 1.3)? Hvordan påvirker uddannelsesniveauet timelønnen (Ex. 1.4)? Hvordan afhænger virksomhedens afkast af direktørens løn (Ex. 2.3)?

KM2: F4 4 Motivation (fortsat) Når modellen opstilles må vi forholde os konkret til nogle spørgsmål: Spm. 1: Hvordan forholder vi os til, at x næppe er den eneste faktor, som har betydning for y ? Spm. 2: Hvilken funktionel form kan beskrive sammenhængen mellem y og x ?  Kan y fx beskrives som en lineær funktion af x ? Eller log(x)?  Eller er det bedre at beskrive log(y/1000) som en funktion af x/12? log(x)? Spm. 3: Kan modellen bruges til ceteris paribus fortolkninger?

KM2: F4 5 Definition af SLR Den simple regressionsmodel Kaldes også for den bivariate regressionsmodel y: afhængig variabel x: forklarende variabel u: (uobserveret) fejlled β 0 : konstantled (”intercept”) sjældent fortolkeligt β 1 : hældningskoefficient (”slope”) Konstantleddet og den forklarende variabel kaldes under ét for regressorerne

KM2: F4 6 Definition (fortsat) Når vi opskriver den simple regressionsmodel, besvarer vi implicit spørgsmålene i motivationen: Spm. 1: Andre faktorer: Andre faktorer (end x), som påvirker y: Er indeholdt i fejlleddet u Fejlleddet u indeholder derfor blandt andet:  Udeladte faktorer/variabler  Målefejl Hvad indeholder u i eksemplet med  Uddannelse og løn?  Kunstgødning og høstudbytte?

KM2: F4 7 Definition (fortsat) Spm. 2: Funktionel form: Vi antager, at variablerne er bragt på en form, så y kan beskrives som en lineær funktion af x. En ændring i y kan forklares ved en ændring i x (forudsat Δu=0) Parameteren β 1 angiver hældningskoefficienten for y som funktion af x.

KM2: F4 8 Definition (fortsat) Spm. 3: Ceteris paribus fortolkning af parameter: Vi kan ikke uden videre lave ceteris paribus fortolkninger af parameterne. Fortolkningen af β 1 som effekten af x på y forudsætter at Δu=0. Uddannelse – løn eksemplet: Hvad kan problemet med ceteris paribus antagelsen være ?

KM2: F4 9 Statistiske antagelser for regressionsmodellen Antagelse (2.5) i Wooldridge. Ubetinget middelværdi af u er lig 0 Antagelsen er normalt uproblematisk, så længe det er effekten af x, som er den interessante parameter, og der indgår et konstantled i modellen …men gør også tit fortolkningen af konstantleddet problematisk

KM2: F4 10 Antagelser (fortsat) Antagelse (2.6) i Wooldridge. Den betingede middelværdi af u givet x er lig 0 Denne antagelse er ofte kritisk Lidt om antagelsen (se Appendix B.4):

KM2: F4 11 Antagelser (fortsat) Eksempel: Timeløn og uddannelse Vi har følgende model: Fejlleddet u indeholder blandt andet ”evner”, ”arbejdsiver”, ”arbejdsmoral”. Er følgende antagelsen rimelig?

KM2: F4 12 Eksempel: Timeløn og uddannelse I dette eksempel estimeres en simpel model for timelønnen: Til estimationen benyttes danske registerdata fra Danmarks Statistik. Data består af 2000 tilfældigt udtrukne individer. For disse personer har vi en række oplysninger om arbejdsmarkedsforhold i perioden Datasættet ligger på forelæsningssiden under ”Eksempler”

KM2: F4 13 Eksempel (fortsat) Til analysen benyttes følgende variabler:  Timelønnen beregnet på baggrund af årlig lønindkomst (registreret hos SKAT) divideret med det årlige antal arbejdstimer udregnet på baggrund af ATP indbetalinger  Uddannelse er antallet af års gennemført uddannelse Vi benytter data vedr Data består af personer:  år  Lønmodtagere  Timelønnen er større end 20 kr.

KM2: F4 14 Udledning af OLS estimatoren OLS estimatoren udledes ved hjælp af moment metoden (Method of Moments): KM1, BL.9.10 Ideen med moment metoden illustreres ved et eksempel:  Antag at man har en tilfældig stikprøve af n observationer af en variabel y.  y har en ukendt middelværdi, som man er interesseret i at bestemme. Dvs..  Hvad vil være et naturligt estimat for middelværdien?  Gennemsnittet!! Moment estimation går ud på at erstatte teoretiske ”momenter” med data ”momenter” (her: Gennemsnittet)

KM2: F4 15 Udledning (fortsat) Resten af udledningen af OLS estimatoren foregår som tavlegennemgang

KM2: F4 16 Forudsagte værdier og residualer Forudsagte værdier: Populations regressionsfunktionen Ud fra estimaterne for parametrene kan de forudsagte værdier af y bestemmes: Residualer: Residualerne bestemmes som forskellen mellem den faktiske og forudsagte værdi af y:

KM2: F4 17 Forudsagte værdier og residualer (fortsat) For residualerne (baseret på en OLS estimation med konstantled) gælder følgende sammenhænge mekanisk: Hvorfor er dette ikke så underligt? OLS estimatoren kan ækvivalent opnås ved at minimere residualkvadratsummen: Heraf navnet Ordinary Least Squares: W.App2A: Viser at OLS estimatoren faktisk løser dette minimeringsproblem:  Stikprøvemoment betingelserne er førsteordens-betingelserne for problemet  Andenordens-betingelsen for et minimum er opfyldt.

KM2: F4 18 Eksempel: Timeløn og uddannelse (fortsat) Tag udgangspunkt i den simple model for timelønnen: Hvad sker der, hvis man skifter enhed på den afhængige variabel?  Hvad sker der med estimaterne, hvis timelønnen omregnes til 2000-kr. (dvs. )? Hvad sker der, hvis den forklarende variabel skifter enhed?  Hvad sker der med estimaterne, hvis uddannelse opgøres i antal måneder i stedet for år? Hvad sker der, hvis man erstatter den afhængige variabel med log(timeløn)?

KM2: F4 19 NB’er fra denne forelæsning At skelne mellem  Den simple lineære regressionsligning  Og den regneregel, vi bruger til at opnå et estimat af ligningens koefficienter (her: OLS estimatoren). At skelne mellem  Statistiske antagelser om populationen (fx )  Og de mekaniske egenskaber som fremkommer ved at anvende en given regneregel (her: OLS estimatoren) på data i en given stikprøve. Den forklarende variabel opfattes som udgangspunkt også som en stokastisk variabel

KM2: F4 20 Næste gang Mandag om kapitel  Funktionel form  Statistiske egenskaber: Middelret estimation.