Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.

Slides:



Advertisements
Lignende præsentationer
Dummyvariabler 13. oktober 2006
Advertisements

KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 19. oktober 2004.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Økonometri 1 Gentagne tværsnit og panel data I. 2 Gentagne tværsnit og paneldata: Oversigt Observationer over individuelle enheder og tid: Wooldridge.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
KM2: F141 Kvantitative metoder 2 Inferens i den lineære regressionsmodel Funktionel form 21. marts 2007.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Multipel Lineær Regression
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 1. oktober 2004.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 7. december 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
KM2: F151 Kvantitative metoder 2 Funktionel form. Goodness-of-fit. Prediktioner og residualer 26. marts 2007.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 5. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 28. april 2006.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
KM2: F251 Kvantitative metoder 2 Instrumentvariabel estimation 14. maj 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Simpel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
F21: Instrumentvariabelestimation III1 Økonometri 1 Instrumentvariabelestimation III 8. december 2006.
Økonometri 1: Flere emner i den multiple regressionsmodel1 Økonometri 1 Flere emner i den multiple regressionsmodel 13. marts 2003.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 24. april 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 30. november 2004.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 7. december 2004.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
Økonometri 1: F71 Økonometri 1 Inferens i den lineære regressionsmodel 29. september 2006.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006

Økonometri 1: F2 Dagens program Den simple regressionsmodel – SLR : Én forklarende variabel (Wooldridge kap ) Motivation for gennemgangen af SLR Definition af SLR Antagelser for SLR Udledning af OLS estimatoren (tavlegennemgang) Forudsagte værdier og residualer ”Mekaniske” egenskaber ved OLS estimatoren Eksempel på en simpel regressionsmodel Variablernes enheder

Økonometri 1: F2 Motivation for simpel regressionsmodel (SLR) Vi beskæftiger os med modeller, hvor vi ønsker at forklare y med x. Eksempler: 1. Hvordan påvirker kunstgødning udbyttet af sojabønner (Ex 1.3)? 2. Hvordan påvirker uddannelsesniveauet timelønnen (Ex. 1.4)? 3. Hvordan afhænger virksomhedens afkast af direktørens løn (Ex. 2.3)? Regressionsmodellen vil være den samme som i Teoretisk Statistik. Estimatoren – OLS – er også den samme. De statistiske antagelser for modellen er (lidt) anderledes:  Ofte mere realistiske for økonomiske anvendelser  Grundlag for generalisering/alternativer senere i kurset

Økonometri 1: F2 Motivation (fortsat) Når modellen opstilles, er vi nødt til at forholde os konkret til flg. spørgsmål: Hvad nu, hvis x ikke er den eneste faktor, som har betydning for y ? Hvilken funktionel form kan beskrive sammenhængen mellem y og x ?  Kan y fx beskrives som en lineær funktion af x ? Eller log(x)?  Eller kan y beskrives som en funktion af x? log(x)? Kan modellen bruges til ceteris paribus fortolkninger?

Økonometri 1: F2 Definition af SLR Den simple regressionsmodel Kaldes også for den bivariate regressionsmodel y: afhængig variabel x: forklarende variabel u: (uobserveret) fejlled β 0 : konstantled (intercept) sjældent fortolkeligt β 1 : hældningskoefficient (”slope”) Konstantleddet og den forklarende variabel kaldes under ét regressorerne

Økonometri 1: F2 Definition (fortsat) Når vi opskriver den simple regressionsmodel, besvarer vi implicit spørgsmålene i motivationen: Andre faktorer: Andre faktorer (end x), som påvirker y: Er indeholdt i fejlleddet u Fejlleddet u indeholder derfor:  Udeladte faktorer/variable  Målefejl Hvad indeholder u i eksemplet med uddannelse og løn?

Økonometri 1: F2 Definition (fortsat) Funktionel form: Vi antager, at variablerne er bragt på en form, så y kan beskrives som en lineær funktion af x. En ændring i y kan forklares ved en ændring i x (forudsat Δu=0) Parameteren β 1 angiver hældningskoefficienten for y som funktion af x.

Økonometri 1: F2 Definition (fortsat) Ceteris paribus fortolkning af parameter: Vi kan ikke generelt lave ceteris paribus fortolkninger af parameterne. Fortolkningen af β 1 som effekten af x på y forudsætter at Δu=0. I uddannelse – løn eksemplet, hvad kan problemet med ceteris paribus antagelsen være ?

Økonometri 1: F2 Statistiske antagelser for regressionsmodellen Antagelse 1 - (2.5) i Wooldridge. Middelværdien af u er lig 0 Samme antagelse som i Teoretisk Statistik Antagelsen er normalt uproblematisk, så længe det er effekten af x, som er den interessante parameter, og der er et konstantled i modellen …men gør også tit fortolkningen af konstantleddet problematisk

Økonometri 1: F2 Antagelser (fortsat) Antagelse 2 - (2.6) i Wooldridge. Den betingede middelværdi af u givet x er lig 0 Denne antagelse er ofte kritisk Lidt om antagelsen (se Appendix B.4):

Økonometri 1: F2 Antagelser (fortsat) Teoretisk Statistik Økonometri 1 Antagelse 1E(u)=0 Antagelse 2ax givne (ikke stokastisk) x stokastisk Antagelse 2E(u|x)=E(u) følger af (2a) E(u|x)=E(u) per antagelse

Økonometri 1: F2 Antagelser (fortsat) Eksempel: Timeløn og uddannelse Vi har følgende model: Fejlleddet u indeholder blandt andet ”evner” og ”arbejdsiver”. Er følgende antagelsen rimelig?

Økonometri 1: F2 Udledning af OLS estimatoren OLS estimatoren udledes vha. moment metoden (Method of Moments) Ideen med moment metoden illustreres ved et eksempel:  Antag at man har en tilfældig stikprøve af n observationer af en variabel x.  x har en ukendt middelværdi, som man er interesseret i at bestemme. Dvs..  Hvad vil være et naturligt estimat for middelværdien?  Gennemsnittet!! Moment estimation går ud på at erstatte teoretiske ”momenter” med data ”momenter” (her: Gennemsnittet)

Økonometri 1: F2 Udledning (fortsat) Resten af udledningen af OLS estimatoren foregår som tavlegennemgang

Økonometri 1: F2 Forudsagte værdier og residualer Forudsagte værdier: Populations regressionsfunktionen Ud fra estimaterne for parametrene kan de forudsagte værdier af y bestemmes: Residualer: Residualerne kan bestemmes som forskellen mellem den faktiske og forudsagte værdi af y:

Økonometri 1: F2 Forudsagte værdier og residualer (fortsat) For residualerne (baseret på en OLS estimation med konstantled) gælder følgende sammenhænge mekanisk: Hvorfor er dette ikke så underligt? OLS estimatoren kan ækvivalent opnås ved at minimere residualkvadratsummen: Sådan blev OLS estimatoren udledt i Teoretisk Statistik

Økonometri 1: F2 Flere egenskaber ved OLS Variansanalyse: Den afhængige variabel y dekomponeres i to komponenter:  Forudsagte værdi:  Residualet: Variationen i y (total sum of squares) : hvor

Økonometri 1: F2 Flere egenskaber ved OLS (fortsat) Den totale variation kan også dekomponeres i to dele: SST=SSE+SSR  ”Explained sum of squares”  ”Residual sum of squares” I Teoretisk Statistik kaldes SST for SAK, SSR for SRK

Økonometri 1: F2 Egenskaber ved OLS (fortsat) Goodness of fit: På baggrund af variansanalysen kan man definere et mål for, hvor meget variation modellen (den forklarende variabel) forklarer: Hvilke værdier kan R 2 antage?

Økonometri 1: F2 Eksempel: Timeløn og uddannelse I dette eksempel estimeres en simpel model for timelønnen: Til estimationen benyttes danske registerdata fra Danmarks Statistik. Data består af 2000 tilfældigt udtrukne individer. For disse personer har vi en række oplysninger om arbejdsmarkedsforhold i perioden Datasættet ligger på forelæsningssiden under ”Eksempler”

Økonometri 1: F2 Eksempel (fortsat) Til analysen benyttes følgende variabler:  Timelønnen beregnet på baggrund af årlig lønindkomst (registreret hos SKAT) divideret med det årlige antal arbejdstimer udregnet på baggrund af ATP indbetalinger  Uddannelse er antallet af års gennemført uddannelse Vi benytter data vedr Data består af personer:  år  Lønmodtagere  Timelønnen er større end 20 kr.

Økonometri 1: F2 Enhederne på variablerne: Hjemmeopgave Hvad sker der, hvis man skifter enhed på den afhængige variabel?  Hvad sker der med estimaterne, hvis timelønnen omregnes til 2000-kr. (dvs. )?  Hvad sker der med R 2 ? Hvad sker der, hvis den forklarende variabel skifter enhed?  Hvad sker der med estimaterne, hvis uddannelse opgøres i antal måneder i stedet for år?  Hvad sker der med R 2 ?

Økonometri 1: F2 NB’er fra denne forelæsning At skelne mellem  Den simple lineære regressionsligning  Og den regneregel, vi bruger til at opnå et estimat af ligningens koefficienter (her: OLS estimatoren). At skelne mellem  Statistiske antagelser om populationen (fx )  Og de mekaniske egenskaber som fremkommer ved at anvende en given regneregel (her: OLS estimatoren) på data i en given stikprøve. De forklarende variabler opfattes som udgangspunkt som stokastiske variabler

Økonometri 1: F2 Næste gang Fredag om kapitel Husk:  ”Hjemmeopgaven” om enheder på variablerne. Øvelserne starter i denne uge:  Læs Ugeseddel 1 om estimation af Engelkurver (ugeseddel og data ligger på hjemmesiden).  Læs Varian ”Intermediate Microeconomics” kap  Medbring ”Elementær indføring i SAS” og ”Statistik med SAS”