KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.

KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007

KM2: F4 2 Program for næste emne: Den simple regressionsmodel – SLR Regressionsmodel med en forklarende variabel (W.2) F4 (i dag): W2.1-3, App2A  Motivation af lineær regressionsmodel  Udledning af OLS estimatoren  Ex: Løn og uddannelse på danske data F5 & F6 (næste uge): W2.3-6  Funktionel form af variabler i modellen  ”Mekaniske” egenskaber ved OLS estimatoren  Statistiske egenskaber Middelret estimation Variansen på OLS estimatoren Estimator for variansen på OLS estimatoren

KM2: F4 3 Motivation for en simpel regressionsmodel (SLR) Vi vil beskæftige os med modeller, hvor vi ønsker at forklare  variationen i en variabel, y,  med variationen i en anden variabel, x. Eksempler: Hvordan påvirker kunstgødning udbyttet af sojabønner (Ex 1.3)? Hvordan påvirker uddannelsesniveauet timelønnen (Ex. 1.4)? Hvordan afhænger virksomhedens afkast af direktørens løn (Ex. 2.3)?

KM2: F4 4 Motivation (fortsat) Når modellen opstilles må vi forholde os konkret til nogle spørgsmål: Spm. 1: Hvordan forholder vi os til, at x næppe er den eneste faktor, som har betydning for y ? Spm. 2: Hvilken funktionel form kan beskrive sammenhængen mellem y og x ?  Kan y fx beskrives som en lineær funktion af x ? Eller log(x)?  Eller er det bedre at beskrive log(y/1000) som en funktion af x/12? log(x)? Spm. 3: Kan modellen bruges til ceteris paribus fortolkninger?

KM2: F4 5 Definition af SLR Den simple regressionsmodel Kaldes også for den bivariate regressionsmodel y: afhængig variabel x: forklarende variabel u: (uobserveret) fejlled β 0 : konstantled (”intercept”) sjældent fortolkeligt β 1 : hældningskoefficient (”slope”) Konstantleddet og den forklarende variabel kaldes under ét for regressorerne

KM2: F4 6 Definition (fortsat) Når vi opskriver den simple regressionsmodel, besvarer vi implicit spørgsmålene i motivationen: Spm. 1: Andre faktorer: Andre faktorer (end x), som påvirker y: Er indeholdt i fejlleddet u Fejlleddet u indeholder derfor blandt andet:  Udeladte faktorer/variabler  Målefejl Hvad indeholder u i eksemplet med  Uddannelse og løn?  Kunstgødning og høstudbytte?

KM2: F4 7 Definition (fortsat) Spm. 2: Funktionel form: Vi antager, at variablerne er bragt på en form, så y kan beskrives som en lineær funktion af x. En ændring i y kan forklares ved en ændring i x (forudsat Δu=0) Parameteren β 1 angiver hældningskoefficienten for y som funktion af x.

KM2: F4 8 Definition (fortsat) Spm. 3: Ceteris paribus fortolkning af parameter: Vi kan ikke uden videre lave ceteris paribus fortolkninger af parameterne. Fortolkningen af β 1 som effekten af x på y forudsætter at Δu=0. Uddannelse – løn eksemplet: Hvad kan problemet med ceteris paribus antagelsen være ?

KM2: F4 9 Statistiske antagelser for regressionsmodellen Antagelse (2.5) i Wooldridge. Ubetinget middelværdi af u er lig 0 Antagelsen er normalt uproblematisk, så længe det er effekten af x, som er den interessante parameter, og der indgår et konstantled i modellen …men gør også tit fortolkningen af konstantleddet problematisk

KM2: F4 10 Antagelser (fortsat) Antagelse (2.6) i Wooldridge. Den betingede middelværdi af u givet x er lig 0 Denne antagelse er ofte kritisk Lidt om antagelsen (se Appendix B.4):

KM2: F4 11 Antagelser (fortsat) Eksempel: Timeløn og uddannelse Vi har følgende model: Fejlleddet u indeholder blandt andet ”evner”, ”arbejdsiver”, ”arbejdsmoral”. Er følgende antagelsen rimelig?

KM2: F4 12 Eksempel: Timeløn og uddannelse I dette eksempel estimeres en simpel model for timelønnen: Til estimationen benyttes danske registerdata fra Danmarks Statistik. Data består af 2000 tilfældigt udtrukne individer. For disse personer har vi en række oplysninger om arbejdsmarkedsforhold i perioden 1980-1994. Datasættet ligger på forelæsningssiden under ”Eksempler”

KM2: F4 13 Eksempel (fortsat) Til analysen benyttes følgende variabler:  Timelønnen beregnet på baggrund af årlig lønindkomst (registreret hos SKAT) divideret med det årlige antal arbejdstimer udregnet på baggrund af ATP indbetalinger  Uddannelse er antallet af års gennemført uddannelse Vi benytter data vedr. 1980. Data består af personer:  20-69 år  Lønmodtagere  Timelønnen er større end 20 kr.

KM2: F4 14 Udledning af OLS estimatoren OLS estimatoren udledes ved hjælp af moment metoden (Method of Moments): KM1, BL.9.10 Ideen med moment metoden illustreres ved et eksempel:  Antag at man har en tilfældig stikprøve af n observationer af en variabel y.  y har en ukendt middelværdi, som man er interesseret i at bestemme. Dvs..  Hvad vil være et naturligt estimat for middelværdien?  Gennemsnittet!! Moment estimation går ud på at erstatte teoretiske ”momenter” med data ”momenter” (her: Gennemsnittet)

KM2: F4 15 Udledning (fortsat) Resten af udledningen af OLS estimatoren foregår som tavlegennemgang

KM2: F4 16 Forudsagte værdier og residualer Forudsagte værdier: Populations regressionsfunktionen Ud fra estimaterne for parametrene kan de forudsagte værdier af y bestemmes: Residualer: Residualerne bestemmes som forskellen mellem den faktiske og forudsagte værdi af y:

KM2: F4 17 Forudsagte værdier og residualer (fortsat) For residualerne (baseret på en OLS estimation med konstantled) gælder følgende sammenhænge mekanisk: Hvorfor er dette ikke så underligt? OLS estimatoren kan ækvivalent opnås ved at minimere residualkvadratsummen: Heraf navnet Ordinary Least Squares: W.App2A: Viser at OLS estimatoren faktisk løser dette minimeringsproblem:  Stikprøvemoment betingelserne er førsteordens-betingelserne for problemet  Andenordens-betingelsen for et minimum er opfyldt.

KM2: F4 18 Eksempel: Timeløn og uddannelse (fortsat) Tag udgangspunkt i den simple model for timelønnen: Hvad sker der, hvis man skifter enhed på den afhængige variabel?  Hvad sker der med estimaterne, hvis timelønnen omregnes til 2000-kr. (dvs. )? Hvad sker der, hvis den forklarende variabel skifter enhed?  Hvad sker der med estimaterne, hvis uddannelse opgøres i antal måneder i stedet for år? Hvad sker der, hvis man erstatter den afhængige variabel med log(timeløn)?

KM2: F4 19 NB’er fra denne forelæsning At skelne mellem  Den simple lineære regressionsligning  Og den regneregel, vi bruger til at opnå et estimat af ligningens koefficienter (her: OLS estimatoren). At skelne mellem  Statistiske antagelser om populationen (fx )  Og de mekaniske egenskaber som fremkommer ved at anvende en given regneregel (her: OLS estimatoren) på data i en given stikprøve. Den forklarende variabel opfattes som udgangspunkt også som en stokastisk variabel

KM2: F4 20 Næste gang Mandag om kapitel 2.3-2.5  Funktionel form  Statistiske egenskaber: Middelret estimation.

KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.

Lignende præsentationer

Præsentationer af emnet: "KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007."— Præsentationens transcript:

Lignende præsentationer

Om projektet

Feedback

Log ind

Logge ind via sociale netværk:

KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.

Lignende præsentationer

Præsentationer af emnet: "KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007."— Præsentationens transcript:

Lignende præsentationer

Om projektet

Feedback