Download præsentationen
Præsentation er lastning. Vent venligst
Offentliggjort afGrethe Ibsen Redigeret for ca. et år siden
1
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007
2
KM2: F4 2 Program for næste emne: Den simple regressionsmodel – SLR Regressionsmodel med en forklarende variabel (W.2) F4 (i dag): W2.1-3, App2A Motivation af lineær regressionsmodel Udledning af OLS estimatoren Ex: Løn og uddannelse på danske data F5 & F6 (næste uge): W2.3-6 Funktionel form af variabler i modellen ”Mekaniske” egenskaber ved OLS estimatoren Statistiske egenskaber Middelret estimation Variansen på OLS estimatoren Estimator for variansen på OLS estimatoren
3
KM2: F4 3 Motivation for en simpel regressionsmodel (SLR) Vi vil beskæftige os med modeller, hvor vi ønsker at forklare variationen i en variabel, y, med variationen i en anden variabel, x. Eksempler: Hvordan påvirker kunstgødning udbyttet af sojabønner (Ex 1.3)? Hvordan påvirker uddannelsesniveauet timelønnen (Ex. 1.4)? Hvordan afhænger virksomhedens afkast af direktørens løn (Ex. 2.3)?
4
KM2: F4 4 Motivation (fortsat) Når modellen opstilles må vi forholde os konkret til nogle spørgsmål: Spm. 1: Hvordan forholder vi os til, at x næppe er den eneste faktor, som har betydning for y ? Spm. 2: Hvilken funktionel form kan beskrive sammenhængen mellem y og x ? Kan y fx beskrives som en lineær funktion af x ? Eller log(x)? Eller er det bedre at beskrive log(y/1000) som en funktion af x/12? log(x)? Spm. 3: Kan modellen bruges til ceteris paribus fortolkninger?
5
KM2: F4 5 Definition af SLR Den simple regressionsmodel Kaldes også for den bivariate regressionsmodel y: afhængig variabel x: forklarende variabel u: (uobserveret) fejlled β 0 : konstantled (”intercept”) sjældent fortolkeligt β 1 : hældningskoefficient (”slope”) Konstantleddet og den forklarende variabel kaldes under ét for regressorerne
6
KM2: F4 6 Definition (fortsat) Når vi opskriver den simple regressionsmodel, besvarer vi implicit spørgsmålene i motivationen: Spm. 1: Andre faktorer: Andre faktorer (end x), som påvirker y: Er indeholdt i fejlleddet u Fejlleddet u indeholder derfor blandt andet: Udeladte faktorer/variabler Målefejl Hvad indeholder u i eksemplet med Uddannelse og løn? Kunstgødning og høstudbytte?
7
KM2: F4 7 Definition (fortsat) Spm. 2: Funktionel form: Vi antager, at variablerne er bragt på en form, så y kan beskrives som en lineær funktion af x. En ændring i y kan forklares ved en ændring i x (forudsat Δu=0) Parameteren β 1 angiver hældningskoefficienten for y som funktion af x.
8
KM2: F4 8 Definition (fortsat) Spm. 3: Ceteris paribus fortolkning af parameter: Vi kan ikke uden videre lave ceteris paribus fortolkninger af parameterne. Fortolkningen af β 1 som effekten af x på y forudsætter at Δu=0. Uddannelse – løn eksemplet: Hvad kan problemet med ceteris paribus antagelsen være ?
9
KM2: F4 9 Statistiske antagelser for regressionsmodellen Antagelse (2.5) i Wooldridge. Ubetinget middelværdi af u er lig 0 Antagelsen er normalt uproblematisk, så længe det er effekten af x, som er den interessante parameter, og der indgår et konstantled i modellen …men gør også tit fortolkningen af konstantleddet problematisk
10
KM2: F4 10 Antagelser (fortsat) Antagelse (2.6) i Wooldridge. Den betingede middelværdi af u givet x er lig 0 Denne antagelse er ofte kritisk Lidt om antagelsen (se Appendix B.4):
11
KM2: F4 11 Antagelser (fortsat) Eksempel: Timeløn og uddannelse Vi har følgende model: Fejlleddet u indeholder blandt andet ”evner”, ”arbejdsiver”, ”arbejdsmoral”. Er følgende antagelsen rimelig?
12
KM2: F4 12 Eksempel: Timeløn og uddannelse I dette eksempel estimeres en simpel model for timelønnen: Til estimationen benyttes danske registerdata fra Danmarks Statistik. Data består af 2000 tilfældigt udtrukne individer. For disse personer har vi en række oplysninger om arbejdsmarkedsforhold i perioden 1980-1994. Datasættet ligger på forelæsningssiden under ”Eksempler”
13
KM2: F4 13 Eksempel (fortsat) Til analysen benyttes følgende variabler: Timelønnen beregnet på baggrund af årlig lønindkomst (registreret hos SKAT) divideret med det årlige antal arbejdstimer udregnet på baggrund af ATP indbetalinger Uddannelse er antallet af års gennemført uddannelse Vi benytter data vedr. 1980. Data består af personer: 20-69 år Lønmodtagere Timelønnen er større end 20 kr.
14
KM2: F4 14 Udledning af OLS estimatoren OLS estimatoren udledes ved hjælp af moment metoden (Method of Moments): KM1, BL.9.10 Ideen med moment metoden illustreres ved et eksempel: Antag at man har en tilfældig stikprøve af n observationer af en variabel y. y har en ukendt middelværdi, som man er interesseret i at bestemme. Dvs.. Hvad vil være et naturligt estimat for middelværdien? Gennemsnittet!! Moment estimation går ud på at erstatte teoretiske ”momenter” med data ”momenter” (her: Gennemsnittet)
15
KM2: F4 15 Udledning (fortsat) Resten af udledningen af OLS estimatoren foregår som tavlegennemgang
16
KM2: F4 16 Forudsagte værdier og residualer Forudsagte værdier: Populations regressionsfunktionen Ud fra estimaterne for parametrene kan de forudsagte værdier af y bestemmes: Residualer: Residualerne bestemmes som forskellen mellem den faktiske og forudsagte værdi af y:
17
KM2: F4 17 Forudsagte værdier og residualer (fortsat) For residualerne (baseret på en OLS estimation med konstantled) gælder følgende sammenhænge mekanisk: Hvorfor er dette ikke så underligt? OLS estimatoren kan ækvivalent opnås ved at minimere residualkvadratsummen: Heraf navnet Ordinary Least Squares: W.App2A: Viser at OLS estimatoren faktisk løser dette minimeringsproblem: Stikprøvemoment betingelserne er førsteordens-betingelserne for problemet Andenordens-betingelsen for et minimum er opfyldt.
18
KM2: F4 18 Eksempel: Timeløn og uddannelse (fortsat) Tag udgangspunkt i den simple model for timelønnen: Hvad sker der, hvis man skifter enhed på den afhængige variabel? Hvad sker der med estimaterne, hvis timelønnen omregnes til 2000-kr. (dvs. )? Hvad sker der, hvis den forklarende variabel skifter enhed? Hvad sker der med estimaterne, hvis uddannelse opgøres i antal måneder i stedet for år? Hvad sker der, hvis man erstatter den afhængige variabel med log(timeløn)?
19
KM2: F4 19 NB’er fra denne forelæsning At skelne mellem Den simple lineære regressionsligning Og den regneregel, vi bruger til at opnå et estimat af ligningens koefficienter (her: OLS estimatoren). At skelne mellem Statistiske antagelser om populationen (fx ) Og de mekaniske egenskaber som fremkommer ved at anvende en given regneregel (her: OLS estimatoren) på data i en given stikprøve. Den forklarende variabel opfattes som udgangspunkt også som en stokastisk variabel
20
KM2: F4 20 Næste gang Mandag om kapitel 2.3-2.5 Funktionel form Statistiske egenskaber: Middelret estimation.
Lignende præsentationer
© 2024 SlidePlayer.dk Inc.
All rights reserved.