Heteroskedasticitet 23. oktober 2006

Slides:



Advertisements
Lignende præsentationer
Inferens i den lineære regressionsmodel 19. marts 2007
Advertisements

Dummyvariabler 13. oktober 2006
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 10. december 2004.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 1. oktober 2004.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
KM2: F261 Kvantitative metoder 2 Instrumentvariabel estimation 16. maj 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 7. december 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Instrumentvariabel estimation 21. maj 2007
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 5. oktober 2004.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 3. marts 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 28. april 2006.
Økonometri – lektion 8 Multipel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation III Prøveeksamen 3. maj 2006.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Kvantitative metoder 2: Inferens i den lineære regressionsmodel1 Kvantitative metoder 2 Inferens i den lineære regressionsmodel 14. marts 2007.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
F21: Instrumentvariabelestimation III1 Økonometri 1 Instrumentvariabelestimation III 8. december 2006.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 28. april 2003.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 24. marts 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 7. december 2004.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
Økonometri 1: F71 Økonometri 1 Inferens i den lineære regressionsmodel 29. september 2006.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation IV 10. maj 2006.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Præsentationens transcript:

Heteroskedasticitet 23. oktober 2006 Økonometri 1 Heteroskedasticitet 23. oktober 2006 Økonometri 1: F11

Oversigt: Heteroskedasticitet (Wooldridge kap. 8) OLS estimation under heteroskedasticitet: Konsekvenser af heteroskedasticitet for OLS Hvordan kan man udføre gyldige test på grundlag af OLS-estimation, selvom der er heteroskedasticitet? Korrektion af variansen af OLS estimatoren Generelle hypotesetest under heteroskedasticitet Test for heteroskedasticitet: Grafisk test Formelle test: Breusch-Pagan test, White test Bedre (mere efficiente) estimatorer end OLS, når der er heteroskedasticitet: Vægtning af observationerne: Weighted Least Squares (WLS) Feasible Generalized Least Squares (FGLS) Økonometri 1: F11

Heteroskedasticitet I kapitel 2 og 3 blev antagelsen om homoskedasticitet introduceret: Samme varians på fejlleddet for alle i Antagelsen kan være meget restriktiv i praksis. Derfor vil vi se på tilfælde med heteroskedasticitet MLR.5 er antagelsen om homoskedasticitet: Alternativ: Modellen lider af heteroskedasticitet af ukendt form: Vi tillader altså, at fejlleddet til hver enhed (individ, firma, land) har sin egen varians (meget generel form) Homoskedasticitet kan ses som det specialtilfælde, hvor Økonometri 1: F11

Konsekvenser af heteroskedasticitet for OLS Se på simpel lineær regressionsmodel Antagelserne MLR.1- MLR.4 sikrer at OLS middelret og konsistent: Vedrører ikke variansen på fejlleddet. Under MLR.1-5 er OLS efficient og dens varians er givet ved det simple udtryk fra kapitel 2. Økonometri 1: F11

Konsekvenser af heteroskedasticitet for OLS Udregn variansen af OLS estimatoren, når MLR.1- MLR.4 er opfyldt, men MLR.5 ikke holder. Variansen af OLS estimatoren er i det generelle tilfælde givet ved Leddene i tælleren gives forskellig vægte, afhængig af SST led forkorter ikke ud som det er tilfældet under homoskedasticitet Økonometri 1: F11

Konsekvenser af heteroskedasticitet for OLS Hvis MLR.5 ikke er opfyldt, siger vi at fejlleddene er heteroskedastiske OLS estimatorens egenskaber ved heteroskedasticitet: + OLS stadig middelret og konsistent (givet MLR.1-4) - Variansen af OLS estimaterne estimeres ikke middelret eller konsistent af de sædvanlige OLS-udtryk - Konfidensintervallet er ikke rigtigt konstrueret - t og F-test er ikke nødvendigvis t og F-fordelt, LM test er ikke nødvendigvis fordelt (og derfor er disse test ikke pålidelige) OLS er ikke længere den bedste lineære middelrette estimator (BLUE): Der findes andre lineære middelrette estimatorer med mindre varians OLS er ikke længere asymptotisk efficient Økonometri 1: F11

Hvordan kan man teste i modeller med heterosk.? Heteroskedasticitet i fejlleddet betyder, at test der er baseret på OLS estimation kun er gyldige, hvis man korrigerer standardfejlene for heteroskedasticitet. Til det formål er der udviklet såkaldt heteroskedasticitets-konsistente eller -robuste test. Antag: Modellen lider af heteroskedasticitet af ukendt form: Ideen er at opnå en estimator for variansen af OLS estimatoren, som er konsistent selvom om der er heteroskedasticitet i fejlleddet. Økonometri 1: F11

Korrektion af variansen i en simpel lineær regressionsmodel White (1980) har vist, at under svage betingelser vil en konsistent estimator af OLS variansen være givet ved Heteroskedasticitets-robust varians og heterosk. robuste standardfejl (White’s standard errors, HCSE). Beregnes fx i Proc Reg med optionen ACOV i SAS. Økonometri 1: F11

Korrektion af variansen i en multipel lineær regressionsmodel: Forelæsningsnoten Økonometri 1: F11

Test i modeller med heteroskedasticitet: Enkelt restriktion Heteroskedasticitets-robust t-test af hypotesen: t-teststørrelse: hvor HCSE er heterosk. robust standardfejl på t-teststørrelsen er asymptotisk standard normalfordelt For små datasæt er t-teststørrelserne ikke nødvendigvis tæt på en t-fordeling Brug af ACOV optionen i SAS giver robust kovariansmatrix. HCSE beregnes som kvadratroden af diagonalelementer Økonometri 1: F11

Test i modeller med heteroskedasticitet: Flere restriktioner Hypotese: hvor er en (k+1)x1 vektor af parametre, R er en q x(k+1) matrix og r er en q x1 vektor Heterosk. robust F-test kan beregnes ud fra robust kovariansmatrix Heterosk. robust Wald test: Wald-teststørrelsen Det er dette test som udføres ved brug af TEST efter Proc Reg med ACOV optionen i SAS Økonometri 1: F11

Eksempel: Model for efterspørgsel efter cigaretter (Ex. 8 Eksempel: Model for efterspørgsel efter cigaretter (Ex. 8.7, SAS program på hjemmesiden) OLS estimater. Afhængig variabel: cigs. Est. Std.err Robust std. Err Const -3.640 24.079 25.505 Lincome 0.880 0.728 0.593 Lprice -0.751 5.773 6.009 Educ -0.502 0.167 0.162 Age -0.771 0.160 0.138 Age2 -0.0090 0.0017 0.0015 Rest -2.825 1.112 1.004 Økonometri 1: F11

Eksempel: Hypoteseprøvning Hypotese: Ingen indkomsteffekt: Alm. t-teststørrelse: Robust t-teststørrelse: Robust Wald test (TEST efter ACOV): Hypotese: Ingen alderseffekt: Økonometri 1: F11

Heteroskedasticitets-robust LM test Model: Hypotese: Ingen alderseffekt Trin 1: Estimer restrikterede model med OLS og gem residualerne: Trin 2: Estimer flg. hjælperegressioner med OLS og gem residualerne Økonometri 1: F11

Heteroskedasticitets-robust LM test Trin 3: Dan et nyt sæt af variabler Trin 4: Estimer flg. hjælperegression med OLS (uden konstantled) LM-teststørrelsen er givet ved n-SSR fra ovenstående regression LM testet er asymptotisk fordelt som med q=2 Eksemplet: n=807, SSR=764.70: LM=807-764.70=42.30 Økonometri 1: F11

Hvornår forekommer heteroskedaticitet i praksis? Data består af størrelsesmæssigt meget heterogene enheder: Virksomheder, lande, skoler Data består af gennemsnit over forskellige antal observationer Per capita værdier for forskellige lande Gennemsnit for forskellige kommuner eller skoler Forkert funktionel form: Hvis variansen på fejlleddet vokser med den afhængige variabel kan problemet nogen gange løses ved at lave en transformation med logaritmen Lineær sandsynlighedsmodel Heteroskedasticitet knytter sig til den enkelte model og det enkelte datasæt Økonometri 1: F11

Hvordan tester man for heteroskedasticitet? Antag følgende model hvor antagelserne MLR.1-MLR.4 er opfyldt Hypotese: Alternativ formulering af hypotesen Hvis hypotesen er forkert er en funktion af x’erne: Heteroskedasticitet Bemærk: Systematikken er i variansen på fejlleddet, ikke i middelværdien (givet at MLR.4 holder). Økonometri 1: F11

Test for heteroskedasticitet Grafiske test: Estimer modellen med OLS og gem residualerne Plot residualerne (eller de kvadrerede residualer) mod: Forskellige forklarende variable: Kandidater er ”skalavariabler”, fx omsætning (virksomheder), indkomst (individer/husholdninger) Den forudsagte værdi af den afhængige variabel Se efter systematiske mønstre i spredningen af residualerne: Variansen vokser i den variabel, der plottes imod: ”Trompet” Variansen aftager i den variabel, der plottes imod: ”Omvendt trompet” Varsom med at overfortolke, når der er forskel i datatæthed. Økonometri 1: F11

Test for heteroskedasticitet: Breusch-Pagan Hvis man antager en simpel lineær relation svarer nulhypotesen om homoskedasticitet til Denne hypotese kan testes ved at erstatte de sande fejlled med OLS residualerne Testet udføres enten som et F-test eller et LM test For store datasæt vil F og LM test have de sædvanlige fordelinger selvom man har erstattet de sande fejlled med OLS residualerne Økonometri 1: F11

Test for heteroskedasticitet Regressionen (*) udføres og R2u for denne regression noteres F-teststørrelsen er givet ved Teststørrelsen er approx. F(k,n-k-1)-fordelt under nul- hypotesen (homoskedasticitet) LM teststørrelsen Økonometri 1: F11

Test for heteroskedasticitet Specialtilfælde af BP-testet: Hvis man mistænker, at variansen kun afhænger af en bestemt variabel. Testet udføres ved at regressere de kvadrerede residualer på den pågældende variabel. Bemærk at antallet af frihedsgrader er ændret for både F-testet (antal frihedsgrader: 1,n-1-1) og LM testet ( ) Alternativt test: Whites test for heteroskedasticitet Betingelsen kan erstattes af svagere betingelse: skal være ukorreleret med alle forklarende variable, de forklarende variable i anden og alle krydsprodukterne Økonometri 1: F11

Test for heteroskedasticitet: Whites test Antag vi har en model med k=3 Hjælperegressionen for White’s test NB: 9 forklarende variable Hypotese Teststørrelsen findes som et LM test Økonometri 1: F11

Test for heteroskedasticitet: Whites test Forenklet White’s test: Hjælperegression Hypotese Testet konstrueres som Fordelen ved dette test er at antallet af frihedsgrader er lavere White’s test har asymptotisk gyldighed og er altså bedst for store datasæt Økonometri 1: F11

Test for heteroskedasticitet ”Hjemmeopgave”: Udfør test for heteroskedasticitet for cigareteksemplet: Grafiske test: Er der tegn på at variansen afhænger fx af indkomst eller alder? BP, White’s test Husk alle disse test er udledt under forudsætning af, at antagelserne MLR.1-MLR.4 er opfyldt Hvis antagelse MLR.4 ikke er opfyldt kan man få at test for homoskedasticitet bliver afvist selvom antagelsen MLR.5 er opfyldt Så afvisning af homoskedasticitet skal skyldes mere generelle former for misspecifikation: Kapitel 9 Økonometri 1: F11

NB’er Antagelserne MLR.1- MLR.4, som sikrer at OLS middelret og konsistent, vedrører ikke variansen på fejlleddet. Heteroskedasticitet betyder systematik i variansen på fejlleddet, ikke i middelværdien (givet at MLR.3 holder). Gyldige hypotesetest kan baseres på den robuste kovariansmatrix for OLS estimatoren, selvom der er heteroskedasticitet. Økonometri 1: F11

Fredag den 27. oktober. NB: lokale CSS 22.01.19 Næste gang: Fredag den 27. oktober. NB: lokale CSS 22.01.19 Heteroskedasticitet: Kapitel 8.3-8.5 Estimatorer der tager højde for heteroskedasticitet: Weighted Least Squares (WLS) Generalized Least Squares (GLS) Husk eksamenstilmelding! Økonometri 1: F11