Økonometri – lektion 7 Multipel Lineær Regression

Slides:



Advertisements
Lignende præsentationer
Statistik Lektion 18 Multipel Linear Regression
Advertisements

Statistik Lektion 17 Multipel Lineær Regression
Anvendt Statistik Lektion 9
Variansanalyse Modelkontrol
Anvendt Statistik Lektion 6
Variansanalyse Modelkontrol
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Anvendt Statistik Lektion 8
Statistik II Lektion 5 Modelkontrol
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Statistik II 5. Lektion Log-lineære modeller.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Statistik II Lektion 4 Generelle Lineære Modeller
Anvendt Statistik Lektion 7
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Multipel Lineær Regression
Statistik Lektion 15 Mere Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 16 Multipel Lineær Regression
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 14 Simpel Lineær Regression
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri – lektion 8 Multipel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Anvendt Statistik Lektion 10  Regression med både kvantitative og kvalitative forklarende variable  Modelkontrol 1.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Simpel Lineær Regression
Kvantitative metoder 2: Inferens i den lineære regressionsmodel1 Kvantitative metoder 2 Inferens i den lineære regressionsmodel 14. marts 2007.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
Repetition Forårets højdepunkter…. Simpel Lineær Regression Simpel lineær regression: Mindste kvadraters metode Kovarians og Korrelation.
Statistik Lektion 8 Test for ens varians.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Statikstik II 4. Lektion Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Økonometri – lektion 6 Multipel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Statistik II Lektion 5 Modelkontrol Modelkontrol Modelsøgning Større eksempel.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 6
Præsentationens transcript:

Økonometri – lektion 7 Multipel Lineær Regression Testbaseret Modelkontrol

MLR Model på Matrixform Den multiple lineære regressions model kan skrives som Hvor og Mindste kvadraters metode giver følgende estimat

MLR og Antagelser b = XTX-1y central estimator af b. Linearitet Lineær uafhængighed Middelværdi nul E[e|X] = 0 Uafhængighed og homoskedastisk E[eeT|X] = s2I Normalfordelt e|X ~ N( 0 , s2I ) b = XTX-1y central estimator af b. Var(b) = s2(XTX)-1 b = XTX-1y er BLUE (bedste lineære og centrale estimator) s2 = blabla central estimator af s2. b|X ~ N ( b , s2(xTx)-1 )

Varians-kovarians for Parameter-estimater. Antag at E(e)=0 og Var(e) = s2I (uafhængige og varians-homogene fejlled). Da gælder Hvis alle xi står vinkelret på hinanden, så har vi Dvs Cov(bi,bj) = 0 (ij) og Var(bi) = s2║xi║-2.

Multipel lineær regression Eksempel: Y = Export Eksport til Singapore i millioner $ M = M1 Money supply L = Lend Udlånsrente P = Price Prisindex E = Exchange Vekselkurs ml. S’pore $ og US $ Model:

Korrelationer ml. Parameterestimater Forholdsvis stærke korrelationer mellem ’Lend’, ’M1’ og ’Price’. Dette er faresignaler mht. kolinearitet. Husk: Korrelation er mål får lineær sammenhæng.

Kolinearitet Hvis Xh er kolineær med en eller flere af de andre forklarende variable vil Var(bh) typisk være stor. Det betyder at bh ”nemt” kan have en værdi langt fra hvad man ville forvente – herundern ”galt” fortegn. Ikke noget problem, hvis vi blot skal bruge modellen til prædiktion. Hvis vi derimod vil fortolke på de enkelte parametre, så er det et problem. Enkleste løsning er at fjerne en eller flere forklarende variable. I relation til visse økonomiske modeller kan det være problematisk at fjerne variable fra analysen.

Variance Inflation Factor (VIF) VIF er en indikator for kolinearitet. Definition: er determinations koefficienten opnået ved lineær regression med Xh som den afhængige og X1,…, Xh-1, Xh+1,…,Xk som forklarende. Fortolkning: VIF(Xh) angiver, hvor mange gange større Var(bh) er i forhold til, hvis Xh havde været vinkelret på X1,…, Xh-1, Xh+1,…,Xk.

VIF Fortsat Intuition: Hvis Xh er ca. en linear kombination af X1,…, Xh-1, Xh+1,…,Xk , så vil vi forvente . Dvs: Høj VIF indikerer kolinearitet. VIF>5 problematisk.

VIF og SPSS Analyze → Regression → Linear I ’Statistics’ menu vælg ’Colinearity diagnostic’ Både ’Lend’ og ’Price’ har høje VIF, men ikke ’Exchange’. Løsning: Vi fjerner ’Price’, da den er mindst signifikant.

Fjern ’Exchange’ ↓

Ramsey RESET Test: Test af Linearitet RESET = REgressions Specification Error Test Bruges til at teste om ikke lineære transformationer af de forklarende variable ”mangler”. Hypoteser H0: e ~ N( 0, s2 I ) H1: e ~ N( m, s2 I ) m  0

Ramsey RESET Test: Fremgangsmåde 1/2 Udfør multipel lineære regressionsanalyse af modellen Find det tilhørende SSE* og . Udfør ny MLR analyse af modellen hvor . Typisk er k = 4. Find tilhørende SSE.

Ramsey RESET Test: Fremgangsmåde 2/2 Vi teser hypotesen H0: a = 0 H1: a  0 Hvis H0 er sand gælder

Ramsey RESET Test: Eksempel Resultat uden y-hat’erne: Resultat når y-hat’erne (k=4) er med: Tolerance = 1/VIF – de forklarende variable er så lineært afhængige at SPSS er stået af!!!

Varianshomogene Residualer? Scatterplot: ei mod . Homoskedastisk?

White Test Formål: Test for varians homogenitet H0: Residualerne er varianshomogene. Fremgangsmåde: (Trin 1 af 2) Udfør regressionsanalyse af modellen hvor Find residualerne .

White Test Fremgangsmåde: (Trin 2 af 2) Udfør ny regressionsanalyse af modellen dvs. den afhængige variabel er et kvadreret residual og design-matricen er Dvs. alle de oprindelige forklarende variable, de oprindelig forklarende variable kvadreret ,samt alle par af vekselvirkninger – i alt q led. Asymptotisk gælder: nR2 ~ c2(q).

White Test - Eksempel ”Model”: q = 5, n = 67 og R2 = 0.058: nR2 = 0.406. Kritiskværdi: c20.05(5) = 11.07.

Auto-korrelation Hvis data er indsamlet over tid, er det ikke usandsynligt at ”nabo-målinger” er korrelede. Auto-korrelation: Der ligger en antagelse om at r1 ikke afhænger af i, dvs. auto-korrelationen er den samme til alle tider.

Lag k Auto-korrelation Korrelationen mellem to observationer k trin fra hinanden:

Autokorrelation - SPSS Analyze → Time Series → Autocorrelations… Ser ud som om der er en svag negativ lag-1 autokorrelation.

Durbin-Watson Test af Autokorrelation Hypoteser: H0: r1 = 0 vs Durbin-Watson teststørrelse: Bemærk at d ikke er et estimat af lag-1 auto-korrelationen. H1: r1  0

Kritiske værdier for Durbin-Watson Efter at have udregnet d finder vi dL og dU i Tabel 7 i Appendix C. Derefter sammenligner vi d med punkterne i skemaet nedenfor. Er d i det grønne område forkaster vi H0. Positive Autocorrelation Negative Test is Inconclusive No dL dU 4-dL 4-dU 4 d

Durbin-Watson Test: SPSS Analyze → Regression → Linear… I ’Statistics’ menuen vælge ’Durbin-Watson’ n = 67 og a=0.05, så er kritisk værdier ca dL = 1.57 og dU = 1.63 Konklusion: Negativ auto-korrelation. Positive Autocorrelation Negative Test is Inconclusive No dL dU 4-dL 4-dU 4 d 1.57 1.63 2.37 2.43 d=2.58

Test af Normalfordeling Normalfordelte residualer?

Skævhed / Skewness Definition: For en stokastisk variabel X er skævheden givet ved Skævhed er et mål for afvigelsen fra symmetri. Positiv skøvhed giver en højreskæv fordeling, dvs. en ”tyk hale” til højre. (+) Højreskæv (-) Venstre

Skævhed: Eksempler Eksempler Normal fordeling: 0 t-fordeling: 0 c2(k) -fordeling : Estimat af skævhed:

Kurtosis (Topstejlhed) Definition: For en stokastisk variabel X er skævheden givet ved Jo større kurtosis jo mere spids er tætheds- funktionen.

Kurtosis Eksempler Normal fordeling: 3 t(n)-fordeling: c2(k) -fordeling : Estimat af skævhed:

Jarque-Bera Test Definition: JB-teststørrelsen følger asymptotisk en c2(2)-fordeling. Intuition: Hvis X1,…,Xn identisk normalfordelte, så gælder E[K] = 3 og E[S] = 0. Jo mere K og S afviger jo større JB.

Jarque-Bera Test: SPSS Analyze → Frequencies… I ’Statistics’ menu vælg ’Skewness’ og ’Kurtosis’ c20.05(2) = 5.991 , dvs. vi afviser norm. ford. hypotesen.