Simpel Lineær Regression

Slides:



Advertisements
Lignende præsentationer
Hypotese test – kapitel 6 (Signifikans test)
Advertisements

Anvendt Statistik Lektion 3
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Statistik Lektion 17 Multipel Lineær Regression
Anvendt Statistik Lektion 9
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Variansanalyse Modelkontrol
Anvendt Statistik Lektion 3
Grundlæggende teoretisk statistik
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Anvendt Statistik Lektion 8
Statistik II Lektion 5 Modelkontrol
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Statistik II 5. Lektion Log-lineære modeller.
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik II Lektion 4 Generelle Lineære Modeller
Anvendt Statistik Lektion 7
Fejl  Afleveringen  Stikprøvestørrelse  Type I-II Fejl  Styrkefunktionen.
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statistik Lektion 15 Mere Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri – lektion 7 Multipel Lineær Regression
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 14 Simpel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri – lektion 8 Multipel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Simpel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Grundlæggende teoretisk statistik
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Repetition Forårets højdepunkter…. Simpel Lineær Regression Simpel lineær regression: Mindste kvadraters metode Kovarians og Korrelation.
Statistik Lektion 8 Test for ens varians.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Grundlæggende teoretisk statistik
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Statikstik II 4. Lektion Generelle Lineære Modeller.
Statikstik II 3. Lektion Multipel Logistisk regression Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Anvendt Statistik Lektion 8
Præsentationens transcript:

Simpel Lineær Regression Estimation Test i Simpel Lineær Regression Kovarians og Korrelation

Simpel lineær regression Model Observation = Systematisk + Tilfældig Observation = Forklaret + Uforklaret

Estimatorer for b0 og b1 B0 og B1 er er centrale (dvs. unbiased) estimatorer for henholdsvis β0 og β1: Estimater b0 og b1 for henholdsvis β0 og β1 opnåsved at indsætte de observerede yi’er.

Estimatorenes fordeling Estimatorerne B0 og B1 er begge normalfrodelte: Hvor Bemærk: Når SSx er stor så er lille!

Estimation af σ2 – variansen for fejlledene I foråret estimerede vi variansen i en uafhængig stikprøve ved For simpel lineær regression bruger vi MSE = Mean Squared Error Antal frihedsgrader ”Minus én”, da s2 involverer ét estimat, nemlig . Antal frihedsgrader ”Minus to”, da s2 involverer to estimater, nemlig b0 og b1.

Udregning af SSE Hermed opnår vi Som desuden er en unbiased estimator for σ2.

Konfidensinterval for β0 Vi har (1-α)100% konfidensinterval for β0 er hvor

Konfidensinterval for β1 Vi har (1-α)100% konfidensinterval for β0 er hvor

Eksempel: Reklame vs salg Fra sidst har vi: Regne, regne, regne… 410 15650 5445 2512925 191325

Konfidensintervaller 95% konfidens interval for β0 (α=0.05): 95% konfidens interval for β1:

Test af hældning (β1) Test for om hældningen, β1, har en bestemt værdi, K: Hvis H0 er sand, så gælder der Teststørrelse:

Test af hældning (β1) Vælg et signifikansniveau, typisk α=0.05. Udregn teststørrelsen Bestem p-værdien. Beslutning: Hvis p-værdien < α afvises H0. t-fordeling med n-2 frihedsgrader . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1 . Orange område = p-værdi

Særlig interessant: H0: β1=0 Er der en lineær sammenhæng mellem X og Y? H0: β1=0 ingen lineær sammenhæng H1: β1≠0 lineær sammenhæng Følgende er eksempler, hvor H0 accepteres. Konstant Y Usystematisk variation Ikke-lineær sammenhæng Y Y Y X X X

Eksempel: Reklame vs Salg Test for lineær sammenhæng mellem reklame og salg: Teststørrelse: Kritisk værdier: Beslutning: Vi forkaster H0 da t > 2.228. p-værdi = 0.027<0.05.

Test for skæringspunkt (β0) Stort set som for β1. Hypoteser: Teststørrelsen er: Antal frihedsgrader er uændret, dvs. n-2.

Kovarians Antag at X og Y er stokastiske variable. Definition af kovarians mellem X og Y: hvor Bemærk: I SLR er X ikke stokastisk!

Kovarians - egenskaber Hvis store X følges med store Y Cov( X ,Y )>0 Hvis store X følges med små Y Cov( X ,Y )<0 Kovariansen mellem X og X: Cov( X ,X ) = Var(X) Variansen af X+Y: Var(X+Y) = Var(X) + Var(Y) + 2Cov(X,Y)

Kovarians, Uafhængighed og Korrelation Hvis X og Y er uafhængige er Cov(X,Y)=0 Hvis X og Y er normalfordelte: X og Y er uafhængige <=> Cov(X,Y)=0 Definition af korrelationen, ρ, mellem X og Y: hvor

Korrelationskoefficienten Korrelationskoefficienten, ρ, måler graden af lineær sammenhæng mellem X og Y:

Illustration af korrelation Y X  = 0  = -.8  = .8  = -1  = 1

Estimation of korrelationskoef., ρ Estimatet af ρ betegnes r: r er stikprøve korrelationskoefficienten.

Test for korrelation mellem X og Y Hypoteser H0: r = 0 H1: r ≠ 0 Teststørrelse: Under H0:

Samme historie i SPSS Analyze→Regression→Linear (som sidst) I ’Statistics…’ vælg: Estimates Confidens Intervals

SPSS output Teststørrelsen t. 95% Konfidens-intervaller for β0 og β1. Parameter-estimaterne b0 og b1. Estimerede standard-afvigelser, sb0 og sb1. p-værdien svarende til det tosidede test H0: βi=0.

SPSS output Korrelationen mellem ’Reklame budget’ og ’Salg’. p-værdi hørende til test af hypotesen H0: ρ=0.

Den totale variation Den totale variation for data er ”Variationen i data omkring datas middelværdi” SST = Sum of Squares Total

Opslitning af den totale variation Den totale variation kan opslittes: er den uforklarede variation. er den forklarede variation. SSR = Sum of Squares Regression

Total og forklaret variation Opslitning a variationen

Total og forklaret variation - illustration Y X Den totale variation ses når vi “kigger langs” x-aksen Den uforklarede variation ses når vi “kigger langs” regressionslinien

SPSS output