Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.

Slides:



Advertisements
Lignende præsentationer
Statistik Lektion 18 Multipel Linear Regression
Advertisements

Statistik Lektion 17 Multipel Lineær Regression
Anvendt Statistik Lektion 9
Sammenligning af to grupper
Variansanalyse Modelkontrol
Grundlæggende teoretisk statistik
Variansanalyse Modelkontrol
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Anvendt Statistik Lektion 8
Statistik II Lektion 5 Modelkontrol
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II 5. Lektion Log-lineære modeller.
Statistik II Lektion 4 Generelle Lineære Modeller
Anvendt Statistik Lektion 7
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Forudsigelse i markedsanalyse Burns & Bush ch. 19 Carsten Stig Poulsen Mandag d. 6. april 2009.
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Inge Henningsen Stat BK uge Sammenligning af regressionslinier Opsummering af regressionsanalyse (Gennemgang af udvidet version af eksamen Blok.
Multipel Lineær Regression
Statistik Lektion 15 Mere Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri – lektion 7 Multipel Lineær Regression
Økonometri – lektion 5 Multipel Lineær Regression
Statistik Lektion 14 Simpel Lineær Regression
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
KM2: F191 Kvantitative metoder 2 Heteroskedasticitet 16. april 2007.
Økonometri – lektion 8 Multipel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Anvendt Statistik Lektion 10  Regression med både kvantitative og kvalitative forklarende variable  Modelkontrol 1.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Simpel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Repetition Forårets højdepunkter…. Simpel Lineær Regression Simpel lineær regression: Mindste kvadraters metode Kovarians og Korrelation.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Inge Henningsen Stat BK uge
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Statikstik II 4. Lektion Generelle Lineære Modeller.
Statikstik II 3. Lektion Multipel Logistisk regression Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Økonometri – lektion 6 Multipel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Statistik II Lektion 5 Modelkontrol Modelkontrol Modelsøgning Større eksempel.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Ellen Holm, Forskningscafé
Den multiple regressionsmodel 21. september 2005
Heteroskedasticitet 25. oktober 2005
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 6
Præsentationens transcript:

Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009

Simpel/Multipel Lineær Regression Model: Y i afhængige variabel for i’te observation. X ji j’te uafhængige/forklarende variable for i’te observation. ε i fejlled, uafhængige og normalfordelte med middelværdi 0 og varians σ 2 (kort: iid N(0,σ 2 ). β 0,…,β k og σ 2 er modellen parametre.

Simpel/Multipel Lineær Regression Model: Systematisk komponent Stokastisk komponent + Bemærk: Den betingede middelværdi for Y i :

Regressionslinje / -plan Den estimerede regression linje/plan: b 0 er estimat af parameteren β 0 b 1 er estimat af β 1, b 2 er estimat af β 2 osv. Residual: Sum of squared errors { Y X

x2x2 x1x1 y Model: Estimeret model: Residual: eiei

SSE er et mål for den ”totale afstand” fra regressionslinjen/planet til observationerne. SSE er en funktion af b 0, b 1,…,b k : Mindste Kvadraters Metode: Vi vælger b 0, b 1,…,b k, så SSE er mindst mulig. Mindste Kvadraters Metode

Total, forklaret og uforklaret variation Total variation = Uforklaret variation + Forklaret variation Gennemsnittet af alle observationer: Mean Squares:

Andelen af den totale variation der er forklaret: Pr definition: 0≤R 2 ≤1. R 2 vokser når antal forklarende variable (k) vokser. Justeret R 2 : Adj R 2 vokser hvis ”fordelen ved en ekstra parameter er større end ulempen”. Determinationskoefficienten

H 0 :β 1 =β 2 =…=β k =0, dvs. der er ikke en lineær sammenhæng mellem Y og X’erne. H 1 :Der er en lineær sammenhæng mellem Y og mindst et af X’erne. Teststørrelse: Under H 0 følger F en F-fordeling med k og n-(k+1) frihedsgrader. Store værdier af F er kritisk for H 0. F-Test

Kritisk værdi ved signifikansniveau α: Eksempel: F(5,50) og α=0.05: Kritisk værdi: F 0.05 (5,50)=2,4 P-værdi=0,03 α=0,05 P-værdi=0,20 α=0,05 F=2,72 F=1,52

t-Test: Test af Parameter H 0 :β i =0, dvs. der er ikke en lineær sammenhæng mellem Y og X i. H 1 :Der er en lineær sammenhæng mellem Y og X i. Teststørrelse: Under H 0 følger t en t-fordeling med n-(k+1) frihedsgrader. Værdier af t (numerisk) langt fra nul er kritiske for H 0.

t-Test Kritisk værdi ved signifikansniveau α: Eksempel: t(45) og α=0.05: Kritisk værdi: +/- t (45)= +/- 2,01 P-værdi=0,03 α=0,05 P-værdi=0,20 t=2,24 t=1,30 α=0,05

Sammenligne en Fuld (og sand) model med k forklarende variable, med en Reduceret model, der indeholder r færre forklarende variable. H 0 : Den fulde model er ikke ”besværet værd”. H 1 : Jo, det er den. Teststørrelse: Under H 0 følger F en F-fordeling med r og n-(k+1) frihedsgrader. Store værdier af F er kritisk for H 0. Partiel F-Test

Dummy Variable En kategorisk forklarende variabel X med r niveauer omkodes til (r-1) 0/1 dummy variable X 1,…,X r-1. Hver dummy variabel kodes som

Modelkontrol Vi skal kontrollere følgende antagelser – Y afhænger lineært af X i – ε i ’erne er normalfordelte med middelværdi 0 og fælles varians σ 2 indbyrdes uafhængige og uafhængig af Y i og X i. Vigtigste ingrediens: Residualer e i. Grafiske checks: Scatterplots, Residualplots, Histogrammer og Normalfordelingsplot (Q-Q-plot).

Produktpositionering og forbruger præferencer Case: Den strategiske Ært Et FØTEK projekt

Produktpositionering og forbruger præferencer Perceptioner er udtryk for forbrugernes opfattelse af tingenes tilstand Præferencerne udtrykker, hvad de synes om og ikke synes om Et produkts succes på markedet afhænger både af, hvordan det er positioneret i forbrugernes bevidsthed og i forhold til deres præferencer

Produktpositionering og forbruger præferencer Den oplagte analysemodel for sammenkobling mellem produktegenskaber /positionering og præferencer er regressionsanalyse

Multipel regression: Præferenceregression Betydningen af hver produktegenskab måles indirekte Hvis egenskaberne korrelerer, er deres relative betydning ikke sikkert bestemt Svarer måske ikke til den måde, forbrugerne oplever produkterne

Tre præferencemål, betinget af anvendelsen

Præferenceregression direkte med egenskaberne

Der er blot et mindre problem: de anvendte skala er ”afvigelse fra idealet”-skalaer Dvs. der kan være for meget og for lidt af en egenskab Dette kan håndteres ved at indføre en forenklet skala for hver egenskab: – under ideal: -1 – idealet: 0 – over idealet: +1 Disse dummykodes ved 2 dummier pr. egenskab Præferenceregression direkte med egenskaberne

Præferenceregression med de dummykodede egenskaberne

Modellen giver mulighed for at måle virkningen af negative (for lidt) og positive (for meget) af en egenskab Forklaringsgraden er ikke væsentligt forøget, hvilken skyldes at svarpersonerne ikke har brugt skalaen rigtig og/eller der er meget få observationer over/under det ideelle Præferenceregression med de dummykodede egenskaberne

Øvelser Gentag den ensidede ANOVA for en af de to øvrige anvendelser Gentag den flersidede ANOVA for en af de to øvrige anvendelser Gentag regressionsanalysen for en af de to øvrige anvendelser af grønne ærter Test for opfyldelsen af regressionsanalysens forudsætninger (homoskedasticitet, normalfordelte residualer, fravær af multuikollinearitet) Lav en stepvis regression med henblik på en forenkling af modellen