Program Korrelation Gamma Pearsons r Regression Kausalitet 1.

Slides:



Advertisements
Lignende præsentationer
Case: Tekst på Call-To-Action link
Advertisements

Dagens program Informationer χ2-test (chi-i-anden) Øvelser
Scientific Investigation
Relationsarbejde på Vejrup skole
Learnmark Horsens Patrik & Jakob HH1MB
Dagens program Teori Øvelser Eksperimentelle design Kausalitet
Anvendt Statistik Lektion 4
Statistik Lektion 17 Multipel Lineær Regression
Dagens program Informationer Opsamling Projekt 3 Regression
Anvendt Statistik Lektion 6
Grundlæggende teoretisk statistik
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Variansanalyse Modelkontrol
Case.
Statistik 1 – Lektion 5 By, energi & miljø, forår 2010 v. Morten Skou Nicolaisen.
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Statistik II Lektion 5 Modelkontrol
Martin Andersen og Mads Petersson Nr. 7
Signifikanstest ved (en eller) to stikprøver
LINEÆR FUNKTIONER MATEMATIK A.
Learning Objectives 5 Steps of a Significance Test Assumptions
Dagens program Test of Independence (chi-i-anden) Videre med projekt 3
Statistik II 5. Lektion Log-lineære modeller.
Learning Objectives 5 Steps of a Significance Test Assumptions
Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.
Anvendt Statistik Lektion 7
2. gradsfunktioner.
Forudsigelse i markedsanalyse Burns & Bush ch. 19 Carsten Stig Poulsen Mandag d. 6. april 2009.
Simpel Lineær Regression
Statistik Lektion 16 Multipel Lineær Regression
Reklameanalyse Walkthrough.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation II 7. december 2005.
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 14 Simpel Lineær Regression
Forretning og Ledelse lektion 7 Kultur og Strategi.
Økonometri – lektion 8 Multipel Lineær Regression
Anvendt Statistik Lektion 10  Regression med både kvantitative og kvalitative forklarende variable  Modelkontrol 1.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Simpel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Kjeld Svidt  Institut for Byggeri og Anlæg  Aalborg Universitet IT i Byggeriet Semester 6, kursusgang Databaser (1) Kjeld Svidt
Repetition Forårets højdepunkter…. Simpel Lineær Regression Simpel lineær regression: Mindste kvadraters metode Kovarians og Korrelation.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 4.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statistik II 4. Lektion Logistisk regression.
Økonometri – lektion 6 Multipel Lineær Regression
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Reliabilitet. Disposition Kapitel 4 Artikel: Reliability of SF-36 in an Internet- and a pen-and-paper version Pause Artikel v. Annette de Thurah.
Database Some walk through lv/ Figures & some text from: © Pearson Education Limited 1995,
Ellen Holm, Forskningscafé
Den multiple regressionsmodel 21. september 2005
Kapitel 5: Tabeller og sammenhænge
Anvendt Statistik Lektion 8
Program – dag 2 (11. april 2011) Dag 2:
Anvendt Statistik Lektion 6
Niveau 3: Regressionsanalyse: Tværsnitsundersøgelser
Præsentationens transcript:

Program Korrelation Gamma Pearsons r Regression Kausalitet 1

Eksempel: Korrelation En stikprøve på 181 fans af HIMYM / StarWars / James Bond / TV Charlie … er indsamlet. Respondenterne er bl.a. blevet spurgt om deres alder og (på en skala fra 1-10) i hvilken grad de anser sig selv for fan af HIMYM / StarWars / James Bond / … /

Goodman – Kruskal Gamma A non-parametric measure of correlation is Goodman Kruskal Gamma (G) which is based on the difference between concordant pairs (C) and discordant pairs (D). Gamma is computed as follows: G = (C-D)/(C+D) Thus, Gamma is the surplus of concordant pairs over discordant pairs, as a percentage of all pairs, ignoring ties. Gamma defines perfect association as weak monotonicity. Under statistical independence, Gamma will be 0, but it can be 0 at other times as well (whenever concordant minus discordant pairs are 0). Gamma is a symmetric measure and computes the same coefficient value, regardless of which is the independent (column) variable. Its value ranges between +1 to –1. Kilde: http://www.unesco.org/webworld/idams/advguide/Chapt4_2.htm

Eksempel på analyse af brugervenlighed ved spørgsmålet: ”Jeg fandt det, jeg ledte efter”. En stikprøve på 20 udtages blandt landets kommuner. Webmasteren spørges, hvor mange sider der er på kommunens website. Data kobles til scoren på spørgsmålet ”Jeg fandt det, jeg ledte efter.” Antal sider. Gns: 1.127. Std.afv.: 162. Brugervenlighed. Gns: 2,7. Std.afv.: 0,7.

Korrelation Korrelationen, som forkortes med bogstavet r, beskriver den linære association mellem x og y. Korrelationen ‘r’ er et tal i intervallet mellem -1 og +1, begge tal inklusiv. Jo større absolut værdi af r, des stærkere er den lineære association. Korrelationen afhænger ikke af den enhed, der måles i. Kilde: http://www.sjsu.edu/faculty/gerstman/StatPrimer/correlation.pdf

Regressionsanalyse Plot x og y mod hinanden og se om de danner en ret linje

I x-y diagrammet højreklikkes og ”Tilføj trendline” vælges.

Eksempel: Brugervenlighed og antal web-sider

Regressionsanalyse Analysen fortæller os: Brugervenlighed = 0,0034 x antal sider – 1,15. Hældningen på linjen er 0,0034. Skæring med y-aksen er i -1,15 Har en kommune 1.500 sider, er et kvalificeret gæt, at kommunen scorer: (0,0034 x 1.500) - 1,15 = 3,87 – 1,15 = 2,72 på BV-spørgsmålet. Regressionsanalysen kan bruges til at forudsige værdien af y, når man kender værdien af x. Forudsigelsen er i sagens natur ikke 100% præcis (y varierer). Man bør tjekke for outliers, da de kan påvirke resultatet betydeligt

Model En (statistisk) model er ikke eksakt beskrivelse af virkeligheden. Modellen er ”kun” en approksimation, men … Den er praktisk nyttig, hvis den estimerer relationen mellem x og y relativt godt. Sort (og hvid) er virkeligheden. Rød er modellen (regressionsligningen)

Outliers ingen outliers en outlier, derløfter regressionslinjen (linjens skæring med y-aksen) en outlier, der påvirker hældningen på regressionslinjen (så hældningen bliver mindre) en outlier, derløfter ikke påvirker skæringen med y-aksen eller hældningen på regressionslinjen

Kausalitet: Årsag og virkning Betingelser for kausalitet Rækkefølge (X → Y, ikke X ← Y) Association mellem X og Y. Udtrykkes operationelt f.eks. ved regression eller en korrelationskoefficient, f.eks. r. Positive r værdier tyder på en positive association (sammenhæng) Negative r værdier tyder på en negative association r værdier tæt på +1 eller -1 tyder på en stærk lineær association r værdier tæt på 0 tyder på en svag association Udelukkelse af andre forklaringer X: Salg af is, Y: Drukne ulykker Hypotese: X → Y 12