Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Program Korrelation Gamma Pearsons r Regression Kausalitet 1.

Lignende præsentationer


Præsentationer af emnet: "Program Korrelation Gamma Pearsons r Regression Kausalitet 1."— Præsentationens transcript:

1 Program Korrelation Gamma Pearsons r Regression Kausalitet 1

2 Eksempel: Korrelation
En stikprøve på 181 fans af HIMYM / StarWars / James Bond / TV Charlie … er indsamlet. Respondenterne er bl.a. blevet spurgt om deres alder og (på en skala fra 1-10) i hvilken grad de anser sig selv for fan af HIMYM / StarWars / James Bond / … /

3 Goodman – Kruskal Gamma
A non-parametric measure of correlation is Goodman Kruskal Gamma (G) which is based on the difference between concordant pairs (C) and discordant pairs (D). Gamma is computed as follows: G = (C-D)/(C+D) Thus, Gamma is the surplus of concordant pairs over discordant pairs, as a percentage of all pairs, ignoring ties. Gamma defines perfect association as weak monotonicity. Under statistical independence, Gamma will be 0, but it can be 0 at other times as well (whenever concordant minus discordant pairs are 0). Gamma is a symmetric measure and computes the same coefficient value, regardless of which is the independent (column) variable. Its value ranges between +1 to –1. Kilde:

4 Eksempel på analyse af brugervenlighed ved spørgsmålet: ”Jeg fandt det, jeg ledte efter”.
En stikprøve på 20 udtages blandt landets kommuner. Webmasteren spørges, hvor mange sider der er på kommunens website. Data kobles til scoren på spørgsmålet ”Jeg fandt det, jeg ledte efter.” Antal sider. Gns: Std.afv.: 162. Brugervenlighed. Gns: 2,7. Std.afv.: 0,7.

5 Korrelation Korrelationen, som forkortes med bogstavet r, beskriver den linære association mellem x og y. Korrelationen ‘r’ er et tal i intervallet mellem -1 og +1, begge tal inklusiv. Jo større absolut værdi af r, des stærkere er den lineære association. Korrelationen afhænger ikke af den enhed, der måles i Kilde:

6 Regressionsanalyse Plot x og y mod hinanden og se om de danner en ret linje

7 I x-y diagrammet højreklikkes og ”Tilføj trendline” vælges.

8 Eksempel: Brugervenlighed og antal web-sider

9 Regressionsanalyse Analysen fortæller os:
Brugervenlighed = 0,0034 x antal sider – 1,15. Hældningen på linjen er 0,0034. Skæring med y-aksen er i -1,15 Har en kommune sider, er et kvalificeret gæt, at kommunen scorer: (0,0034 x 1.500) - 1,15 = 3,87 – 1,15 = 2,72 på BV-spørgsmålet. Regressionsanalysen kan bruges til at forudsige værdien af y, når man kender værdien af x. Forudsigelsen er i sagens natur ikke 100% præcis (y varierer). Man bør tjekke for outliers, da de kan påvirke resultatet betydeligt

10 Model En (statistisk) model er ikke eksakt beskrivelse af virkeligheden. Modellen er ”kun” en approksimation, men … Den er praktisk nyttig, hvis den estimerer relationen mellem x og y relativt godt. Sort (og hvid) er virkeligheden. Rød er modellen (regressionsligningen)

11 Outliers ingen outliers
en outlier, derløfter regressionslinjen (linjens skæring med y-aksen) en outlier, der påvirker hældningen på regressionslinjen (så hældningen bliver mindre) en outlier, derløfter ikke påvirker skæringen med y-aksen eller hældningen på regressionslinjen

12 Kausalitet: Årsag og virkning
Betingelser for kausalitet Rækkefølge (X → Y, ikke X ← Y) Association mellem X og Y. Udtrykkes operationelt f.eks. ved regression eller en korrelationskoefficient, f.eks. r. Positive r værdier tyder på en positive association (sammenhæng) Negative r værdier tyder på en negative association r værdier tæt på +1 eller -1 tyder på en stærk lineær association r værdier tæt på 0 tyder på en svag association Udelukkelse af andre forklaringer X: Salg af is, Y: Drukne ulykker Hypotese: X → Y 12


Download ppt "Program Korrelation Gamma Pearsons r Regression Kausalitet 1."

Lignende præsentationer


Annoncer fra Google