Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Ved Henrik Lolle MAP Efterår 2007 - Kvantitativ metode, del 2 1 Kvantitativ metode del 2 MAP efterår 2006 Lørdag den 8. december Analyse.

Lignende præsentationer


Præsentationer af emnet: "Ved Henrik Lolle MAP Efterår 2007 - Kvantitativ metode, del 2 1 Kvantitativ metode del 2 MAP efterår 2006 Lørdag den 8. december Analyse."— Præsentationens transcript:

1 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 1 Kvantitativ metode del 2 MAP efterår 2006 Lørdag den 8. december Analyse

2 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 2 Indhold Datafangst Data og datakvalitet Kodning og ’kodebog’ Analysestrategi Analysemetoder Analyse af enkeltvariable/univariat analyse Bivariat analyse Kontrol og specificering (eller elaborering)

3 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 3 Datafangst Stikprøven liste over personer er udgangspunkt Indsamlingsmetoder, f.eks.: Post Telefon CAPI og CATI Internet Rykkerprocedure Oplæring af interviewere og andre metoder til forøgelse af svarprocent og den pålidelighed Fortrolighed og anonymitet Analyserammen: stikprøven minus bortfald

4 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 4 Data og datakvalitet Data og datasæt, f.eks. i: Excel SPSS SAS STATA Survey Exact MLwiN Kodebog, med angivelse af bl.a.: Struktur Variabelnavne labels/formater måleniveau Bortfald Svarprocent Bortfaldsanalyse vejning/poststratificering

5 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 5 Datamatricen i et tværsnitsdesign (her i form af spørgeskemaundersøgelse og SPSS-format) Respon- denter Variable

6 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 6 Variable og deres måleniveau (repetition) En variabel er en egenskab eller karakteristik, der kan knyttes til de enkelte analyseenhederne, og som varierer mellem disse. Til en variabel er knyttet et bestemt måleniveau. Spørgsmålet om måleniveau er vigtigt, da dette bestemmer, hvilke analysemetoder der er mulige. Normalt typologiseres måleniveauerne i: Nominel skala (forskelle mellem kategorier) Ordinær skala (kategorierne kan rangordnes) Intervalskala (afstanden mellem kategorier/værdier er kendt) Forholdstal-/ratioskala (ud over kendt afstand også et naturligt nulpunkt) De to sidste betragtes som oftest sammenhængende. Endvidere betragter man ofte to-delte mål som en speciel type, jævnfør pensum.

7 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 7 Kodning Sædvanligvis knytter man til hvert muligt svar i en spørgeskemaunder- søgelse en talværdi. Denne talværdi kan så fungere blot som en kode eller som en meningsfuld rang eller værdi, alt afhængig af variablens måleniveau. I visse tilfælde benyttes selve svaret som kode/værdi – f.eks. hvis respondenten bedes notere sin indkomst i kroner. Men i langt de fleste tilfælde bliver respondentens svar konverteret fra et kryds ud for et fortrykt svar til en talkode, som i eksemplet: Hvor tilfreds er du med folkeskole-området i din kommune? (sæt ét kryds) Meget tilfreds Noget tilfreds Hverken eller Noget utilfreds Meget utilfreds Ved ikke Vil ikke svare Irrelevant

8 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 8 Omkodning/rekodning samt beregning af nye variable Som oftest forestår der efter endt kodning og før analysen (eller side- løbende med analysen) et større arbejde med omkodninger/rekodninger. En af de mest hyppigt forekomne rekodninger er forening af kategorier, sådan at den nye, rekodede variabel indeholder færre kategorier end den oprindelige, som i eksemplet her: Ud over rekodninger vil der ofte også være behov for beregninger af nye variable ud fra en eller flere eksisterende variable – f.eks ifm. dannelse af indeks/skala. Meget tilfreds Noget tilfreds Hverken eller Noget utilfreds Meget utilfreds Ved ikke Vil ikke svare Irrelevant Missing Tilfreds Hverken eller Utilfreds

9 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 9 Skalaer/indeks kan forbedre såvel pålidelighed som gyldighed Mange begreber, som f.eks. køn, alder, stilling, partistemme osv. er ret ukomplicerede at finde mål for gennem en enkelt variabel, sådan at målet bliver både pålideligt og gyldigt. Ved mere abstrakte begreber som f.eks. depression, politisk deltagelse, demokratisk sindelag og konservatisme kan det være en stor fordel at benytte en serie af spørgsmål/variable til at indfange begrebet bedst muligt. Ofte vil man inden den egentlige analyse af skillelinjer og årsagssammenhænge samle serien af sådanne variable til en enkelt variabel. I sin mest simple (og meget benyttede) form beregnes den nye variabel til at være lig med summen eller gennemsnittet af den serie af variable, der prøver at indfange begrebet.

10 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 10 Analysestrategi Univariat analyse Analyse ifm. dannelse af nye variable Bivariat analyse Elaborering samt andre typer af multivariat analyse Opsummering og konklusion

11 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 11 Analysemetoder Univariate præsentationer af fordelinger (diagrammer og frekvenstabeller). Univariate statistiske mål (for typisk værdi og spredning). Krydstabelanalyse med tilhørende statistiske mål. Lineær regression, variansanalyse og kovariansanalyse. Logistisk, multinomial og ordinal regression. Klyngeanalyse. Faktoranalyse. Korrespondanceanalyse. Etc.

12 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 12 Hvad bestemmer den specifikke kombination af strategi og metoder? Problemstilling Hypoteser Variablenes måleniveau Rapportens målgruppe Vaner, tradition og evner/viden

13 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 13 Analyse af enkeltvariable - Frekvenstabeller Før de egentlige analyser af sammenhænge mellem variable er det en god ide at foretage univariat analyse. Til variable, der kan antage forholdsvis få forskellige værdier, benyttes ofte frekvenstabeller. Det drejer sig typisk om nominelt eller ordinalt skalerede variable. Nedenstående variabel (alder) er oprindelig ratioskaleret, men er her i en omkodet (ordinalskaleret) version.

14 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 14 Analyse af enkeltvariable - Figurer Aldershistogram Hvis variablen kan antage forholdsvis mange forskellige værdier, som f.eks. alder i oprindelig form, er det ofte en fordel at printe et histogram eller søjlediagram i stedet for. Samtidigt kan i øvrigt beregnes forskellige statistiske mål. I eksemplet er beregnet gennem- snit og standardafvigelse. Også stikprøvestørrelsen fremgår.

15 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 15 Statistiske mål for centraltendens og spredning Centraltendens Gennemsnit Median Typisk værdi/Modus Spredning Modalprocent Variationsbredde Kvartilafvigelse Varians (ikke nævnt i pensum) Standardafvigelse

16 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 16 Statistiske skøn 95 pct. sikkerhedsinterval for gennemsnit: 95 pct. sikkerhedsinterval for andele:

17 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 17 Eksempel: Højere skat på el? Der er et flertal i stikprøven, der går ind for betale mere for elektriciteten, hvis det hjælper i kampen mod den globale opvarmning, men hvordan med populationen?

18 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 18 Sikkerhedsinterval for andele på eksemplet med elpriser Meningsmålingen fra Gallup, februar 2007, viser altså, at 58 pct. i en stikprøve på personer, tilfældigt udvalgt blandt den danske befolkning på 18 år og derover, går ind for at betale mere for elektriciteten, hvis det hjælper i kampen mod den globale opvarmning. Undersøgelsesspørgsmål: Indenfor hvilket interval ligger denne andel i populationen med 95 pct. sikkerhed (selv under den ’konservative’ antagelse, at alle ’ved ikke’-svarerne vil ende med at gå imod højere skat? 95 pct. sikkerhedsinterval hvor indenfor populationens andel ligger: Med 95 pct. sikkerhed ligger andelen i populationen altså over 50 pct.

19 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 19 Endnu et eksempel: Valgbarometer SF er ifølge valgbarometeret gået frem siden valget i Men hvordan med sikkerheden i konklusionen om at SF er gået frem i populationen? Jeg antager, at dem, der har svaret ’ved ikke’ enten ikke vil stemme eller vil fordele sig som de øvrige.

20 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 20 Sikkerhedsinterval for andele på eksemplet med valgbarometeret 95 pct. sikkerhedsinterval for tilslutning til SF: På baggrund af barometret kan man altså med 95 pct. sikkerhed sige, at tilslutningen til SF ligger højere end ved valget i Vær imidlertid opmærksom på, at dette er et sikkerhedsinterval, ikke en formel test for forskel fra valgets 6 pct. Når det drejer sig om andele, kan der i sjældne tilfælde forekomme forskel i konklusion, afhængigt af om man benytter sikkerhedsinterval eller formel hypotesetest. Hvilket også kan skrives således:

21 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 21 Bivariat fordeling - krydstabel To enkeltvariables fordeling Fordelingen af ’Tro på Gud’ betinget af vær- dien på kønsvariablen (kun ’rå’ frekvenser)

22 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 22 Hvilke procenter skal som hovedregel angives i den bivariate fordeling? Hvis man, som det ofte er tilfældet, kan udpege den ene variabel som den afhængige og den anden som den uafhængige, så er det standard, at vise procentfordeling af den afhængige variabel, opdelt på den uafhængige variabels værdier (forklaring følger). En sådan procentuering kaldes også for den betingede fordeling af den afhængige variabel. Her den betingede fordeling af Gudstro. Det fremgår af den betingede fordeling, at der er sammenhæng i stikprøven: kvinder har større tendens til at tro på Gud end mænd. Spørgsmålet er, om det også gælder for populationen som helhed.

23 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 23 Betingede og marginale fordelinger Betingede fordelinger (betinget af værdien på kønsvariablen) Marginal fordeling/randfordeling

24 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 24 Et andet eksempel med tydelig sammenhæng Jo højere uddannelse, jo mere er man uenig i, at arbejde blot er for pengenes skyld.

25 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 25 Eksemplet er ikke nær så let at tolke ved de ’rå’ frekvenser

26 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 26 Kolonneprocenter er heller ikke gode, når variablene er placeret i tabellen på denne måde

27 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 27 Ofte vil man bede SPSS om at printe både de rå frekvenser og en procentstørrelse ud På den måde kan man nemmere bedømme, om de forskellige betingede fordelinger kunne være opstået pga. tilfældigheder.

28 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 28 Man kan også nemt omstrukturere tabellen i SPSS, så den bliver mere overskuelig: Det gøres i SPSS ved først at dobbeltklikke på tabellen. Dernæst højreklikkes, og man vælge ’Pivoting Trays’. Herefter kan tabellen omstruktureres ved at flytte rundt på ’pile-firkanterne’.

29 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 29 Man kan selvfølgelig også vælge at præsentere sammenhængen grafisk Arbejde er blot for at tjene penge, opdelt på uddannelsesniveau

30 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 30 Chi 2 -testen for uafhængighed mellem to variable Det er tydeligt, at der i stikprøven er forskel i troen på Gud mellem mænd og kvinder. Men kan hvor sikker kan man være på, at der også i populationen eksisterer en forskel? Kan forskellen i stikprøven blot skyldes tilfældig skævhed i stikprøveudtrækningen?

31 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 31 Grundtræk i Chi 2 -test for uafhængighed mellem to variable To variable er uafhængige, hvis de betingede fordelinger er ens i populationen. Chi 2 -testen går ud på at teste en nul-hypotese om uafhængighed mellem to kategoriske variable på baggrund af stikprøvedataene: H 0 : Variablene er statistisk uafhængige H A : Variablene er statistisk afhængige

32 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 32 Chi 2 -testen benytter antal forventede og observerede værdier i beregningerne Det forventede antal observationer i hver tabelcelle er det antal observationer, som man kunne forvente, hvis der var uafhængighed mellem variablene, og givet at de marginale fordelinger er som i tabellen. Man ville altså ved uafhængighed forvente, at der for både mænd og kvinder gjaldt, at 43,3 pct. sagde ’nej’, mens 56,7 pct. sagde ’ja’.

33 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 33 Fra SPSS får man resultaterne af chi 2 -testen nedenunder krydstabellen Signifikansniveauet eller p-værdien (’p’ for probability), som er resultatet af Chi 2 -testen angives i dette tilfælde til 0,000 (dvs. < 0,0005). P-værdien er sandsynligheden for, i en stikprøve med den givne størrelse, at finde mindst lige så store forskelle mellem de betingede fordelinger som i den aktuelle tabel, hvis der i popula- tionen ingen forskel er (dvs. hvis nulhypotesen er korrekt). Her forkastes nulhypotesen, fordi hvis den var korrekt, så ville det i praksis være umuligt at trække en så skæv stikprøve blot ved tilfældigheder. Den alternative hypotese accepteres derfor (’proof by contradiction’)

34 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 34 Endnu et eksempel Erhvervsvariablen kan antage flere end to forskellige værdier, samtidig med at den er nominelt skaleret. Derfor kan der ikke benyttes Gamma korrelations- koefficient. Chi 2 kan derimod stadigvæk benyttes.

35 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 35 Nogle karakteristika ved chi 2 -testen Testen angiver ikke noget om sammenhængens styrke, men kun om der ser ud til at være sammenhæng eller ej. For at være en gyldig test kræves som minimum mere end én forventet observation i hver celle, og helst ikke mere end 20 pct. af cellerne må have mindre end fem forventede observationer. Testen benytter ikke oplysninger om eventuel rangorden i kategorierne, hvilket i nogle tilfælde er en fordel og i andre en ulempe: Det er en fordel i de tilfælde, hvor der enten ikke er nogen rangorden på kategorierne, eller hvor sammenhængen i hvert fald ikke er rangordensmæssig. Det er en ulempe i de tilfælde, hvor der er en rangordensmæssig sammenhæng. I det tilfælde findes der andre test-størrelser, der er stærkere.

36 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 36 Korrelationskoefficienten Gamma Hvis man har at gøre med rangordnede data (ordinalskalerede variable), og man samtidig har en hypotese om, at sammenhængen mellem de to variable er rangordensmæssig (monoton), bør man benytte en rang- korrelationskoefficient. En rang-korrelationskoefficient fortæller om sammenhængens retning (fortegn) og styrke – med værdier mellem –1 og +1. Desuden benyttes en sådan koefficient ofte ifm. hypotesetest, hvor H 0 lyder, at værdien af koefficienten i populationen er lig med 0. Dikotome variable kan altid, uanset måleniveau, benyttes ifm. rangkorrelationskoefficienter Der findes en del af disse – Kendall’s tau b og c, Sommers’ d, Spearman, Gamma osv. Der ses alene på Gamma i det følgende.

37 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 37 Gamma koefficientens styrke +1,00 -1,00 0,00 +0,10 +0,30 -0,10 -0,30 Ingen nævneværdig sammenhæng Svag positiv sammenhæng +0,20 -0,20 Moderat positiv sammenhæng Stærk positiv sammenhæng Perfekt positiv sammenhæng Svag negativ sammenhæng Moderat negativ sammenhæng Stærk negativ sammenhæng Perfekt negativ sammenhæng Fra Nielsen & Kreiner (1998): SPSS. Introduktion til databehandling & statistisk analyse. Jurist- og Økonomforbundets Forlag. Dette er én tolkning. Der er langt fra enighed om, hvordan man kan karakterisere forskellige værdier af Gamma.

38 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 38 Eksempel på positiv sammenhæng Jo højere uddannelse, jo mere er man typisk uenig i, at man arbejder blot for at tjene penge. Gamma-koefficienten viser også en stærk og statistisk signifikant sammenhæng: P-værdien tolkes substantielt på samme måde som ved Chi 2 - testen. Der er derfor her tale om en meget sikker sammenhæng.

39 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 39 Eksempel på negativ sammenhæng Jo højere værdi på urbaniseringsvariablen, jo mere tendens er der til lav værdi på variablen for tro på Gud

40 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 40 Endnu et eksempel på rangordensmæssig sammenhæng

41 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 41 SPSS output til krydstabellen med bl.a. Gamma Gamma-værdien fortæller, at der er tale om en moderat til stærk sammenhæng mellem de to variabler. Dette er imidlertid et deskriptivt mål og angår alene stikprøvens data. Hvad gælder så for populationen? Som nævnt i foregående slide, kan man tolke på p-værdien for at sige noget om, hvor sikkert der i populationen er en sammenhæng. Man kan imidlertid også beregne et sikkerhedsinterval for Gamma. Ved et 95 pct. sikkerhedsinterval angives et interval, hvorom det kan siges, at Gamma i populationen med 95 pct. sikkerhed ligger indenfor. Et sådan sikkerhedsinterval fås ved at gå ca. to standardfejl på hver side af Gamma-estimatet fra stikprøven.

42 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 42 Beregning af 95 pct. sikkerhedsinterval for Gamma Estimeret Gamma: 0, pct. sikkerhedsinterval Populationens Gamma-værdi ligger med 95 pct. sikkerhed her inden for.

43 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 43 Hypotesetest med Gamma SPSS foretager automatisk en hypotesetest for os, hvor nulhypotesen lyder, at Gamma i populationen er lig med nul. I dette tilfælde forkastes nulhypotesen. Testen har denne form: Men vær opmærksom på, at standardfejlen ved hypotesetest er anderledes end ved beregning af sikkerhedsinterval (fremgår af note b til tabellen)! Som oftest vil forskellen dog være marginal.

44 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 44 Gamma kan i visse situationer bedre ’spotte’ sammenhænge end Chi 2 Lavere p-værdi for Gamma-testen, selvom det er samme krydstabel

45 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 45 Men i nogle situationer er det omvendt! Læg i tabellen mærke til den kurveagtige sammen- hæng! Læg dernæst mærke til Cramer’s V og Gamma! (Cramer’s V er baseret på Chi 2 )

46 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 46 Et lignende eksempel, blot kraftigere tendens

47 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 47 Eksempel på trivariat analyse (A1) Procent-difference på ca. 20 Signifikant Gamma i forventet positiv retning Først bivariat:

48 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 48 Eksempel på trivariat analyse (A2) Kontrol for egen skoleuddannelse (’Lav’ udtaget pga. pladshensyn)

49 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 49 Eksempel på trivariat analyse (A3) Den fulde tabel frekvenser og rækkeprocenter

50 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 50 Eksempel på trivariat analyse (A4) I tolkningen bør man se efter følgende: Markante forskelle mellem de lokale Gamma’er (interaktion/specificerende tredje- variabel) Markant ændring fra bivariat til kontrolleret Gamma-værd (forklaring) Det mest afgørende i dette eksempel er ændringen fra bivariat til kontrolleret Gamma (se nærmere på næste planche!). ’Lokale’ Gammakoefficienter BivariatKontrolleret

51 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 51 Eksempel på trivariat analyse (A5) Faders uddannelse Selv- placering Bivariat: Grafisk illustration af sammenhænge. Her er der tale om forklaring. Denne effekt er fundet ved at se på sammenhængen ml. Egen uddannelse og Selvplacering, kontrolleret for Faders uddannelse. Faders uddannelse Egen uddannelse Selv- placering Trivariat: Denne effekt er fundet ved at se på den bivariate sammenhæng ml. Faders uddannelse og Egen uddannelse.

52 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 52 Eksempel på trivariat analyse (A6) Konklusion: Effekten fra faderens uddannelse på respondentens selvplacering i samfundspyramiden er for i hvert fald langt den største part en indirekte effekt gennem respondentens egen uddannelse. Respondentens egen uddannelse er altså en mellemkommende variabel i dette tilfælde.

53 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 53 Er den partielle Gamma signifikant forskellig fra den bivariate Gamma? Den partielle og den bivariate Gamma vil aldrig være nøjagtig lig med hinanden. Men hvor meget skal den partielle Gamma være forskellig fra den bivariate, førend man kan sige, at de er signifikant forskellige, og at forskellen altså ikke blot skyldes tilfældigheder? Det kan man ikke bestemme statistisk, og man kan ikke blot beregne konfidensintervaller for henholdsvis den partielle og den bivariate for at se, om de rager ind over hinanden. Dette er ikke et optimalt stærkt test. Hvis den partielle Gamma er statistisk signifikant forskellig fra nul, er spørgsmålet om, hvorvidt der er sket en vis forklaring, en subjektiv vurdering.

54 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 54 Eksempel på trivariat analyse (B1) Uddannelsesgrad og seksuelle relationer med andre end partner

55 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 55 Eksempel på trivariat analyse (B2) Kontrol for alder i tre kategorier:

56 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 56 Eksempel på trivariat analyse (B3) De tre lokale Gamma’er plus bivariat (’Zero-Order’) og partial Gamma (’First- Order’ fordi der er én kontrolvariabel):

57 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 57 Eksempel på trivariat analyse (B4) Sammenhængens styrke afhænger imidlertid af ens alder, sådan at stigende alder betyder stærkere effekt fra uddannelse. Der er altså interaktion mellem alder og uddannelse. Man kan også sige, at alder specificerer sammenhængen mellem uddannelse og synet på utroskab. Det skal tilføjes, at ovenstående stadigvæk kun kan betragtes som en indledende analysekonklusion. Konklusion: Om man helt eller delvist bifalder utroskab afhænger tilsyneladende af uddannelsesgrad, sådan at jo højere uddannelse, jo mere bifalder man typisk utroskab.

58 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 58 Eksempel på trivariat analyse (B5) Uddannelse Alder Syn på utroskab Uddannelse Syn på utroskab Bivariat Trivariat Grafisk illustration af sammenhænge. Her er der tale om interaktion.

59 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 59 Hvornår kan man tale om interaktion? Interaktion i tabelanalyse betyder, at sammenhængen mellem den uafhængige og den afhængige variabel varierer signifikant mellem de forskellige lokale tabeller. I Gamma-analyse betyder det altså, at de lokale Gammaer ikke er ens/homogene. De lokale Gammaer kan rent statistisk testes for homogenitet.* Man kan også vurdere spørgsmålet om interaktion lidt mindre formelt statistisk og lidt mere teoretisk. Hermed menes, at hvis det ikke ud fra de lokale Gamma-værdier med tilknyttede standardfejl og p-værdier er åbenlyst, at de lokale Gamma-værdier er forskellige, så kan man vurdere, om mønstret for forskelle stemmer overens med ens teoretiske forhånds- antagelser (hypoteser). Eventuelt kan sådanne overvejelser suppleres med at lave sikkerhedsinterval omkring hver enkelt lokal Gamma for at se, om disse intervaller overlapper hinanden. Gør de det, kan de ikke dømmes forskellige. Husk her at gange standardfejlen med 1,4 i stedet for 1,96 som vanligt ved 95 pct. sikkerhedsniveau. * Se f.eks. Sven Kreiner (1999): ”Statistisk problemløsning”. Jurist- og Økonomforbundets Forlag.

60 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 60 Paradokser i kontrollerede analyser Nogle gange kan kontrollerede analyser virke ikke blot overraskende, men ligefrem paradoksale. Der kan således ske følgende: Den bivariate analyse viser, at der ikke er sammenhæng mellem de to variable, X og Y. Efter kontrol for en tredje variabel, Z, ’fremvaskes’ en signifikant sammenhæng mellem X og Y. Den bivariate analyse viser en signifikant positiv sammenhæng mellem to variable, X og Y. Efter kontrol for en tredje variabel, Z, fremstår imidlertid en signifikant negativ sammenhæng mellem X og Y. Den modsatte bevægelse kan selvfølgelig så også forekomme, altså hvor der ses en negativ bivariat sammenhæng. Fænomenet kaldes for Simpson’s paradoks. Der vises et eksempel på begge paradokser i det følgende.

61 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 61 Bivariat sammenhæng mellem uddannelse og indkomst (fra A&F, eksempel 10.5)

62 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 62 Kontrol for alder

63 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 63 Hvorfor viser den bivariate ingen sammenhæng? Alder Uddannelse Løn + + Der er ganske vist en tendens til, at højere uddannelse alt andet lige typisk også giver en højere løn. Men samtidig gælder, at der blandt de lavtuddannede er en overrepræsentation af ældre, og alt andet lige gælder samtidig, at ældre får en højere løn end unge pga. deres højere ancienitet. I den bivariate tabel bliver alderseffekten blandet sammen med uddannelseseffekten.

64 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 64 Kontrol er altså nogle gange relevant på trods af manglende bivariat sammenhæng Når der forekommer suppressor-variabel er kontrol relevant, på trods af at der ikke ses nogen bivariat sammenhæng. I dette tilfælde fungerer aldersvariablen som suppressor-variabel, fordi den i den bivariate situation undertrykker sammenhængen mellem uddannelse og løn. Fænomenet kaldes også for ’spuriøs ikke-sammenhæng’.

65 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 65 Simpson’s paradoks Endnu et paradoks, der kan forekomme lige så mærkværdigt, er det, der ofte kaldes for ’Simpsons paradoks’. Her ses en bivariat sammenhæng, men efter kontrol sker der ikke blot det, at effekten svinder ind, men at den ligefrem skifter fortegn. Først den bivariate sammenhæng (mellem morders hudfarve og dom): (Eksemplet er fra Kreiner (1999): Statistisk problemløsning.) OBS! Ikke det samme eksempel som Agresti & Finlay ex. 10.6, som ganske vist ligner, men som drejer sig om interaktion.

66 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 66 Kontrol for offerets hudfarve

67 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 67 Kausaldiagram Morder sort Offer sort Dødsdom + + Den indirekte, negative effekt gennem offerets farve er stærkere end den direkte, positive effekt. Derfor ses der en negativ effekt fra sort morder til dødsdom (eller det samme, men formuleret i overensstemmelse med tabellen: en negativ effekt fra hvid morder til ikke dødsdom).

68 Ved Henrik Lolle MAP Efterår Kvantitativ metode, del 2 68 Partial Gamma i SPSS I SPSS kan man ved en simpel tilføjelse til en syntax for kontrolleret krydstabel få beregnet denne størrelse. Eksempel på syntax i SPSS: CROSSTABS variables fme_udd3 (1,3) selvpla3 (1,3) e_uddan3 (1,3) /TABLES=fme_udd3 BY selvpla3 BY e_uddan3 /FORMAT= AVALUE TABLES /STATISTIC=GAMMA /CELLS= COUNT ROW /COUNT ROUND CELL. Tilføjelse. Tallene i parentes indikerer min- og max-værdier for variablene. CROSSTABS /TABLES=fme_udd3 BY selvpla3 BY e_uddan3 /FORMAT= AVALUE TABLES /STATISTIC=GAMMA /CELLS= COUNT ROW /COUNT ROUND CELL.


Download ppt "Ved Henrik Lolle MAP Efterår 2007 - Kvantitativ metode, del 2 1 Kvantitativ metode del 2 MAP efterår 2006 Lørdag den 8. december Analyse."

Lignende præsentationer


Annoncer fra Google