En forkert måde at konstruere psykologiske tests Oplæg i Psykologisk Selskab for Forskningsmetodologi 28. januar Cand. Psych., ph.d. Jan Ivanouw Københavns.

En forkert måde at konstruere psykologiske tests Oplæg i Psykologisk Selskab for Forskningsmetodologi 28. januar Cand. Psych., ph.d. Jan Ivanouw Københavns Universitet

Personlighedstesten DAPP (Dimensional Assessment of Personality Pathology)

Forskningsprojekt Projekt: Stig Poulsen, Louise Balslev Garnæs, Jan Ivanouw: Findes der hos bulimikere forskellige personlighedstyper? Dataindsamling fra 110 bulimikere med testen DAPP (indeholdende 18 subskalaer) Indledende check af skalaerne i DAPP med CFA viser at de ikke er endimensionale (=dårlige)

DAPP overordnede skalaer
Emotionel dysregulering Dissocial behaviour Inhibition Compulsiveness

DAPP: Emotionel dysregulering
Affective instability Anxiety Cognitive distortion Identity problems Insecure attachment Oppositionality Self-harm Social avoidance Submissiveness Suspiciousness Narcissism

DAPP: Dissocial behavior
Collousness Stimulus seeking Rejection Conduct problems * * Gennemgås nærmere nedenfor

DAPP: Inhibition Intimacy problems * Restricted expression
* Gennemgås nærmere nedenfor

DAPP: Compulsivity Compulsivity

Gennemgang af DAPP-skalaer
For at forstå negative resultater, gennemses spørgsmålene i DAPP Eksempler på skalaer der gennemgås: Intimacy problems Conduct problems

Undersøgelse af skalaer: Konfirmatorisk faktoranalyse CFA

Eksplorerende faktoranalyse EFA

CFA med 3 latente variable

Vurdering af målingsmodel
Klassisk psykometri: - Cronbach’s alfa Ny psykometri: - Globale fitindekser - Itemparametre

Globale fitindekser Hvor godt passer målingsmodellen (skalaerne) som helhed til de observerede data? Chi-square (ki-i-anden) skal ikke vise signifikant forskel mellem model og data Andre fitindekser

Itemparametre 1) Intercept, threshold, sværhedsgrad
2) Loading, slope, diskriminationsgrad * Ad 2) Loading Viser hvor godt et item passer til skalaen (= samlingen af de andre items) Skal være rimeligt høj (gerne > 0.40)

Vurdering af DAPP-skalaer

DAPP: Intimacy problems
54r Jeg nyder at blive seksuelt stimuleret 60r Nære relationer er meget vigtige i mit liv 66r Jeg nyder nære relationer 89r Jeg har stor nydelse ved elskov 93 Jeg bliver sjældent, om nogen sinde, seksuelt ophidset 96r Jeg har brug for nære forhold 134r Jeg vil gerne dele mit liv med nogen 135 Jeg følger mig utilpas i nære forhold

Intimacy problems 1 - globale fitindekser
Chi-Square Test of Model Fit Value Degrees of Freedom P-Value [ikke signifikant]* CFI/TLI CFI [> 0.95] TLI [> 0.95] RMSEA (Root Mean Square Error Of Approximation) Estimate [< 0.05] 90 Percent C.I Probability RMSEA <= [< 0.05] WRMR (WEIGHTED Root Mean Square Residual) Value [< 1.00] * betingelserne i [] angiver den gode model

Intimacy problems 2 - itemparametre: loadings
Estimate S.E. Est./S.E. P-Value Intimacy problems BY 054r 060r 066r 089r 096r 134r

Intimacy problems For at forklare de dårlige fitindekser gennemgås de indgående items Det viser sig at de falder i to grupper: Relation Sex

Intimacy problems: Relation
60r Nære relationer er meget vigtige i mit liv 66r Jeg nyder nære relationer 96r Jeg har brug for nære forhold 134r Jeg vil gerne dele mit liv med nogen 135 Jeg følger mig utilpas i nære forhold

Intimacy problems: Sex
54r Jeg nyder at blive seksuelt stimuleret 89r Jeg har stor nydelse ved elskov 93 Jeg bliver sjældent, om nogen sinde, seksuelt ophidset

Intimacy problems: Relation 1 - globale fitindekser

Intimacy problems: Relation 2 - itemparametre: loadings
Estimate S.E. Est./S.E. P-Value Intimacy problems BY 060r 066r 096r 134r

Intimacy problems: Sex 1 - globale fitindekser: giver ikke mening med kun 3 items

Intimacy problems: Sex 2 - itemparametre: loadings
Estimate S.E. Est./S.E. P-Value Intimacy problems BY 0540r 089r

Intimacy problems Der fås bedre fitindekser og acceptable loadings når skalaen opdeles i to: relationer og sex

DAPP: Conduct problems
48 Til tider har jeg drukket så meget alkohol, at jeg bagefter ikke kunne huske, hvad der skete 61 Alkohol har givet mig problemer ved talrige lejligheder 68 Når jeg er uenig med nogen, truer jeg dem somme tider med vold 73 Jeg ville gøre noget ulovligt, hvis jeg vidste, at jeg ikke ville blive pågrebet 78 Der har været tidspunkter i mit liv, hvor jeg gentagne gange har drukket alkohol til overmål 92 Som barn påsatte jeg ildebrande, der skadede ejendom 108 Jeg har taget ting, der ikke var mine 124 Da jeg var ung, ødelagde jeg bevidst ting, der ikke tilhørte mig

Conduct problems 1 - globale fitindekser
Chi-Square Test of Model Fit Value Degrees of Freedom P-Value [ikke signifikant]* CFI/TLI CFI [> 0.95] TLI [> 0.95] RMSEA (Root Mean Square Error Of Approximation) Estimate [< 0.05] 90 Percent C.I Probability RMSEA <= SRMR (Standardized Root Mean Square Residual) Value [< 1.00] * betingelserne i [] angiver den gode model

Conduct problems 2 - itemparametre: loadings
Estimate S.E. Est./S.E. P-Value Intimacy problems BY

Conduct problems For at forklare de dårlige fitindekser gennemgås de indgående items Det viser sig at de falder i to grupper: Alkoholmisbrug Antisocial adfærd

Conduct problems: Alkohol
48 Til tider har jeg drukket så meget alkohol, at jeg bagefter ikke kunne huske, hvad der skete 61 Alkohol har givet mig problemer ved talrige lejligheder 78 Der har været tidspunkter i mit liv, hvor jeg gentagne gange har drukket alkohol til overmål

Conduct problems: Antisocial
68 Når jeg er uenig med nogen, truer jeg dem somme tider med vold 73 Jeg ville gøre noget ulovligt, hvis jeg vidste, at jeg ikke ville blive pågrebet 92 Som barn påsatte jeg ildebrande, der skadede ejendom 108 Jeg har taget ting, der ikke var mine 124 Da jeg var ung, ødelagde jeg bevidst ting, der ikke tilhørte mig

Conduct problems: Alkohol 1 - globale fitindekser: giver ikke mening med kun 3 items

Conduct problems: Alkohol 2 - itemparametre: loadings

Conduct problems: Antisocial 1 - globale fitindekser
Chi-Square Test of Model Fit Value Degrees of Freedom P-Value [ikke signifikant]* CFI/TLI CFI [> 0.95] TLI [> 0.95] RMSEA (Root Mean Square Error Of Approximation) Estimate [< 0.05] 90 Percent C.I Probability RMSEA <= SRMR (Standardized Root Mean Square Residual) Value [< 1.00] * betingelserne i [] angiver den gode model

Conduct problems: Antisocial 2 - itemparametre: loadings

Conduct problems Der fås bedre fitindekser og loadings når skalaen opdeles i to: alkoholmisbrug og antisocial adfærd

Konklusion om skalaerne i DAPP
Der indgår i mange af skalaerne items som handler om forskellige begreber og som ikke korrelerer med hinanden Dette kan opdages gennem CFA-analyser Skalaerne kan forbedres ved ændret selektion af items til skalaerne

Hvorfor problematiske skalaer? Se på konstruktionsprocessen

Udviklingen af DAPP 1 Ambition hos Livesley at supplere diagnoserne for personlighedsforstyrrelser, som er opdelte kategorier, med dimensioner til måling af egenskaber hos personer med personlighedsforstyrrelser Livesley, J. W. et al. (1991). Dimensions of personality pathology. Canadian Journal of Psychiatry, 36,

Udviklingen af DAPP 2 Indsamling af formuleringer til items fra professionelle i psykiatrien Analyse med Principal Componentanalyse (PCA) PCA også anvendt i senere undersøgelser, herunder i udvikling af en kortere version (DAPP-SF) i Holland og Danmark Problemet er PCA-metoden

Psykologisk måling

Psykologisk måling Psykologisk forskning involverer som regel måling af psykologiske egenskaber Psykologiske vurderinger af enkeltpersoner involverer som regel måling af psykologiske egenskaber En metode til måling af psykologiske egenskaber kaldes ofte en psykologisk test

Datareduktion, forudsigelse, måling
Som udgangspunkt for psykologisk måling har man ofte mange informationer: Testpersonens/fpps svar på spørgsmål Observationer af testperson/fpp Testpersonens/fpps registrerede reaktioner på standardiseret materiale Reduktion af mange informationer: Blot forudsigelse? Måling?

Forudsigelse Personundersøgelse: Forskning:
Forudsige enkeltpersonens mulige udvikling, handlinger i bestemte situationer og under bestemte forudsætninger Forskning: Forudsige et systems (f.eks. en populations) tilstand og udvikling under bestemte forudsætninger Forudsigelse kræver måling af de indgående prædiktorer

Måling En psykologisk egenskab eksisterer
I personundersøgelse er formålet at måle i hvor høj grad personen har forskellige egenskaber I forskning er formålet at måle en faktor for at forstå den i sammenhæng med andre faktorer

Forudsigelse og regressionsanalyse
Den typiske situation En række potentielle prædiktorer (målt med relevante metoder) En tilstand eller begivenhed der skal forudsiges Prædiktorerne skal ikke være korrelerede

Formative og refleksive modeller

MB Fig 6.1

Refleksiv målingsmodel
En latent faktor forårsager de enkelte indikatorer Personens kognitive evner er årsag til rigtige svar på kognitiv test Personens latente angst er årsag til personens svar på angsttest Eksempel fra fysikken: temperaturen er årsag til termometerets måling

Refleksiv målingsmodel og målefejl
Items påvirkes både af det der skal måles (den latente faktor) og andre forhold De andre forhold opfattes som støj/fejl og sorteres fra (kaldes unik eller fejl-varians) Dette vises i graferne som pile til items uden afsender Eksempel fra depressionstest: ’Sover du dårligt om natten’. Fejl kan stamme fra snorkende partner

Refleksiv målingsmodel og korrelation
Items der skal indgå i en måling, er som udgangspunkt korrelerede med hinanden Men korrelationen går via det der skal måles: Når de indgår i målingen, er items ikke mere korrelerede (=krav om lokal uafhængighed) I tilfælde hvor de alligevel er, skal der tages højde for det Positivt og negativt formulerede spørgsmål i en test har tendens til hver for sig at korrelere indbyrdes: Kan løses ved at indføre en metodefaktor

Formativ model De enkelte indikatorer sammenfattes som en latent faktor/komponent eller indeks Der er ikke tale om måling Der kan være tale om forudsigelse til bestemte formål i bestemte situationer Eksempel: BNP bruttonationalprodukt. Det diskuteres hvilke faktorer der skal med, eks. ressourcebelastning og klimaforhold Eksempel: Apgarscore for nyfødte

Formativ model og målefejl
Noget af informationen i de enkelte items er relevante for modellen, andre er ikke Der skelnes ikke i modellen mellem de forskellige typer af information. Alt inkluderes Dette vises i graferne som at der ikke findes pile til items uden afsender Eksempel fra Apgarscore ’blåfarvning´. Der kan være flere årsager, men det er uden betydning

Formativ model og korrelation
Items der skal indgå i en måling er som udgangspunkt ikke korrelerede med hinanden Når de indgår i samme indeks, opstår der imidlertid korrelation (der er ikke lokal uafhængighed) Eksempel: Der er ikke korrelation mellem musikalske færdigheder og at bo i optageområdet for musikgymnasiet Aurehøj. Optagelse sker ud fra indekset bopæl + musikalske færdigheder. En score på mindst 1 giver adgang til optagelse. For gruppen af elever optaget på Aurehøj er der nu (negativ) korrelation mellem bopælsområde og musikalske færdigheder.

Statistiske metoder Refleksiv målingsmodel: Formativ model:
EFA og CFA Formativ model: PCA og Partial Least Squares, PLS De formative metoder anvendes af mange som om de indebærer måling. Det gør de ikke

Eksplorerende faktoranalyse EFA

PCA Erfaring: Al information fordeles på faktorerne:
Da irrelevant information (varians) dermed ikke udskilles fra modellen, fås ofte Inhomogene skalaer For mange skalaer

Konklusion vedr. målemetoder
Personundersøgelser Find CFA-undersøgelser af de tests man vil bruge Check evt. hvordan testene er udviklet (undgå PCA) Forskning Check udviklingen af de tests man vil bruge Hvis PCA er det eneste grundlag, så undlad at bruge testen Find CFA-undersøgelser af testmetoderne Foretag CFA når man har egne data Revider evt tests ved at udelade dårlige items i egen undersøgelse (kan dog give for snæver definition af det målte begreb) Brug ikke PLS, men CFA

Litteratur Markus, K. A. og Borsboom, D. (2013) Frontiers of test validity theory. New York: Routledge.

En forkert måde at konstruere psykologiske tests Oplæg i Psykologisk Selskab for Forskningsmetodologi 28. januar Cand. Psych., ph.d. Jan Ivanouw Københavns.

Lignende præsentationer

Præsentationer af emnet: "En forkert måde at konstruere psykologiske tests Oplæg i Psykologisk Selskab for Forskningsmetodologi 28. januar Cand. Psych., ph.d. Jan Ivanouw Københavns."— Præsentationens transcript:

Lignende præsentationer

Om projektet

Feedback

Log ind

Logge ind via sociale netværk:

En forkert måde at konstruere psykologiske tests Oplæg i Psykologisk Selskab for Forskningsmetodologi 28. januar Cand. Psych., ph.d. Jan Ivanouw Københavns.

Lignende præsentationer

Præsentationer af emnet: "En forkert måde at konstruere psykologiske tests Oplæg i Psykologisk Selskab for Forskningsmetodologi 28. januar Cand. Psych., ph.d. Jan Ivanouw Københavns."— Præsentationens transcript:

Lignende præsentationer

Om projektet

Feedback