Teoretiske kontinuerte fordelinger
Normalfordeling
Normalfordeling
Forskellige normalfordelinger
Normalfordelingens egenskaber Det interessante ved en normalfordeling er at når man kender Gennemsnit Spredning Så er hele fordelingen bestemt Gennemsnit og spredning er fordelingens parametre Normalfordelingen er symmetrisk (har en skævhed på 0), og har en fladhed (kurtosis) på 0 (?)
Statistik og normalfordeling Mange statistiske metoder forudsætter at variablene er normalfordelte Hvis de ikke er det, kan man Bruge ’robuste’ metoder der ikke er så følsomme Transformere fordelingen så den bliver normalfordelt (og transformere tilbage bagefter) Ved hypoteseprøvning bruge ’ikke-parametriske’ tests Ignorere problemet (meget almindeligt)
Standardnormalfordelingen En normalfordeling med gennemsnit 0 og spredning 1, kaldes en standardnormalfordeling X-aksen til en standardnormalfordeling har derfor 0 i midten; man ser typisk 1, 2 og 3 på hver siden af midten (selvom fordelingen teoretisk strækker sig fra – til + uendeligt) X-aksen betegnes med ofte med z
Standardnormalfordeling
Standardnormalfordeling
Standardnormalfordeling
Percentiler i standardnormalfordelingen Standardnormalfordelingen er minutiøst gennemregnet, så man ved hvor mange % der afskæres forskellige steder i fordelingen
Percentiler for standardnormalfordelingen
Standardisering Man kan omdanne enhver anden normalfordeling til en standardnormalfordeling ved at trække gennemsnittet af alle værdierne fra hver enkelt værdi, og derefter dividerer dem med spredningen i fordelingen Man kalder denne beregning for at man standardiserer en variabel
Standardisering af variabel
Omsætte scores til z-scores
WAIS-scores
t-fordeling
t-fordelingen En t-fordeling (Student’s t) ligner en normalfordeling, men er lidt forskellig alt efter hvor mange personer der indgår i fordelingen Hvis der er ret få personer, stiger sandsynligheden for at en for stor del har ekstremt høje eller lave scores. Derfor er t-fordelingen mere flad: mere spredt ud og lavere i midten jo færre personer der er i fordelingen Man taler om fordelingens frihedsgrader (df). I t-fordelingen er df = n-2
Anvendelse af t-fordelingen Undersøgelse af om der er signifikant forskel mellem gennemsnittene i to grupper Generelt: undersøgelse af gennemsnitsforskelle
t-fordeling
Ki-i-anden fordeling
Anvendelse af ki-i-anden fordelingen Ki-i-anden anvendes i mange sammenhænge: Undersøgelse af frekvenserne i en tabel viser systematiske forskelle Undersøgelse af om en fordeling har en bestemt form (f.eks. om den er normalfordelt) Undersøglse af om en bestemt statistisk model passer godt med observerede data Sammenligning af to statistiske modeller for at se hvilken der bedst passer med observerede data
Ki-i-anden fordelingen Der findes forskellige versioner af fordelingen afhængigt af antal frihedsgrader (df) Df = n - 1 Man anvender typisk ensidig afgrænsning (alle 5% i øverste ende af fordelingen)
Forskellige ki-i-andenfordelinger
Ensidig afgrænsning i chi-square
5%-afgrænsninger i chi-square
F-fordeling
F-fordelinger
F-fordeling (der ligner t-fordeling)
Andre kontinuerte fordelingstyper
Gammafordelinger
LaPlace fordelinger
Diskrete fordelinger
Diskrete fordelinger Diskrete fordelinger har ikke noget at gøre med at være ’diskret’, men betyder at fordelingen ikke er kontinuert Fordelingen er derfor opbygget på tal med ’huller’ imellem Man kan derfor ikke have værdier som 1,13 og 1,21, men for eksempel kun de hele tal 1, 2, 3 osv.
Typer af diskrete fordelinger De vigtigste diskrete fordelinger til brug for psykologiske data er: Binomialfordeling Poissonfordeling Negativ binomialfordeling
Binomialfordeling 1 Man har en række ensartede situationer (forsøg), og hvert forsøg kan ende med et af to muligheder, hvor ofte det ene er interessant (kaldet positiv udfald) Klassisk eksempel: Man kaster med en mønt og der er to mulige udfald: plat og krone. Man har væddet på plat I hvert forsøg er der den samme sandsynlighed for et bestemt resultat (plat) (med en OK mønt = ½) Hvis man spørger hvad sandsynligheden er for at bestemt antal plat i et bestemt antal forsøg, bruger man en binomialfordeling Eksempel: Man kaster mønten 4 gange, hvad er sandsynlighederne for 0, 1, 2, 3 og 4 gange plat?
Binomialfordeling 2 Formlen for antal positive udfald (x) i antal forsøg (n), hvert med sandsynlighed for positivt udfald p er: (xn)*px*(1 - px ) (xn) betyder antal måder x udfald kan forekomme ud af n tilfælde Der er altså to parametre i en binomialfordeling som hjælp til at beskrive variablen, antal positive udfald (x) n og p Gennemsnit i binomialfordelingen er n*p Standardafvigelsen i binomialfordelingen er n*p*(1 - p)
Eksempel på binomialfordeling
Forskellige binomialfordelinger
Binomial- versus normalfordeling
Binomial- og normalfordeling Når antal forsøg (n) er tilstrækkeligt stort i binomialfordelingen, kommer den til at ligne normalfordelingen Det betyder at man i mange tilfælde kan bruge de statistiske metoder der forudsætter normalfordeling, selvom fordelingen er diskret, og ikke kontinuert, som normalfordelingen
Normal tilnærmelse til binomial (q = 1 – p)
Poissonfordeling Denne teoretiske fordeling kan udledes af binomialfordelingen, og den er særligt egnet til at beskrive sjældne begivenheder Eksempelvis har den danske statistiker Georg Rasch brugt den til at beskrive forekomst af trafikulykker på forskellige typer af veje Da begivenhederne er sjældne, er fordelingerne skæve så de lave værdier (trafikulykker) viser størst forekomst Der er kun én parameter i en Poissonfordeling, nemlig gennemsnittet (m på næste billede)
Poissonfordelinger
Poisson- og normalfordeling Man kan af foregående billede se at når gennemsnittet (m) bliver højere, bliver Poissonfordelingen mere og mere symmetrisk Af det næste billede kan man se at når gennemsnittet bliver højere, kommer Poissonfordelingen også til at ligne normalfordelingen mere og mere
Poisson- og normalfordeling
Typer af Poissonfordelinger 1 Da der kun er én parameter, gennemsnittet, i en Poissonfordeling, er hele fordelingens form bestemt når man har et bestemt gennemsnit For at kunne beskrive situationer med særligt mange udfald med værdien 0, har man zero-inflated Poisson distribution Eksempelvis antal angstanfald i normalbefolk-ningen. De er sjældne, som i Poisson-fordelingen, men særligt mange har slet ingen angstanfald
Poissonfordeling med særligt mange 0
Typer af Poissonfordelinger 2 Med kun én parameter er spredningen i en Poissonfordeling fastlagt. Den er nemlig også m I nogle tilfælde viser det sig at Poissonfordelingen sådan set burde være egnet til at beskrive nogle data, men der er bare for store variationer i resultaterne – standardafvigelsen er altså for stor I stedet kan man så bruge den såkaldt negative binomialfordeling
Poisson vs negativ binomialfordeling
Copyright © Jan Ivanouw