Teoretiske kontinuerte fordelinger

Teoretiske kontinuerte fordelinger

Normalfordeling

Forskellige normalfordelinger

Normalfordelingens egenskaber
Det interessante ved en normalfordeling er at når man kender Gennemsnit Spredning Så er hele fordelingen bestemt Gennemsnit og spredning er fordelingens parametre Normalfordelingen er symmetrisk (har en skævhed på 0), og har en fladhed (kurtosis) på 0 (?)

Statistik og normalfordeling
Mange statistiske metoder forudsætter at variablene er normalfordelte Hvis de ikke er det, kan man Bruge ’robuste’ metoder der ikke er så følsomme Transformere fordelingen så den bliver normalfordelt (og transformere tilbage bagefter) Ved hypoteseprøvning bruge ’ikke-parametriske’ tests Ignorere problemet (meget almindeligt)

Standardnormalfordelingen
En normalfordeling med gennemsnit 0 og spredning 1, kaldes en standardnormalfordeling X-aksen til en standardnormalfordeling har derfor 0 i midten; man ser typisk 1, 2 og 3 på hver siden af midten (selvom fordelingen teoretisk strækker sig fra – til + uendeligt) X-aksen betegnes med ofte med z

Standardnormalfordeling

Percentiler i standardnormalfordelingen
Standardnormalfordelingen er minutiøst gennemregnet, så man ved hvor mange % der afskæres forskellige steder i fordelingen

Percentiler for standardnormalfordelingen

Standardisering Man kan omdanne enhver anden normalfordeling til en standardnormalfordeling ved at trække gennemsnittet af alle værdierne fra hver enkelt værdi, og derefter dividerer dem med spredningen i fordelingen Man kalder denne beregning for at man standardiserer en variabel

Standardisering af variabel

Omsætte scores til z-scores

WAIS-scores

t-fordeling

t-fordelingen En t-fordeling (Student’s t) ligner en normalfordeling, men er lidt forskellig alt efter hvor mange personer der indgår i fordelingen Hvis der er ret få personer, stiger sandsynligheden for at en for stor del har ekstremt høje eller lave scores. Derfor er t-fordelingen mere flad: mere spredt ud og lavere i midten jo færre personer der er i fordelingen Man taler om fordelingens frihedsgrader (df). I t-fordelingen er df = n-2

Anvendelse af t-fordelingen
Undersøgelse af om der er signifikant forskel mellem gennemsnittene i to grupper Generelt: undersøgelse af gennemsnitsforskelle

t-fordeling

Ki-i-anden fordeling

Anvendelse af ki-i-anden fordelingen
Ki-i-anden anvendes i mange sammenhænge: Undersøgelse af frekvenserne i en tabel viser systematiske forskelle Undersøgelse af om en fordeling har en bestemt form (f.eks. om den er normalfordelt) Undersøglse af om en bestemt statistisk model passer godt med observerede data Sammenligning af to statistiske modeller for at se hvilken der bedst passer med observerede data

Ki-i-anden fordelingen
Der findes forskellige versioner af fordelingen afhængigt af antal frihedsgrader (df) Df = n - 1 Man anvender typisk ensidig afgrænsning (alle 5% i øverste ende af fordelingen)

Forskellige ki-i-andenfordelinger

Ensidig afgrænsning i chi-square

5%-afgrænsninger i chi-square

F-fordeling

F-fordelinger

F-fordeling (der ligner t-fordeling)

Andre kontinuerte fordelingstyper

Gammafordelinger

LaPlace fordelinger

Diskrete fordelinger

Diskrete fordelinger Diskrete fordelinger har ikke noget at gøre med at være ’diskret’, men betyder at fordelingen ikke er kontinuert Fordelingen er derfor opbygget på tal med ’huller’ imellem Man kan derfor ikke have værdier som 1,13 og 1,21, men for eksempel kun de hele tal 1, 2, 3 osv.

Typer af diskrete fordelinger
De vigtigste diskrete fordelinger til brug for psykologiske data er: Binomialfordeling Poissonfordeling Negativ binomialfordeling

Binomialfordeling 1 Man har en række ensartede situationer (forsøg), og hvert forsøg kan ende med et af to muligheder, hvor ofte det ene er interessant (kaldet positiv udfald) Klassisk eksempel: Man kaster med en mønt og der er to mulige udfald: plat og krone. Man har væddet på plat I hvert forsøg er der den samme sandsynlighed for et bestemt resultat (plat) (med en OK mønt = ½) Hvis man spørger hvad sandsynligheden er for at bestemt antal plat i et bestemt antal forsøg, bruger man en binomialfordeling Eksempel: Man kaster mønten 4 gange, hvad er sandsynlighederne for 0, 1, 2, 3 og 4 gange plat?

Binomialfordeling 2 Formlen for antal positive udfald (x) i antal forsøg (n), hvert med sandsynlighed for positivt udfald p er: (xn)*px*(1 - px ) (xn) betyder antal måder x udfald kan forekomme ud af n tilfælde Der er altså to parametre i en binomialfordeling som hjælp til at beskrive variablen, antal positive udfald (x) n og p Gennemsnit i binomialfordelingen er n*p Standardafvigelsen i binomialfordelingen er n*p*(1 - p)

Eksempel på binomialfordeling

Forskellige binomialfordelinger

Binomial- versus normalfordeling

Binomial- og normalfordeling
Når antal forsøg (n) er tilstrækkeligt stort i binomialfordelingen, kommer den til at ligne normalfordelingen Det betyder at man i mange tilfælde kan bruge de statistiske metoder der forudsætter normalfordeling, selvom fordelingen er diskret, og ikke kontinuert, som normalfordelingen

Normal tilnærmelse til binomial (q = 1 – p)

Poissonfordeling Denne teoretiske fordeling kan udledes af binomialfordelingen, og den er særligt egnet til at beskrive sjældne begivenheder Eksempelvis har den danske statistiker Georg Rasch brugt den til at beskrive forekomst af trafikulykker på forskellige typer af veje Da begivenhederne er sjældne, er fordelingerne skæve så de lave værdier (trafikulykker) viser størst forekomst Der er kun én parameter i en Poissonfordeling, nemlig gennemsnittet (m på næste billede)

Poissonfordelinger

Poisson- og normalfordeling
Man kan af foregående billede se at når gennemsnittet (m) bliver højere, bliver Poissonfordelingen mere og mere symmetrisk Af det næste billede kan man se at når gennemsnittet bliver højere, kommer Poissonfordelingen også til at ligne normalfordelingen mere og mere

Poisson- og normalfordeling

Typer af Poissonfordelinger 1
Da der kun er én parameter, gennemsnittet, i en Poissonfordeling, er hele fordelingens form bestemt når man har et bestemt gennemsnit For at kunne beskrive situationer med særligt mange udfald med værdien 0, har man zero-inflated Poisson distribution Eksempelvis antal angstanfald i normalbefolk-ningen. De er sjældne, som i Poisson-fordelingen, men særligt mange har slet ingen angstanfald

Poissonfordeling med særligt mange 0

Typer af Poissonfordelinger 2
Med kun én parameter er spredningen i en Poissonfordeling fastlagt. Den er nemlig også m I nogle tilfælde viser det sig at Poissonfordelingen sådan set burde være egnet til at beskrive nogle data, men der er bare for store variationer i resultaterne – standardafvigelsen er altså for stor I stedet kan man så bruge den såkaldt negative binomialfordeling

Poisson vs negativ binomialfordeling

Teoretiske kontinuerte fordelinger

Lignende præsentationer

Præsentationer af emnet: "Teoretiske kontinuerte fordelinger"— Præsentationens transcript:

Lignende præsentationer

Om projektet

Feedback

Log ind

Logge ind via sociale netværk:

Teoretiske kontinuerte fordelinger

Lignende præsentationer

Præsentationer af emnet: "Teoretiske kontinuerte fordelinger"— Præsentationens transcript:

Lignende præsentationer

Om projektet

Feedback