Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Teoretiske kontinuerte fordelinger

Lignende præsentationer


Præsentationer af emnet: "Teoretiske kontinuerte fordelinger"— Præsentationens transcript:

1 Teoretiske kontinuerte fordelinger

2 Normalfordeling

3 Normalfordeling

4 Forskellige normalfordelinger

5 Normalfordelingens egenskaber
Det interessante ved en normalfordeling er at når man kender Gennemsnit Spredning Så er hele fordelingen bestemt Gennemsnit og spredning er fordelingens parametre Normalfordelingen er symmetrisk (har en skævhed på 0), og har en fladhed (kurtosis) på 0 (?)

6 Statistik og normalfordeling
Mange statistiske metoder forudsætter at variablene er normalfordelte Hvis de ikke er det, kan man Bruge ’robuste’ metoder der ikke er så følsomme Transformere fordelingen så den bliver normalfordelt (og transformere tilbage bagefter) Ved hypoteseprøvning bruge ’ikke-parametriske’ tests Ignorere problemet (meget almindeligt)

7 Standardnormalfordelingen
En normalfordeling med gennemsnit 0 og spredning 1, kaldes en standardnormalfordeling X-aksen til en standardnormalfordeling har derfor 0 i midten; man ser typisk 1, 2 og 3 på hver siden af midten (selvom fordelingen teoretisk strækker sig fra – til + uendeligt) X-aksen betegnes med ofte med z

8 Standardnormalfordeling

9 Standardnormalfordeling

10 Standardnormalfordeling

11 Percentiler i standardnormalfordelingen
Standardnormalfordelingen er minutiøst gennemregnet, så man ved hvor mange % der afskæres forskellige steder i fordelingen

12 Percentiler for standardnormalfordelingen

13 Standardisering Man kan omdanne enhver anden normalfordeling til en standardnormalfordeling ved at trække gennemsnittet af alle værdierne fra hver enkelt værdi, og derefter dividerer dem med spredningen i fordelingen Man kalder denne beregning for at man standardiserer en variabel

14 Standardisering af variabel

15 Omsætte scores til z-scores

16 WAIS-scores

17 t-fordeling

18 t-fordelingen En t-fordeling (Student’s t) ligner en normalfordeling, men er lidt forskellig alt efter hvor mange personer der indgår i fordelingen Hvis der er ret få personer, stiger sandsynligheden for at en for stor del har ekstremt høje eller lave scores. Derfor er t-fordelingen mere flad: mere spredt ud og lavere i midten jo færre personer der er i fordelingen Man taler om fordelingens frihedsgrader (df). I t-fordelingen er df = n-2

19 Anvendelse af t-fordelingen
Undersøgelse af om der er signifikant forskel mellem gennemsnittene i to grupper Generelt: undersøgelse af gennemsnitsforskelle

20 t-fordeling

21 Ki-i-anden fordeling

22 Anvendelse af ki-i-anden fordelingen
Ki-i-anden anvendes i mange sammenhænge: Undersøgelse af frekvenserne i en tabel viser systematiske forskelle Undersøgelse af om en fordeling har en bestemt form (f.eks. om den er normalfordelt) Undersøglse af om en bestemt statistisk model passer godt med observerede data Sammenligning af to statistiske modeller for at se hvilken der bedst passer med observerede data

23 Ki-i-anden fordelingen
Der findes forskellige versioner af fordelingen afhængigt af antal frihedsgrader (df) Df = n - 1 Man anvender typisk ensidig afgrænsning (alle 5% i øverste ende af fordelingen)

24 Forskellige ki-i-andenfordelinger

25 Ensidig afgrænsning i chi-square

26 5%-afgrænsninger i chi-square

27 F-fordeling

28 F-fordelinger

29 F-fordeling (der ligner t-fordeling)

30 Andre kontinuerte fordelingstyper

31 Gammafordelinger

32 LaPlace fordelinger

33 Diskrete fordelinger

34 Diskrete fordelinger Diskrete fordelinger har ikke noget at gøre med at være ’diskret’, men betyder at fordelingen ikke er kontinuert Fordelingen er derfor opbygget på tal med ’huller’ imellem Man kan derfor ikke have værdier som 1,13 og 1,21, men for eksempel kun de hele tal 1, 2, 3 osv.

35 Typer af diskrete fordelinger
De vigtigste diskrete fordelinger til brug for psykologiske data er: Binomialfordeling Poissonfordeling Negativ binomialfordeling

36 Binomialfordeling 1 Man har en række ensartede situationer (forsøg), og hvert forsøg kan ende med et af to muligheder, hvor ofte det ene er interessant (kaldet positiv udfald) Klassisk eksempel: Man kaster med en mønt og der er to mulige udfald: plat og krone. Man har væddet på plat I hvert forsøg er der den samme sandsynlighed for et bestemt resultat (plat) (med en OK mønt = ½) Hvis man spørger hvad sandsynligheden er for at bestemt antal plat i et bestemt antal forsøg, bruger man en binomialfordeling Eksempel: Man kaster mønten 4 gange, hvad er sandsynlighederne for 0, 1, 2, 3 og 4 gange plat?

37 Binomialfordeling 2 Formlen for antal positive udfald (x) i antal forsøg (n), hvert med sandsynlighed for positivt udfald p er: (xn)*px*(1 - px ) (xn) betyder antal måder x udfald kan forekomme ud af n tilfælde Der er altså to parametre i en binomialfordeling som hjælp til at beskrive variablen, antal positive udfald (x) n og p Gennemsnit i binomialfordelingen er n*p Standardafvigelsen i binomialfordelingen er n*p*(1 - p)

38 Eksempel på binomialfordeling

39 Forskellige binomialfordelinger

40 Binomial- versus normalfordeling

41 Binomial- og normalfordeling
Når antal forsøg (n) er tilstrækkeligt stort i binomialfordelingen, kommer den til at ligne normalfordelingen Det betyder at man i mange tilfælde kan bruge de statistiske metoder der forudsætter normalfordeling, selvom fordelingen er diskret, og ikke kontinuert, som normalfordelingen

42 Normal tilnærmelse til binomial (q = 1 – p)

43 Poissonfordeling Denne teoretiske fordeling kan udledes af binomialfordelingen, og den er særligt egnet til at beskrive sjældne begivenheder Eksempelvis har den danske statistiker Georg Rasch brugt den til at beskrive forekomst af trafikulykker på forskellige typer af veje Da begivenhederne er sjældne, er fordelingerne skæve så de lave værdier (trafikulykker) viser størst forekomst Der er kun én parameter i en Poissonfordeling, nemlig gennemsnittet (m på næste billede)

44 Poissonfordelinger

45 Poisson- og normalfordeling
Man kan af foregående billede se at når gennemsnittet (m) bliver højere, bliver Poissonfordelingen mere og mere symmetrisk Af det næste billede kan man se at når gennemsnittet bliver højere, kommer Poissonfordelingen også til at ligne normalfordelingen mere og mere

46 Poisson- og normalfordeling

47 Typer af Poissonfordelinger 1
Da der kun er én parameter, gennemsnittet, i en Poissonfordeling, er hele fordelingens form bestemt når man har et bestemt gennemsnit For at kunne beskrive situationer med særligt mange udfald med værdien 0, har man zero-inflated Poisson distribution Eksempelvis antal angstanfald i normalbefolk-ningen. De er sjældne, som i Poisson-fordelingen, men særligt mange har slet ingen angstanfald

48 Poissonfordeling med særligt mange 0

49 Typer af Poissonfordelinger 2
Med kun én parameter er spredningen i en Poissonfordeling fastlagt. Den er nemlig også m I nogle tilfælde viser det sig at Poissonfordelingen sådan set burde være egnet til at beskrive nogle data, men der er bare for store variationer i resultaterne – standardafvigelsen er altså for stor I stedet kan man så bruge den såkaldt negative binomialfordeling

50 Poisson vs negativ binomialfordeling

51 Copyright © Jan Ivanouw


Download ppt "Teoretiske kontinuerte fordelinger"

Lignende præsentationer


Annoncer fra Google