Teoretiske kontinuerte fordelinger

Slides:

Advertisements

Lignende præsentationer

Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Advertisements

Dagens program Resumé - Normalfordelingen χ2-test (chi-i-anden)

Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.

Sandsynlighedsfordelinger

Hypotese test – kapitel 6 (Signifikans test)

Anvendt Statistik Lektion 3

Anvendt Statistik Lektion 4

Statistik og sandsynlighedsregning

Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Anvendt Statistik Lektion 6

Akademi Merkonomer Statistik Aften 3

Anvendt Statistik Lektion 2

Statistik Lektion 3 Simultan fordelte stokastiske variable

Sammenligning af to grupper – kapitel 7

Anvendt Statistik Lektion 3

Anvendt Statistik Lektion 6

Statistik og sandsynlighedsregning

Statistik og sandsynlighedsregning

Statistik og sandsynlighedsregning

Statistik Lektion 5 Log-lineære modeller.

Anvendt Statistik Lektion 2

Statistik Lektion 6 Konfidensinterval for andele og varians

Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Man siger at X er binomialfordelt med

Statistik II 5. Lektion Log-lineære modeller.

Statistik Lektion 3 Bernoulli og binomial fordelingerne

Statistik Kristine og Søren.

Sandsynligheder Udfald og hændelser Sandsynligheder Additionsreglen

Statistik for geografer

Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.

Agenda Informationer Opsamling fra sidst Normalfordelingen

Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel

Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl

Multipel Lineær Regression

Statikstik II 2. Lektion Lidt sandsynlighedsregning

Statistik for geografer

Bernoulli og binomial fordelingerne

Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 1. oktober 2004.

Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber

Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.

Grundlæggende teoretisk statistik

Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel

Økonometri – lektion 8 Multipel Lineær Regression

Introduktion Deskriptiv statistik Sandsynslighedregning

Statistik Lektion 8 Test for ens varians.

Grundlæggende teoretisk statistik

Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.

Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.

Normalfordelingen og Stikprøvefordelinger

Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.

Statistik II 4. Lektion Logistisk regression.

Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.

Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.

Økonometri 1: F71 Økonometri 1 Inferens i den lineære regressionsmodel 29. september 2006.

Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.

Af Mathias, Michael og Christoffer Statistik og sandsynlighed.

Ellen Holm, Forskningscafé

Analyse af skæve fordelinger med Mplus

Anvendt Statistik Lektion 8

Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Niveau 2: Hypotesetestning

Anvendt Statistik Lektion 4

Anvendt Statistik Lektion 6

Anvendt Statistik Lektion 3

Bayesisk statistik - en lille introduktion med nogle anvendelser

Niveau 3: Regressionsanalyse: Tværsnitsundersøgelser

Måling (psykometri) 1.

Forenkling og systematisering af data

Præsentationens transcript:

Teoretiske kontinuerte fordelinger

Normalfordeling

Normalfordeling

Forskellige normalfordelinger

Normalfordelingens egenskaber Det interessante ved en normalfordeling er at når man kender Gennemsnit Spredning Så er hele fordelingen bestemt Gennemsnit og spredning er fordelingens parametre Normalfordelingen er symmetrisk (har en skævhed på 0), og har en fladhed (kurtosis) på 0 (?)

Statistik og normalfordeling Mange statistiske metoder forudsætter at variablene er normalfordelte Hvis de ikke er det, kan man Bruge ’robuste’ metoder der ikke er så følsomme Transformere fordelingen så den bliver normalfordelt (og transformere tilbage bagefter) Ved hypoteseprøvning bruge ’ikke-parametriske’ tests Ignorere problemet (meget almindeligt)

Standardnormalfordelingen En normalfordeling med gennemsnit 0 og spredning 1, kaldes en standardnormalfordeling X-aksen til en standardnormalfordeling har derfor 0 i midten; man ser typisk 1, 2 og 3 på hver siden af midten (selvom fordelingen teoretisk strækker sig fra – til + uendeligt) X-aksen betegnes med ofte med z

Standardnormalfordeling

Standardnormalfordeling

Standardnormalfordeling

Percentiler i standardnormalfordelingen Standardnormalfordelingen er minutiøst gennemregnet, så man ved hvor mange % der afskæres forskellige steder i fordelingen

Percentiler for standardnormalfordelingen

Standardisering Man kan omdanne enhver anden normalfordeling til en standardnormalfordeling ved at trække gennemsnittet af alle værdierne fra hver enkelt værdi, og derefter dividerer dem med spredningen i fordelingen Man kalder denne beregning for at man standardiserer en variabel

Standardisering af variabel

Omsætte scores til z-scores

WAIS-scores

t-fordeling

t-fordelingen En t-fordeling (Student’s t) ligner en normalfordeling, men er lidt forskellig alt efter hvor mange personer der indgår i fordelingen Hvis der er ret få personer, stiger sandsynligheden for at en for stor del har ekstremt høje eller lave scores. Derfor er t-fordelingen mere flad: mere spredt ud og lavere i midten jo færre personer der er i fordelingen Man taler om fordelingens frihedsgrader (df). I t-fordelingen er df = n-2

Anvendelse af t-fordelingen Undersøgelse af om der er signifikant forskel mellem gennemsnittene i to grupper Generelt: undersøgelse af gennemsnitsforskelle

t-fordeling

Ki-i-anden fordeling

Anvendelse af ki-i-anden fordelingen Ki-i-anden anvendes i mange sammenhænge: Undersøgelse af frekvenserne i en tabel viser systematiske forskelle Undersøgelse af om en fordeling har en bestemt form (f.eks. om den er normalfordelt) Undersøglse af om en bestemt statistisk model passer godt med observerede data Sammenligning af to statistiske modeller for at se hvilken der bedst passer med observerede data

Ki-i-anden fordelingen Der findes forskellige versioner af fordelingen afhængigt af antal frihedsgrader (df) Df = n - 1 Man anvender typisk ensidig afgrænsning (alle 5% i øverste ende af fordelingen)

Forskellige ki-i-andenfordelinger

Ensidig afgrænsning i chi-square

5%-afgrænsninger i chi-square

F-fordeling

F-fordelinger

F-fordeling (der ligner t-fordeling)

Andre kontinuerte fordelingstyper

Gammafordelinger

LaPlace fordelinger

Diskrete fordelinger

Diskrete fordelinger Diskrete fordelinger har ikke noget at gøre med at være ’diskret’, men betyder at fordelingen ikke er kontinuert Fordelingen er derfor opbygget på tal med ’huller’ imellem Man kan derfor ikke have værdier som 1,13 og 1,21, men for eksempel kun de hele tal 1, 2, 3 osv.

Typer af diskrete fordelinger De vigtigste diskrete fordelinger til brug for psykologiske data er: Binomialfordeling Poissonfordeling Negativ binomialfordeling

Binomialfordeling 1 Man har en række ensartede situationer (forsøg), og hvert forsøg kan ende med et af to muligheder, hvor ofte det ene er interessant (kaldet positiv udfald) Klassisk eksempel: Man kaster med en mønt og der er to mulige udfald: plat og krone. Man har væddet på plat I hvert forsøg er der den samme sandsynlighed for et bestemt resultat (plat) (med en OK mønt = ½) Hvis man spørger hvad sandsynligheden er for at bestemt antal plat i et bestemt antal forsøg, bruger man en binomialfordeling Eksempel: Man kaster mønten 4 gange, hvad er sandsynlighederne for 0, 1, 2, 3 og 4 gange plat?

Binomialfordeling 2 Formlen for antal positive udfald (x) i antal forsøg (n), hvert med sandsynlighed for positivt udfald p er: (xn)*px*(1 - px ) (xn) betyder antal måder x udfald kan forekomme ud af n tilfælde Der er altså to parametre i en binomialfordeling som hjælp til at beskrive variablen, antal positive udfald (x) n og p Gennemsnit i binomialfordelingen er n*p Standardafvigelsen i binomialfordelingen er n*p*(1 - p)

Eksempel på binomialfordeling

Forskellige binomialfordelinger

Binomial- versus normalfordeling

Binomial- og normalfordeling Når antal forsøg (n) er tilstrækkeligt stort i binomialfordelingen, kommer den til at ligne normalfordelingen Det betyder at man i mange tilfælde kan bruge de statistiske metoder der forudsætter normalfordeling, selvom fordelingen er diskret, og ikke kontinuert, som normalfordelingen

Normal tilnærmelse til binomial (q = 1 – p)

Poissonfordeling Denne teoretiske fordeling kan udledes af binomialfordelingen, og den er særligt egnet til at beskrive sjældne begivenheder Eksempelvis har den danske statistiker Georg Rasch brugt den til at beskrive forekomst af trafikulykker på forskellige typer af veje Da begivenhederne er sjældne, er fordelingerne skæve så de lave værdier (trafikulykker) viser størst forekomst Der er kun én parameter i en Poissonfordeling, nemlig gennemsnittet (m på næste billede)

Poissonfordelinger

Poisson- og normalfordeling Man kan af foregående billede se at når gennemsnittet (m) bliver højere, bliver Poissonfordelingen mere og mere symmetrisk Af det næste billede kan man se at når gennemsnittet bliver højere, kommer Poissonfordelingen også til at ligne normalfordelingen mere og mere

Poisson- og normalfordeling

Typer af Poissonfordelinger 1 Da der kun er én parameter, gennemsnittet, i en Poissonfordeling, er hele fordelingens form bestemt når man har et bestemt gennemsnit For at kunne beskrive situationer med særligt mange udfald med værdien 0, har man zero-inflated Poisson distribution Eksempelvis antal angstanfald i normalbefolk-ningen. De er sjældne, som i Poisson-fordelingen, men særligt mange har slet ingen angstanfald

Poissonfordeling med særligt mange 0

Typer af Poissonfordelinger 2 Med kun én parameter er spredningen i en Poissonfordeling fastlagt. Den er nemlig også m I nogle tilfælde viser det sig at Poissonfordelingen sådan set burde være egnet til at beskrive nogle data, men der er bare for store variationer i resultaterne – standardafvigelsen er altså for stor I stedet kan man så bruge den såkaldt negative binomialfordeling

Poisson vs negativ binomialfordeling

Copyright © Jan Ivanouw