Sandsynlighedsfordelinger

Slides:

Advertisements

Lignende præsentationer

Iværksættelsesmøde Formål: Blive fortrolig med ajourføring – alarmering – reaktionsplan. Mødet vil bl.a. indeholde følgende punkter: Orientering om

Advertisements

Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Dagens program Resumé - Normalfordelingen χ2-test (chi-i-anden)

Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.

Hypotese test – kapitel 6 (Signifikans test)

Repræsentativitet Opsamling fra sidst Repræsentativitet (χ2-test)

Anvendt Statistik Lektion 3

En ærlig mønt kastes 5 gange

Sandsynlighedsregning

Dagens program Kursusevaluering Information Spørgsmål om eksamen

Dagens program Opsamling (skalaer & deskriptiv analyse)

Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt

Online annoncer og bannerreklamer

Anvendt Statistik Lektion 4

Statistik og sandsynlighedsregning

Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen

Normalfordelingen Man siger at et talmateriale er normalfordelt, når der optræder mange observationer i midten af materialet og få i yderkanterne. Her.

Matematikseminar foråret 2009

Akademi Merkonomer Statistik Aften 3

Anvendt Statistik Lektion 2

Statistik Lektion 3 Simultan fordelte stokastiske variable

PROGRAM Introduktion til internettet Hvad er en PC? Musetræning

Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Population, stikprøve og signifikans Mandag den 19. marts, kl ved.

Eksempel på brug af normalfordelingen

Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen

Anvendt Statistik Lektion 3

Statistik og sandsynlighedsregning

AARHUS UNIVERSITET 19. JUNI 2013 ANALYTICS 19. JUNI 2013 HVORDAN FÅR DU NOGET UD AF GOOGLE ANALYTICS.

Statistik og sandsynlighedsregning

Anvendt Statistik Lektion 2

Dagens program Kursusevaluering Repetition One way hhv. two way anova

Ugrupperede observationer Middelværdi, varians og spredning

Statistik Lektion 6 Konfidensinterval for andele og varians

Signifikanstest ved (en eller) to stikprøver

Learning Objectives 5 Steps of a Significance Test Assumptions

Man siger at X er binomialfordelt med

1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursusevaluering, eksperimentelt.

Statistik – Lektion 2 Uafhængighed Stokastiske Variable

Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.

Statistik Lektion 3 Bernoulli og binomial fordelingerne

Statistisk inferens Dagens program Grupper, opgave 1

Learning Objectives 5 Steps of a Significance Test Assumptions

Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.

Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen

Agenda Informationer Opsamling fra sidst Normalfordelingen

Grundlæggende teoretisk statistik

Multipel Lineær Regression

Statistik for geografer

Sandsynlighedsregning

Bernoulli og binomial fordelingerne

Statistik Lektion 7 Hypotesetest og kritiske værdier

26.4 Samlede omkostninger Klik nederst til højre på ikonet for visning i ”Fuld skærm”. Klik med musen i dit eget tempo for at se præsentationen. Vil.

 Gennemgang af aflevering  Poisson Fordelingen  Kontinuerte Fordelinger ◦ Intro til kontinuerte fordelinger ◦ Normalfordelingen.

Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber

Grundlæggende teoretisk statistik

Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel

Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.

Grundlæggende teoretisk statistik

Algoritmer og Datastrukturer 1 Quicksort [CLRS, kapitel 7] Gerth Stølting Brodal.

Grundlæggende teoretisk statistik

Normalfordelingen og Stikprøvefordelinger

Af Mathias, Michael og Christoffer Statistik og sandsynlighed.

Her kan ses et udklip af min forside – tænke med min forside var at man skulle kunne se et lille preview af den side man ville besøge og at forsiden skulle.

Opgave i normalfordeling 2.g, HHX. Grundbegreber Middelværdi, μ (græsk: my) Standardafvigelse, σ(græsk: sigma) X ̴ N(μ,σ)

Deltag i forskernes studier på AU

Teoretiske kontinuerte fordelinger

Simulering af binomialforsøg

Glem traditionel tilgang til budget

Præsentationens transcript:

Sandsynlighedsfordelinger Dagens program Teori Normalfordelingen Sampling distribution Opgaver Tid i grupperne

Kast med en mønt, P(krone)=0,5; n=12

Sandsynligheder i normalfordelingen De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder. μ = 300, σ = 50 Hvad er sandsynligheden for at en tilfældig besøgende højest bruger 240 sekunder på forsiden? P(240<X) = 0,12 330 sekunder på forsiden? P(330<X) = 0,73 Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end 380 sekunder på forsiden? P(380<X) = 0,95. P(380>X) =1 - 0,95 240 sekunder på forsiden? P(240>X) = 1- P(240<X) = 0,88 Hvad er sandsynligheden for at en tilfældig besøgende bruger mellem 300 og 330 sekunder på forsiden? P(300<X<330) P(330<X) = 0,73 P(330<X) = 0,5 P(300<X<330) = 0,73 – 0,5 = 0,23 3

z-score z-scoren beregnes som z = (X – μ) / σ Hvad er sandsynligheden for at tilfældig besøgende højest bruger 240 sekunder på forsiden? z = (X – μ) / σ = (240 – 300) / 50 = -60 / 50 = -1,2 P(-1,2<z) = 0,1151. Hvad er sandsynligheden for at tilfældig besøgende bruger mere end 380 sek. på forsiden? z = (X – μ) / σ = (380 – 300) / 50 = 1,6 P(1,6<z) = 0,95. 1 - 0,95 = 0,05. 4

Sandsynligheder i normalfordelingen De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder. μ = 300, σ = 50 Hvad er sandsynligheden for at en tilfældig besøgende højest bruger 240 sekunder på forsiden? P(240<X) = 0,12 330 sekunder på forsiden? P(330<X) = 0,73 Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end 380 sekunder på forsiden? P(380<X) = 0,95. P(380>X) =1 - 0,95 240 sekunder på forsiden? P(240>X) = 1- P(240<X) = 0,88 Hvad er sandsynligheden for at en tilfældig besøgende bruger mellem 300 og 330 sekunder på forsiden? P(300<X<330) P(330<X) = 0,73 P(330<X) = 0,5 P(300<X<330) = 0,73 – 0,5 = 0,23 5

z-score z-scoren beregnes som z = (X – μ) / σ Hvad er sandsynligheden for at tilfældig besøgende højest bruger 240 sekunder på forsiden? z = (X – μ) / σ = (240 – 300) / 50 = -60 / 50 = -1,2 P(-1,2<z) = 0,1151. Hvad er sandsynligheden for at tilfældig besøgende bruger mere end 380 sek. på forsiden? z = (X – μ) / σ = (380 – 300) / 50 = 1,6 P(1,6<z) = 0,95. 1 - 0,95 = 0,05. 6

Sampling distribution Vis på tegning Det centrale grænseværdi teorem (central limit theorem) siger: Hvis alle tænkelige stikprøver udtages simpelt tilfældigt fra en population, så danner deres gennemsnit en normalfordeling. Jo større n, des bedre er tilnærmelsen. Når n > 30 er tilnærmelsen god. 7

Sampling distribution Sampling distribution: Er en ssh. fordeling, der viser sandsynligheder for udfald af et statistisk mål fra en stikprøve, (f.eks. ū). Normalfordelingen er tilnærmelsesvis retvisende som sampling distribution, når n > 30. s er std.afv. på variablen U se er std.afv. på ū’erne (gns. af U). se er en forkortelse for standard error. se beregnes efter formlen σ / √ n. I praksis kender man ikke σ, hvorfor σ estimeres ved s (standardafvigelsen fra stikprøven). 8

Anvendelse af sampling distribution Vis på tegning Der er foretaget en totaltælling af antallet af musiknumre på studerendes telefoner. Den viser at μ=84 og σ = 96. 100 studerende (tilfældigt valgt) er inviteret til en fest. Hvad er sandsynligheden for at det gns. antal musik-numre på de studerendes telefoner er mellem 70 og 90? Standard error, se = σ / √ n = 96 / √100 = 9,6 z = (X – μ) / σ P(ū<90): z = (90-84)/9,6 = 0,625. P(0,625 <z) = 0,734 P(ū<70): z = (70-84)/9,6 = -1,46. P(-1,46 <z) = 0,072 P(70<ū<90) = 0,73 - 0,07 = 0,66. Konfidens interval 9

Fordelinger Empiriske fordelinger Population distribution, N. Populationens ”udseende” er som regel ukendt. Vi udtager en stikprøve fra populationen for at få viden om populationsparametre så som μ og σ. Sample distribution, n. Stikprøven er en delmængde af N. Den består af data / observationer, u1, u2,..,un. Stikprøven kan beskrives grafisk og numerisk, f.eks. ved hjælp af gns. ū og std.afv. s. Jo større stikprøven er, des mere ligner den populationen (=de store tals lov) Teoretiske fordelinger (fx normalfordelingen) Sandsynlighedsfordelinger viser sandsynligheden for at en variabel har et bestemt udfald (sandsynligheden er udfaldets ”andel” i det lange løb). En ”samling distribution” er sandsynlighedsfordelingen for et statistisk mål, f.eks. ū eller s. Den bruges til at finde de sand-synlige værdier af det statistiske mål i populationen (givet stikprøvestørrelsen) .