Sandsynlighedsfordelinger

Slides:



Advertisements
Lignende præsentationer
Iværksættelsesmøde Formål: Blive fortrolig med ajourføring – alarmering – reaktionsplan. Mødet vil bl.a. indeholde følgende punkter: Orientering om
Advertisements

Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Dagens program Resumé - Normalfordelingen χ2-test (chi-i-anden)
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Hypotese test – kapitel 6 (Signifikans test)
Repræsentativitet Opsamling fra sidst Repræsentativitet (χ2-test)
Anvendt Statistik Lektion 3
En ærlig mønt kastes 5 gange
Sandsynlighedsregning
Dagens program Kursusevaluering Information Spørgsmål om eksamen
Dagens program Opsamling (skalaer & deskriptiv analyse)
Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt
Online annoncer og bannerreklamer
Anvendt Statistik Lektion 4
Statistik og sandsynlighedsregning
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Normalfordelingen Man siger at et talmateriale er normalfordelt, når der optræder mange observationer i midten af materialet og få i yderkanterne. Her.
Matematikseminar foråret 2009
Akademi Merkonomer Statistik Aften 3
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
PROGRAM Introduktion til internettet Hvad er en PC? Musetræning
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Population, stikprøve og signifikans Mandag den 19. marts, kl ved.
Eksempel på brug af normalfordelingen
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 3
Statistik og sandsynlighedsregning
AARHUS UNIVERSITET 19. JUNI 2013 ANALYTICS 19. JUNI 2013 HVORDAN FÅR DU NOGET UD AF GOOGLE ANALYTICS.
Statistik og sandsynlighedsregning
Anvendt Statistik Lektion 2
Dagens program Kursusevaluering Repetition One way hhv. two way anova
Ugrupperede observationer Middelværdi, varians og spredning
Statistik Lektion 6 Konfidensinterval for andele og varians
Signifikanstest ved (en eller) to stikprøver
Learning Objectives 5 Steps of a Significance Test Assumptions
Man siger at X er binomialfordelt med
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Statistik – Lektion 2 Uafhængighed Stokastiske Variable
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Agenda Informationer Opsamling fra sidst Normalfordelingen
Grundlæggende teoretisk statistik
Multipel Lineær Regression
Statistik for geografer
Sandsynlighedsregning
Bernoulli og binomial fordelingerne
Statistik Lektion 7 Hypotesetest og kritiske værdier
26.4 Samlede omkostninger Klik nederst til højre på ikonet for visning i ”Fuld skærm”. Klik med musen i dit eget tempo for at se præsentationen. Vil.
 Gennemgang af aflevering  Poisson Fordelingen  Kontinuerte Fordelinger ◦ Intro til kontinuerte fordelinger ◦ Normalfordelingen.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Grundlæggende teoretisk statistik
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Algoritmer og Datastrukturer 1 Quicksort [CLRS, kapitel 7] Gerth Stølting Brodal.
Grundlæggende teoretisk statistik
Normalfordelingen og Stikprøvefordelinger
Af Mathias, Michael og Christoffer Statistik og sandsynlighed.
Her kan ses et udklip af min forside – tænke med min forside var at man skulle kunne se et lille preview af den side man ville besøge og at forsiden skulle.
Opgave i normalfordeling 2.g, HHX. Grundbegreber Middelværdi, μ (græsk: my) Standardafvigelse, σ(græsk: sigma) X ̴ N(μ,σ)
Deltag i forskernes studier på AU
Teoretiske kontinuerte fordelinger
Simulering af binomialforsøg
Glem traditionel tilgang til budget
Præsentationens transcript:

Sandsynlighedsfordelinger Dagens program Teori Normalfordelingen Sampling distribution Opgaver Tid i grupperne

Kast med en mønt, P(krone)=0,5; n=12

Sandsynligheder i normalfordelingen De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder. μ = 300, σ = 50 Hvad er sandsynligheden for at en tilfældig besøgende højest bruger 240 sekunder på forsiden? P(240<X) = 0,12 330 sekunder på forsiden? P(330<X) = 0,73 Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end 380 sekunder på forsiden? P(380<X) = 0,95. P(380>X) =1 - 0,95 240 sekunder på forsiden? P(240>X) = 1- P(240<X) = 0,88 Hvad er sandsynligheden for at en tilfældig besøgende bruger mellem 300 og 330 sekunder på forsiden? P(300<X<330) P(330<X) = 0,73 P(330<X) = 0,5 P(300<X<330) = 0,73 – 0,5 = 0,23 3

z-score z-scoren beregnes som z = (X – μ) / σ Hvad er sandsynligheden for at tilfældig besøgende højest bruger 240 sekunder på forsiden? z = (X – μ) / σ = (240 – 300) / 50 = -60 / 50 = -1,2 P(-1,2<z) = 0,1151. Hvad er sandsynligheden for at tilfældig besøgende bruger mere end 380 sek. på forsiden? z = (X – μ) / σ = (380 – 300) / 50 = 1,6 P(1,6<z) = 0,95. 1 - 0,95 = 0,05. 4

Sandsynligheder i normalfordelingen De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder. μ = 300, σ = 50 Hvad er sandsynligheden for at en tilfældig besøgende højest bruger 240 sekunder på forsiden? P(240<X) = 0,12 330 sekunder på forsiden? P(330<X) = 0,73 Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end 380 sekunder på forsiden? P(380<X) = 0,95. P(380>X) =1 - 0,95 240 sekunder på forsiden? P(240>X) = 1- P(240<X) = 0,88 Hvad er sandsynligheden for at en tilfældig besøgende bruger mellem 300 og 330 sekunder på forsiden? P(300<X<330) P(330<X) = 0,73 P(330<X) = 0,5 P(300<X<330) = 0,73 – 0,5 = 0,23 5

z-score z-scoren beregnes som z = (X – μ) / σ Hvad er sandsynligheden for at tilfældig besøgende højest bruger 240 sekunder på forsiden? z = (X – μ) / σ = (240 – 300) / 50 = -60 / 50 = -1,2 P(-1,2<z) = 0,1151. Hvad er sandsynligheden for at tilfældig besøgende bruger mere end 380 sek. på forsiden? z = (X – μ) / σ = (380 – 300) / 50 = 1,6 P(1,6<z) = 0,95. 1 - 0,95 = 0,05. 6

Sampling distribution Vis på tegning Det centrale grænseværdi teorem (central limit theorem) siger: Hvis alle tænkelige stikprøver udtages simpelt tilfældigt fra en population, så danner deres gennemsnit en normalfordeling. Jo større n, des bedre er tilnærmelsen. Når n > 30 er tilnærmelsen god. 7

Sampling distribution Sampling distribution: Er en ssh. fordeling, der viser sandsynligheder for udfald af et statistisk mål fra en stikprøve, (f.eks. ū). Normalfordelingen er tilnærmelsesvis retvisende som sampling distribution, når n > 30. s er std.afv. på variablen U se er std.afv. på ū’erne (gns. af U). se er en forkortelse for standard error. se beregnes efter formlen σ / √ n. I praksis kender man ikke σ, hvorfor σ estimeres ved s (standardafvigelsen fra stikprøven). 8

Anvendelse af sampling distribution Vis på tegning Der er foretaget en totaltælling af antallet af musiknumre på studerendes telefoner. Den viser at μ=84 og σ = 96. 100 studerende (tilfældigt valgt) er inviteret til en fest. Hvad er sandsynligheden for at det gns. antal musik-numre på de studerendes telefoner er mellem 70 og 90? Standard error, se = σ / √ n = 96 / √100 = 9,6 z = (X – μ) / σ P(ū<90): z = (90-84)/9,6 = 0,625. P(0,625 <z) = 0,734 P(ū<70): z = (70-84)/9,6 = -1,46. P(-1,46 <z) = 0,072 P(70<ū<90) = 0,73 - 0,07 = 0,66. Konfidens interval 9

Fordelinger Empiriske fordelinger Population distribution, N. Populationens ”udseende” er som regel ukendt. Vi udtager en stikprøve fra populationen for at få viden om populationsparametre så som μ og σ. Sample distribution, n. Stikprøven er en delmængde af N. Den består af data / observationer, u1, u2,..,un. Stikprøven kan beskrives grafisk og numerisk, f.eks. ved hjælp af gns. ū og std.afv. s. Jo større stikprøven er, des mere ligner den populationen (=de store tals lov) Teoretiske fordelinger (fx normalfordelingen) Sandsynlighedsfordelinger viser sandsynligheden for at en variabel har et bestemt udfald (sandsynligheden er udfaldets ”andel” i det lange løb). En ”samling distribution” er sandsynlighedsfordelingen for et statistisk mål, f.eks. ū eller s. Den bruges til at finde de sand-synlige værdier af det statistiske mål i populationen (givet stikprøvestørrelsen) .