Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Bernoulli og binomial fordelingerne

Lignende præsentationer


Præsentationer af emnet: "Bernoulli og binomial fordelingerne"— Præsentationens transcript:

1 Bernoulli og binomial fordelingerne
Kontinuerte stokastiske variable Normalfordelingen

2 Repetition Lov om total sandsynlighed Bayes’ sætning
Stokastisk variabel – diskret: Endeligt antal værdier Sandsynlighedsfordeling: Tabel med ssh. for hvert x, P(X=x). Kumulativ fordelings funktion Middelværdi Varians Standard afvigelse

3 Bernoulli fordelingen
Hvis et eksperiment består af et enkelt forsøg og forsøget enten kan være en succes eller en fiasko, så kaldes forsøget for et Bernoulli forsøg X er en Bernoulli variabel med sandsynligheds-parameter p, hvis P(X=1)=p og P(X=0)=1-p. Middelværdi og varians for en Bernoulli variabel: E(X) = E(X²) = V(X) = Hvis for eksempel p=0,7: E(X)= V(X)=

4 Lidt mere repetition… Lad X1, X2,…, Xn være uafhængige Bernoulli variable, alle med samme sandsynligheds-parameter p. S= X1+X2+…+Xn er summen af stok. var. E(S) = E(X1+X2+…+Xn) = V(S) = V(X1+X2+…+Xn) =

5 Binomial fordeling Binomial fordelingen er resultatet af et Binomialt eksperiment: Det Binomiale eksperiment består af et fast antal (n) Bernoulli forsøg. Så i hvert forsøg er der to mulige udfald, succes og fiasko. P(”succes”)=p, dvs. sandsynligheden for success er den samme i hvert hvert forsøg. (Ligeledes for P(”fiasko”)=1-p=q) Forsøgene er uafhængige

6 Binomial fordeling - Eksempler
Kast med en mønt n gange. S=(krone (succes), plat (fiasko)). Hvis fair mønt p=0,5. Sandsynligheden er konstant og forsøgene er uafhængige, da et møntkasts udfald ikke påvirker udfaldet af det næste kast Træk et kort n gange. S=(”spar (succes)”, ”andet (fiasko)”). P(spar)=0,25 er konstant, hvis vi lægger kortet tilbage i bunken igen, ellers ikke. Uafhængige. Bemærk! Uden tilbagelægning vil P(nummer 2 spar, hvis nummer 1 er en spar)= 12/51 og dermed ikke konstant sandsynlighed

7 Binomial eksempel Kast en mønt 5 gange og lad X være antallet af krone. Der er 25 = 32 mulige sekvenser af plat og krone i udfaldsrummet. Af disse er der 10 med 2 krone (X=2): KKPPP KPKPP KPPKP KPPPK PKKPP PKPKP PKPPK PPKKP PPKPK PPPKK Sandsynligheden for hvert af disse 10 udfald er p2q3= (1/2)2(1/2)3=(1/32), så sandsynligheden for 2 krone i 5 kast er: P(X = 2) = 10·(1/32) = (10/32) = Antal udfald med 2 krone Sandsynligheden for hvert af disse udfald

8 Binomial-fordelingen generelt
1. Sandsynligheden for en given sekvens af x succes’er ud af n forsøg med sandsynlighed for succes p og sandsynlighed for fiasko q er lig med: pxq(n-x) 2. Antallet af forskellige sekvenser af n forsøg, der resulterer i x succes’er er lig med antallet af valg af x elementer ud af n elementer: n fakultet:

9 Binomial-fordelingen
Binomial sandsynligheds fordeling: hvor : p er sandsynligheden for succes i et enkelt forsøg, q = 1-p, n er antallet af forsøg, og x er antallet af succeser. Egenskab: Notation:

10

11 Middelværdi, varians og standardafvigelse af en Binomial fordeling
Antag X~B(n,p) Eksempel: K tæller antallet af kroner i 5 kast (n=5) med en fair mønt (p=0,5): Middelværdi Varians Standardafvigelse

12 Kumulativ Binomial fordeling (Tabel 1, Appendiks C)
Binomial kumulativ fordeling F(k) og sandsynligheds fordeling P(k) for K, antallet af krone i 5 kast med en fair mønt. Individuelle sandsynligheder fra kumulative sandsynligheder Eksempel: n=5 p=0.50

13 Binomial sandsynligheder - eksempel
60% af SparNord aktierne ejes af mig ;-). En stikprøve på 15 aktier vælges. Hvad er sandsynligheden for at højst 3 af dem ejes af mig?

14 Andre diskrete fordelinger
Binomial: X=Antal succeser i n forsøg. P(”succes”)=p fast. Negativ Binomial X=Antal forsøg inden man har n succeser. Hypergeometrisk X=Antal gode blandt n valgte, når der totalt er N at vælge imellem, hvoraf S er gode. Poisson Typisk antal hændelser i et givet tidsrum, fx antal uheld.

15 Diskrete og kontinuerte stokastiske
Diskret stokastisk variabel: Tæller hændelser Har et tællelig antal af mulige værdier Har diskrete hop mellem efterfølgende værdier Har målelige sandsynligheder for hver enkelt værdi Sandsynlighed er højde En kontinuert stokastisk variabel: Måler (højde, vægt, hastighed, løn) Har et uendelig antal af mulige værdier Går kontinuert fra værdi til værdi Har ingen målelig sandsynlighed til hver individuel værdi Sandsynlighed er areal For eksempel: Binomial n=3 p=.5 x P(x) 1.000 3 2 1 . 4 P ( x ) B i n o m a l : = p 5 For eksempel: Det skraverede område angiver sandsynligheden for mellem 2 og 3 minutter. 6 5 4 3 2 1 . M i n u t e s P ( x ) o C m p l T a k

16 Kontinuert fordeling Halv-Minut Intervaller Kvart-Minut Intervaller
6 . 5 4 3 2 1 M i n u t e s P ( x ) o C m p l T a k : B y H f - 0.0 M i n u t e s P ( x ) o C m p l T a k : F r h f Uendelig små intervaller Ottendedel-Minut Intervaller 7 6 5 4 3 2 1 Minutes f ( z ) Tæthedsfunktion M i n u t e s t o C o m p l e t e T a s k : E i g h t h s o f a M i n u t e P ( x ) M i n u t e s

17 Kontinuerte stokastiske variable – tæthedsfunktion og fordelingsfunktion
Svarer til sandsynligheds fordeling for diskrete variable For en tæthedsfunktion f(x) defineret på intervallet fra a til b gælder at: f(x)≥0 for alle x mellem a og b Det totale areal under kurven mellem a og b er 1. Sandsynligheden for at x ligger i et giver interval (indehold i intervallet fra a til b) er arealet under kurven for dette interval. Den kumulative fordelingsfunktion F(x) er givet som: F(x)=P(X≤x) = ”arealet under f(x) mellem den mindste mulige værdi af x (typisk minus uendelig) og x”.

18 Tæthedsfunktion og fordelingsfunktion
F(x) 1 F(b) F(a) a b x f(x) NB: P(X=x)=F(x)-F(x)=0 x a b

19 Integrationsbonusslide!
Stok. Var: Diskret Kontinuert Regel Middelværdi: E(X2) Varians:

20 Uniform fordeling uniform [a,b] tæthed: f(x) 1/(b-a) x
1/(b – a) for a £ x£ b f(x)= 0 ellers E(X) = (a + b)/2; V(X) = (b – a)2/12 Uniform [a, b] fordeling Hele arealet under f(x) = 1/(b – a) * (b – a) = 1.00 f(x) 1/(b-a) Arealet under f(x) fra a1 til b1 = P(a1£X£ b1) = (b1 – a1)/(b – a) a a1 b1 b x

21 Uniform fordeling uniform [0,5] tæthed: f(x) 1/5 x 1/5 for 0 £ x£ 5
0 ellers E(X) = (0 + 5)/2; V(X) = (5 – 0)2/12 Uniform [a, b] fordeling Hele arealet under f(x) = 1/(5-0) * (5 – 0) = 1.00 f(x) 1/5 Arealet under f(x) fra 1 til 3 = P(1£X£ 3) = (3 – 1)/(5 –0) = 2/5 = 0,4 1 3 5 x

22 Eksponential-fordeling
Eksponential-fordelingen Tæthedsfunktionen er givet ved: Middelværdi og standard-afvigelsen er begge lige 1/λ Den kumulative fordelings-funktion er givet ved: Eksponential fordeling : l = 2 2 ) x ( f 1 1 2 3 Tid Den eksponentiale fordeling bruges typisk som model for ”ventetiden” mellem to hændelser, fx. tiden mellem to maskinsammenbrud eller andre ”ulykker”.

23 Normal-fordelingen Normal fordelingen er en vigtig fordeling, blandt andet fordi mange andre fordelingen, kan approksimeres til den. Desuden er mange teststørrelser normal-fordelte – kommer senere i kurset Bland andre Carl F. Gauss ( ) fandt frem til den, derfor kaldes den også den Gaussiske fordeling. Gauss Gaussfordeling Må ikke printes ;-)

24 Normal fordelingen Dens kendetegn er:
Klokkeformet og symmetrisk omkring dens middelværdi Middelværdi=median=mode Den er karakteriseret ved en middelværdi μ og varians σ² (eller standard afvigelse σ). Notation: X~N(μ,σ²) betyder, at X følger en normal fordeling med middelværdi μ og varians σ² Arealet under kurven indenfor zσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse. Er uanset parametre værdier, defineret for alle x (dvs x kan antage værdier fra minus uendelig til plus uendelig)

25 Tæthedsfunktionen for normal-fordelingen
: = ,  = 1 . 4 . 3 x ) ( f . 2 . 1 . - 5 5 x

26 Eksempler på normal-fordelinger
μ = 0.0 μ = 1.0 μ = 2.0 Samme varians Samme middelværdi. σ = 2.0 σ = 0.5 σ = 1.0

27 Standard afvigelsen σ når X~N(μ,σ2)
Cirka 68% af all observationer ligger indenfor en standard afvigelse fra middelværdien Cirka 95% af alle observationer ligger indenfor to standard afvigelser fra middelværdien Cirka 99.7% af alle observationer ligger indenfor 3 standard afvigelser fra middelværdien

28 ≈68% σ ≈95% ≈99,7% Arealet under kurven indenfor kσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse.

29 Sum af uafhængige normal-fordelte stokastiske variable
Hvis X1, X2, …, Xn er uafhængige normal-fordelte stokastiske variable, så er deres sum S også normal-fordelt med E(S) = E(X1) + E(X2) + … + E(Xn) V(S) = V(X1) + V(X2) + … + V(Xn) Bemærk: Det er varianserne der kan lægges sammen, ikke standard afvigelserne! Eksempel: S = X1 + X2 + X3. Så er E(S) = = 60 og V(S) = = 6. Standard afvigelsen af S er = 2.45. Middelværdi Varians X1 10 1 X2 20 2 X3 30 3

30 Linearkombinationer af uafhængige normal-fordelte stokastiske variable
Hvis X1, X2, …, Xn er uafhængige normalfordelte stokastiske variable, så vil variablen Q defineret som Q = a1X1 + a2X2 + … + anXn + b også være normal fordelt, med: E(Q) = a1E(X1) + a2E(X2) + … + anE(Xn) + b V(Q) = a12 V(X1) + a22 V(X2) + … + an2 V(Xn) Bemærk igen, at det er varianserne, der summeres og ikke standard afvigelserne.

31 Eksempel E(Q) = 12 – 2(-5) + 3(8) – 4(10) + 5 = 11
Eksempel 4.3: Lad X1 , X2 , X3 og X4 være uafhængige normal fordelte stokastiske variable med middelværdi og varians givet som i tabellen. Find middelværdien og variansen af Q = X1 - 2X2 + 3X2 - 4X4 + 5 Mean Variance X1 12 4 X2 -5 2 X3 8 5 X4 10 1 E(Q) = 12 – 2(-5) + 3(8) – 4(10) + 5 = 11 V(Q) = 4 + (-2)2(2) + 32(5) + (-4)2(1) = 73 SD(Q) =


Download ppt "Bernoulli og binomial fordelingerne"

Lignende præsentationer


Annoncer fra Google