Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Agenda Informationer Opsamling fra sidst Normalfordelingen

Lignende præsentationer


Præsentationer af emnet: "Agenda Informationer Opsamling fra sidst Normalfordelingen"— Præsentationens transcript:

1 Agenda Informationer Opsamling fra sidst Normalfordelingen
Uformel evaluering Pas på muren (sampling distribution, se videoer) Opsamling fra sidst Normalfordelingen Dagens øvelser: Forsvar og kritik af projekt 1. Status på ”Inferential Methods” Sandsynlighedsregning: √ Diskret ssh.fordel. (binomial): √ Kontinuert ssh.fordeling (normalfordelingen): I dag Konfidensintervaller: Næste gang Signifikanstest (=hypotesetest): Næste og næste gang.

2 Opsamling: Diskrete sandsynlighedsfordelinger
μ = 0(0.23) + 1(0.38) + 2(0.22) + 3(0.13) + 4(0.03) + 5(0.01) = 1.38 The standard deviation of a probability distribution, σ, measures its spread.

3 Learning Objective 3: Probabilities for a Binomial Distribution
Excel har funktionen BINOMIAL.FORDELING Man indtaster Antal gunstige, f.eks. antal gange en mønt viser krone Det samlede antal forsøg (antal kast) Sandsynligheden for et gunstigt udfald, f.eks. 0,5 0 (for at få en punktsandsynlighed)

4 Kast med en mønt, P(terning)=0,5; n=12
Symmetri Position Spredning 4

5 Learning Objectives Normal Distribution
Using Excel to find probabilities 68 – 95 – 99,7 Rule for normal distributions Z-Scores and the Standard Normal Distribution Using Excel to find probabilities for z-scores

6 For alle normalfordelinger gælder følgende
Normalfordelingen er symmetrisk (og klokkeformet). Ikke højre eller v. skæv. Normalfordelingen beskrives fuldstændigt ved μ og σ. μ angiver placeringen på x-aksen. Jo større μ, des længere til højre ligger fordelingen, jf. fordeling lilla vs rød. σ angiver spredningen omkring μ. Jo større σ er, des større spredning. jf. blå fordeling vs. rød. Excel finder ssh. for at Y er mindre end en given værdi, a, P(a<Y). Arealet under kurven er 1. 6

7 Eksempel på brug af normalfordelingen
De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder. Hvad er sandsynligheden for at tilfældig besøgende højest bruger 265 sekunder på forsiden? X = 265, μ = 300, σ = 50. Hvad er P(x<265)? Svaret er 0, 7

8 Sandsynligheder i normalfordelingen
De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder. X er en random variabel som angiver tiden, før der klikkes videre fra forsiden til en underside. Hvad er sandsynligheden for at en tilfældig besøgende højest bruger 240 sekunder på forsiden? P(x<240) = 0,12 330 sekunder på forsiden? P(x<330) = ... Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end 240 sekunder på forsiden? P(x>240) = 1 - P(x>240) = 1 - 0,12 = 0,88 380 sekunder på forsiden? P(x>380) = Hvad er sandsynligheden for at en tilfældig besøgende bruger mellem 300 og 330 sekunder på forsiden? P(300<x<330) P(x<330) = 0,73 P(x<300) = 0,... P(300<x<330) = 0,73 - ? = 0,2... 8

9 Den empiriske regel: 68 – 95 – 99,7% Rule
68% of the observations fall within 1 standard deviation of the mean 95% of the observations fall within 2 standard deviations of the mean 99.7% of the observations fall within 3 standard deviations of the mean

10 Normal Distribution Within what interval do almost all of the men’s heights fall? Women’s height?

11 Example: 68-95-99.7% Rule Heights of adult women
can be approximated by a normal distribution =65 inches; =3.5 inches Rule for women’s heights 68% are between 61.5 and 68.5 inches [ µ   = 65  3.5 ] 95% are between 58 and 72 inches [ µ  2 = 65  2(3.5) = 65  7 ] 99.7% are between 54.5 and 75.5 inches [ µ  3 = 65  3(3.5) = 65  10.5 ]

12 z-score En z-score angiver hvor mange (antal) standardafvigelser, X ligger fra μ Eksempel: X angiver tiden før der klikkes videre fra forsiden til en underside. X er normalfordelt med μ = 300 og σ = 50. Hvad er sandsynligheden for at en tilfældig besøgende bruger mindre end 240 sekunder på forsiden? z = (x – μ) / σ = (240 – 300) / 50 = -60 / 50 = -1,2 P(z<-1,2) = 0,1151. Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end 380 sek. på forsiden? z = (X – μ) / σ = (380 – 300) / 50 = 1,6 P(1,6z) = 1 - P(z<1,6) P(z<1,6) = 0,95. P(z>1,6) = 1 - 0,95 = 0,05. 12

13 Opslag i Excel’s STANDARD.NORMALFORDELING
13

14 Opgaver Tegn en standard normalfordeling og find ssh. for at z er ...
Mindre end -1.42 Større end 1.42 Mindre end 1.25 Mellem and 1.25 14

15 P(x<X) Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. Hvor stor en procentandel af brugerne har et tidsforbrug på under 100 sek.? P(x<100) = Tjek i Excel 15,9% af brugerne har et tidsforbrug under 100 sek

16 Finding Probabilities
Draw a picture to show the desired probability under the standard normal curve State the problem in terms of the observed random variable X, i.e., P(X<x) Standardize X to restate the problem in terms of a standard normal variable Z Find the area under the standard normal curve using Excel

17 P(X>x) Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. Hvor stor en procentandel har et tidsforbrug over 100 sek? P(X>100) = 1 – P(x<100) P(X>100)= =.8413 Tjek i Excel 84.1% af brugerne har et tidsforbrug på mere end 100 sek

18 P(X>x) Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. Hvor stor en procentandel har et tidsforbrug over 133 sek? P(x>133) = 1 – P(<<133) P(x>133)= 1-0,... = 0,2... ? af brugerne har et tidsforbrug over 133 sek.

19 P(a<X<b) Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. Hvor stor en procentandel har et tidsforbrug 100 og 133 sek? P(100<x<133) = P(x<133)-P(x<100) Tjek i Excel 58% af brugerne har et tidsforbrug mellem 100 og 133 sek.

20 Find en X værdi givet en sandsynlighed
Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. 10% af brugerne har et tidsforbrug, som er højere end hvad? P(x>X) = 0,10, find x. P(x>X)=1-P(x<X) Excel bruges til at finde z for P=1-0,1=0,9. Det giver z = 1,28 Løs ligningen for at finde x : 10% af brugerne har et tidsforbrug over 145,6 sek. Check: P(x>145,6) = P(Z>1,28) = 0,10


Download ppt "Agenda Informationer Opsamling fra sidst Normalfordelingen"

Lignende præsentationer


Annoncer fra Google