Agenda Informationer Opsamling fra sidst Normalfordelingen

Slides:



Advertisements
Lignende præsentationer
Valg med Excel Fordelingsmetoder med Excel
Advertisements

Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Dagens program Resumé - Normalfordelingen χ2-test (chi-i-anden)
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Sandsynlighedsfordelinger
Hypotese test – kapitel 6 (Signifikans test)
Repræsentativitet Opsamling fra sidst Repræsentativitet (χ2-test)
Anvendt Statistik Lektion 3
Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Statistik og sandsynlighedsregning
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Normalfordelingen Man siger at et talmateriale er normalfordelt, når der optræder mange observationer i midten af materialet og få i yderkanterne. Her.
Matematikseminar foråret 2009
Akademi Merkonomer Statistik Aften 3
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Eksempel på brug af normalfordelingen
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 3
Statistik og sandsynlighedsregning
Statistik og sandsynlighedsregning
Statistik 1 – Lektion 5 By, energi & miljø, forår 2010 v. Morten Skou Nicolaisen.
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Learning Objectives 5 Steps of a Significance Test Assumptions
Agenda 1.Informationer 1.Excel i fb.m. projekt 2 2.Reserver tid til projekt 2 3.Øvelse: a / b = c 2.Opsamling fra sidst 3.Estimation (konfidensintervaller)
Statistik – Lektion 2 Uafhængighed Stokastiske Variable
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Statistik for geografer
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Fejl  Afleveringen  Stikprøvestørrelse  Type I-II Fejl  Styrkefunktionen.
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik for geografer
Bernoulli og binomial fordelingerne
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri – lektion 5 Multipel Lineær Regression
 Gennemgang af aflevering  Poisson Fordelingen  Kontinuerte Fordelinger ◦ Intro til kontinuerte fordelinger ◦ Normalfordelingen.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Grundlæggende teoretisk statistik
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Hand Tracking - Using Active Shape Models. Introduktion Vi har implementeret en applikation i C++, der ved hjælp af Active Shape Models tracker en hånd.
Betinget sandsynlighed Bayes’ regel Diskrete stokastiske variable
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Normalfordelingen og Stikprøvefordelinger
Statistik II 4. Lektion Logistisk regression.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Opgave i normalfordeling 2.g, HHX. Grundbegreber Middelværdi, μ (græsk: my) Standardafvigelse, σ(græsk: sigma) X ̴ N(μ,σ)
Analyse af skæve fordelinger med Mplus
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Agenda Informationer Opsamling fra sidst Normalfordelingen Uformel evaluering Pas på muren (sampling distribution, se videoer) Opsamling fra sidst Normalfordelingen Dagens øvelser: Forsvar og kritik af projekt 1. Status på ”Inferential Methods” Sandsynlighedsregning: √ Diskret ssh.fordel. (binomial): √ Kontinuert ssh.fordeling (normalfordelingen): I dag Konfidensintervaller: Næste gang Signifikanstest (=hypotesetest): Næste og næste gang.

Opsamling: Diskrete sandsynlighedsfordelinger μ = 0(0.23) + 1(0.38) + 2(0.22) + 3(0.13) + 4(0.03) + 5(0.01) = 1.38 The standard deviation of a probability distribution, σ, measures its spread.

Learning Objective 3: Probabilities for a Binomial Distribution Excel har funktionen BINOMIAL.FORDELING Man indtaster Antal gunstige, f.eks. antal gange en mønt viser krone Det samlede antal forsøg (antal kast) Sandsynligheden for et gunstigt udfald, f.eks. 0,5 0 (for at få en punktsandsynlighed)

Kast med en mønt, P(terning)=0,5; n=12 Symmetri Position Spredning 4

Learning Objectives Normal Distribution Using Excel to find probabilities 68 – 95 – 99,7 Rule for normal distributions Z-Scores and the Standard Normal Distribution Using Excel to find probabilities for z-scores

For alle normalfordelinger gælder følgende Normalfordelingen er symmetrisk (og klokkeformet). Ikke højre eller v. skæv. Normalfordelingen beskrives fuldstændigt ved μ og σ. μ angiver placeringen på x-aksen. Jo større μ, des længere til højre ligger fordelingen, jf. fordeling lilla vs rød. σ angiver spredningen omkring μ. Jo større σ er, des større spredning. jf. blå fordeling vs. rød. Excel finder ssh. for at Y er mindre end en given værdi, a, P(a<Y). Arealet under kurven er 1. 6

Eksempel på brug af normalfordelingen De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder. Hvad er sandsynligheden for at tilfældig besøgende højest bruger 265 sekunder på forsiden? X = 265, μ = 300, σ = 50. Hvad er P(x<265)? Svaret er 0,24196.... 7

Sandsynligheder i normalfordelingen De besøgende på en hjemmeside bruger i gns. 300 sekunder på forsiden, før de klikker videre til en underside. Besøgstiden er normalfordelt med en standardafvigelse på 50 sekunder. X er en random variabel som angiver tiden, før der klikkes videre fra forsiden til en underside. Hvad er sandsynligheden for at en tilfældig besøgende højest bruger 240 sekunder på forsiden? P(x<240) = 0,12 330 sekunder på forsiden? P(x<330) = ... Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end 240 sekunder på forsiden? P(x>240) = 1 - P(x>240) = 1 - 0,12 = 0,88 380 sekunder på forsiden? P(x>380) = Hvad er sandsynligheden for at en tilfældig besøgende bruger mellem 300 og 330 sekunder på forsiden? P(300<x<330) P(x<330) = 0,73 P(x<300) = 0,... P(300<x<330) = 0,73 - ? = 0,2... 8

Den empiriske regel: 68 – 95 – 99,7% Rule 68% of the observations fall within 1 standard deviation of the mean 95% of the observations fall within 2 standard deviations of the mean 99.7% of the observations fall within 3 standard deviations of the mean

Normal Distribution Within what interval do almost all of the men’s heights fall? Women’s height?

Example: 68-95-99.7% Rule Heights of adult women can be approximated by a normal distribution =65 inches; =3.5 inches 68-95-99.7 Rule for women’s heights 68% are between 61.5 and 68.5 inches [ µ   = 65  3.5 ] 95% are between 58 and 72 inches [ µ  2 = 65  2(3.5) = 65  7 ] 99.7% are between 54.5 and 75.5 inches [ µ  3 = 65  3(3.5) = 65  10.5 ]

z-score En z-score angiver hvor mange (antal) standardafvigelser, X ligger fra μ Eksempel: X angiver tiden før der klikkes videre fra forsiden til en underside. X er normalfordelt med μ = 300 og σ = 50. Hvad er sandsynligheden for at en tilfældig besøgende bruger mindre end 240 sekunder på forsiden? z = (x – μ) / σ = (240 – 300) / 50 = -60 / 50 = -1,2 P(z<-1,2) = 0,1151. Hvad er sandsynligheden for at en tilfældig besøgende bruger mere end 380 sek. på forsiden? z = (X – μ) / σ = (380 – 300) / 50 = 1,6 P(1,6z) = 1 - P(z<1,6) P(z<1,6) = 0,95. P(z>1,6) = 1 - 0,95 = 0,05. 12

Opslag i Excel’s STANDARD.NORMALFORDELING 13

Opgaver Tegn en standard normalfordeling og find ssh. for at z er ... Mindre end -1.42 Større end 1.42 Mindre end 1.25 Mellem -1.42 and 1.25 14

P(x<X) Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. Hvor stor en procentandel af brugerne har et tidsforbrug på under 100 sek.? P(x<100) = Tjek i Excel 15,9% af brugerne har et tidsforbrug under 100 sek

Finding Probabilities Draw a picture to show the desired probability under the standard normal curve State the problem in terms of the observed random variable X, i.e., P(X<x) Standardize X to restate the problem in terms of a standard normal variable Z Find the area under the standard normal curve using Excel

P(X>x) Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. Hvor stor en procentandel har et tidsforbrug over 100 sek? P(X>100) = 1 – P(x<100) P(X>100)= 1-.1587=.8413 Tjek i Excel 84.1% af brugerne har et tidsforbrug på mere end 100 sek

P(X>x) Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. Hvor stor en procentandel har et tidsforbrug over 133 sek? P(x>133) = 1 – P(<<133) P(x>133)= 1-0,... = 0,2... ? af brugerne har et tidsforbrug over 133 sek.

P(a<X<b) Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. Hvor stor en procentandel har et tidsforbrug 100 og 133 sek? P(100<x<133) = P(x<133)-P(x<100) Tjek i Excel 58% af brugerne har et tidsforbrug mellem 100 og 133 sek.

Find en X værdi givet en sandsynlighed Tidsforbruget på en nyudviklet app er normalfordelt med µ = 120 sek. og σ = 20 sek. 10% af brugerne har et tidsforbrug, som er højere end hvad? P(x>X) = 0,10, find x. P(x>X)=1-P(x<X) Excel bruges til at finde z for P=1-0,1=0,9. Det giver z = 1,28 Løs ligningen for at finde x : 10% af brugerne har et tidsforbrug over 145,6 sek. Check: P(x>145,6) = P(Z>1,28) = 0,10