Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Normalfordelingen og Stikprøvefordelinger

Lignende præsentationer


Præsentationer af emnet: "Normalfordelingen og Stikprøvefordelinger"— Præsentationens transcript:

1 Normalfordelingen og Stikprøvefordelinger
Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

2 Sandsynlighedsfordelinger – kontinuerte variable
Sandsynlighedsfordelingen for en kontinuert variabel tildeler sandsynligheder til et interval, for eksempel p(a<x<b). Ligeledes gælder at Sandsynligheden for intervallet, der indeholder alle mulige værdier af x, er lig med 1. Grafen for en sandsynlighedsfordeling for en kontinuert variabel er en glat kontinuert kurve. Arealet under kurven i et givet interval, er sandsynligheden for at x tilhører dette interval. Den meste brugte kontinuerte fordeling, er normal fordelingen. f(x) a b x

3 Normal fordelingen Dens kendetegn er:
Klokkeformet og symmetrisk omkring dens middelværdi Middelværdi=median=mode Den er karakteriseret ved en middelværdi μ og varians σ² (eller standard afvigelse σ). X~N(μ,σ²) betyder, at X følger en normal fordeling med middelværdi μ og varians σ² Arealet under kurven indenfor zσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse. Er uanset parametre værdier, defineret for alle x (dvs x kan antage værdier fra minus uendelig til plus uendelig)

4 Linear kombination af uafhængige normal-fordelte stokastiske variable
Hvis X1, X2, …, Xn er uafhængige normalfordelte stokastiske variable, så vil variablen Q defineret som Q = a1X1 + a2X2 + … + anXn + b også være normal fordelt, med: Bemærk: Det er varianserne, der lægges sammen og ikke standard-afvigelserne.

5 Eksempel E(Q) = 12 – 2(-5) + 3(8) – 4(10) + 5 = 11
Eksempel 4.3: Lad X1 , X2 , X3 og X4 være uafhængige normal fordelte stokastiske variable med middelværdi og varians givet som i tabellen. Find middelværdien og variansen af Q = X1 - 2X2 + 3X2 - 4X4 + 5 Mean Variance X1 12 4 X2 -5 2 X3 8 5 X4 10 1 E(Q) = 12 – 2(-5) + 3(8) – 4(10) + 5 = 11 V(Q) = 4 + (-2)2(2) + 32(5) + (-4)2(1) = 73 SD(Q) =

6 Bogstav Eksempel Antag at vi har n uafhængige stokastiske variable X1 , X2 , …, Xn , der alle følger den samme normal-fordeling med middelværdi μ og varians σ2. Definer Hvad er middelværdi og varians for S? E(S) = V(S) = S ~ N( , )

7 Standard normal fordelingen
Standard normal fordelingen, er normalfordelingen med middelværdi μ=0 og standard afvigelse σ=1, Z~N(0,1²) Standard Normal fordeling . 4 . 3 =1 { z ) ( f . 2 . 1 . - 5 - 4 - 3 - 2 - 1 1 2 3 4 5  = 0 Z NB: En standard normal fordelt stokastisk variabel betegnes sædvanligvis Z.

8 Tabellen Sandsynligheder for standard normal fordelingen er tabellagt i Tabel 2 i Appendiks C, side 776 De tabellagte værdier er sandsynligheder for intervaller fra μ=0 til punkter z til højre for 0, altså de positive z værdier Da normal fordelingen er symmetrisk, er hele arealet til venstre for 0 lig med ½ Denne halve skal man huske at trække fra eller lægge til – afhængig af hvilket interval man er interesseret i at finde sandsynligheden for, se Tips og Trix 5 4 3 2 1 - . Z f ( z ) S t a n d r N o m l D i s b u 1.56 { Figuren viser P(0<Z<1,56) Hvis nu man ville have: P(Z<1,56)=½+P(0<Z<1,56)

9 Find P(0 < Z < 1.56) tabel 2 i Appendiks C, side 776
Standard Normal Probabilities z 5 4 3 2 1 - . Z f ( z ) S t a n d r N o m l D i s b u 1.56 { Kig i rækken med 1.5 og søjlen med .06 P(0  Z  1.56) =

10 Find: P(Z < -2.47) 5 4 3 2 1 - . Z f ( z ) S t a n d r N o m l D i s b u Tabel areal for 2.47 P(0 < Z < 2.47) = Arealet til venstre for -2.47 P(Z < -2.47) = = For at finde P(Z<-2.47): Find tabel areal for 2.47 P(0 < Z < 2.47) = .4932 P(Z < -2.47) = .5 - P(0 < Z < 2.47) = = z .

11 Find: P(1< Z < 2) For at finde P(1  Z  2):
1. Find tabel arealet for 2.00 F(2) = P(Z  2.00) = =.9772 2. Find tabel arealet for 1.00 F(1) = P(Z  1.00) = = .8413 3. P(1  Z  2.00) = P(Z  2.00) - P(Z  1.00) = = z . . S t a n d a r d N o r m a l D i s t r i b u t i o n . 4 Areal mellem 1 og 2 P(1  Z  2) = = . 3 ) z ( f . 2 . 1 . - 5 - 4 - 3 - 2 - 1 1 2 3 4 5 Z

12 Summe opgave Find P(0<Z<1,96) Find P(-1,5<Z<0)

13 Find: P(0 < Z < z) = 0.40 Find Z, så P( 0 ≤ Z ≤ z ) = 0,40
Find Z, så P( 0 ≤ Z ≤ z ) = 0,40 Find en sandsynlighed så tæt på som muligt. 2. Bestem herefter værdien af z fra den pågældende række og søjle. P( 0 ≤ Z ≤ 1,28 ) = 0,40 Desuden, da P(Z ≤ 0) = 0,50 P( Z ≤ 1,28 ) = 0,90 Areal til venstre for 0 = .50 P(z  0) = .50 S t a n d a r d N o r m a l D i s t r i b u t i o n . 4 Areal til højre for 0 = .40 (.3997) . 3 z ) f ( . 2 . 1 . - 5 - 4 - 3 - 2 - 1 1 2 3 4 5 Z = 1.28 Z

14 Summe opgave Find P(Z<z)=0,975

15 Transformation til standard normal fordelingen og tilbage igen
Enhver normal fordelt stokastisk variabel kan transformeres til en standard normal fordelt stokastisk variabel! Hvis X~N(μ,σ²), så er Den inverse transformation er også gyldig:

16 Transformation til standard normal fordelingen og tilbage igen
Transformationen kan bruges til at finde sandsynligheder for normal fordelte stokastiske variable, der ikke er standard normal fordelt: Transformer X om til Z – ligeledes for interval grænserne Find sandsynlighederne for Z, der vil være de samme som for X

17 Eksempel Antag X~N(50,102) Find P(45<X<60)

18 Eksempler fra bogen ( ) ( ) æ è ç ö ø ÷ æ è ç ö ø ÷ Eksempel 4-9
X~N(160,302) Eksempel 4-10 X~N(127,222) ( ) P X Z . 100 180 160 30 2 6667 4772 2475 7247 = - + æ è ç ö ø ÷ m s ( ) P X Z . < = - + æ è ç ö ø ÷ 150 127 22 1 045 5 3520 8520 m s

19 Den inverse transformation
Eksempel 4-12 Antag X~N(124,122). Find x, så P(X > x) = Løsning: Bemærk P(Z > z) 0.10 for z=1.28. Derfor: x =  + z = (1.28)(12) = 1 8 3 . 4 2 X f ( x ) N o r m a l D i s t b u n : = , 0.1 139.36 z

20 Statistik Statistisk Inferens:
Prædiktere værdier af populations parametre Teste hypoteser om værdier af populations parametre Tage beslutninger på basis af stikprøver Drage konklusioner om egenskaber for en population... …på basis af observationer i en stikprøve, en del af populationen.

21 The Literary Digest Poll (1936)
Ikke biased stikprøve Ikke biased, repræsentativ stikprøve fra hele populationen. Demokrater Republikanere Population Biased stikprøve Biased, ikke repræsentativ stikprøve af folk, der har telefon og/eller bil og/eller læser Digest. Folk, der har telefon og/eller bil og/eller læser Digest. Demokrater Republikanere Population

22 Data indsamling Data indsamling Direkte observationer Eksperimenter
Registre Spørgeskemaer Et problem med spørgeskemaer er nonrespons bias – hvad gør man når folk ikke vil svare? Typisk vil gruppen af folk, der ikke svarer være anderledes end folk, der svarer. Lav for eksempel en opfølgning på spørgeskemaet ved at ringe til folk. Folk, der slet ikke svarer, vil ligne dem der svarer anden gang mere end de ligner dem, der svarer første gang (men ikke helt). Man kan også ”over sample” dem man tror ikke vil svare (hvis man ved det) og dermed have større chance for at nogen af dem svarer.

23 Hvordan laver man en stikprøve
Simpel stikprøve I en simpel stikprøve er observationerne udvalgt, så enhver anden stikprøve med samme antal observationer, er lige så sandsynlig at vælge Observationerne kan for eksempel vælges ved hjælp af en ”Random numbers ” tabel (tabel 14 side 809 i jeres bog) 10495, 57931, 00234, 35640,……. Stratificeret stikprøve Opdele populationen i disjunkte mængder (strata) og tage en simpel stikprøve fra hver strata. Hvis man for eksempel ved, at der er forskel på hvordan mænd og kvinder svarer og der i populationen er 54 % mænd og 46 % kvinder. Klynger Simpel stikprøve af grupper (klynger) af elementer. Derefter måske simple stikprøver indenfor klyngerne Systematisk stikprøve Hvis elementer man skal udtage allerede er i tilfældig orden, kan man for eksempel tage hver 10. element, altså nummer 10, 20, 30 osv.

24 Estimator og estimat En stikprøve statistik er et numerisk mål for en opsummerende karakteristik af stikprøven. En populations parameter er et numerisk mål for en opsummerende karakteristik af populationen. En estimator af en populations parameter er en stikprøve statistik, der bruges til at estimere populations parameteren. Et estimat af en parameter er en bestemt numerisk værdi af en stikprøve statistik. Et punkt-estimat er en enkelt værdi, der bruges som et estimat for en populations parameter. Et interval-estimat er et interval, der bruges som et estimat for en populations parameter.

25 Estimatorer Stikprøve gennemsnittet er den mest almindelige estimator af populations middelværdien, μ. Stikprøve variansen, s², er den mest almindelige estimator af populations variansen, σ². Stikprøve standard afvigelsen, s, er den mest almindelige estimator af populations standard afvigelsen, σ.

26 Populations og stikprøve andele
Populations andelen er lig med antallet af elementer i populationen der tilhører den kategori, man er interesseret i, divideret med det totale antal elementer i populationen: p X N = Stikprøve andelen er antallet af elementer i stik-prøven, der tilhører den kategori, man er interesseret i, divideret med det totale antal elementer i stikprøven: $ p x n = Stikprøve andelen er en estimator for populations andelen.

27 Populations fordeling, stikprøve, populations middelværdi og stikprøve gennemsnit.
X Populations middelværdi () Stikprøve Frekvens fordeling af populationen Stikprøve gennemsnit ( ) er selv en stokastisk variabel, der følger en fordeling. X X

28 Eksempel Jeg påstår at gennemsnitshøjden er 175cm!!
Antag at højden blandt oecon studerende er normalfordelt med middelværdi μ = 175 og standard afvigelse σ = 10. Antag vi har en stikprøve på n = , dvs. X1, X2,…,Xn er uafhængige stokastiske variable, hvor Xi ~ N(175,102). Hvilken fordeling følger ? Hvad er sandsynligheden for at ligger i intervallet [174;176] ? Hvad nu hvis højderne ikke var normalfordelte…?

29 Stikprøve fordelinger
Uniform population af heltal fra 1 til 8: X P(X) XP(X) (X-x) (X-x)2 P(X)(X-x)2 8 7 6 5 4 3 2 1 . X P ( ) U n i f o r m D s t b u , E(X) =  = 4.5 V(X) = 2 = 5.25 SD(X) =  =

30 Stikprøve fordelinger
Der er 8*8 = 64 forskellige men lige sandsynlige stikprøver af 2 tal, man kan tage (med tilbagelægning) fra en uniform population af hel tallene fra 1 til 8: Hver af disse stikprøver har et gennemsnit. For eksempel er gennemsnittet af (1,4) lig 2,5 og gennemsnittet af (8,4) er 6.

31 Stikprøve fordelinger
Sandsynligheds fordelingen af stikprøve middelværdien kaldes stikprøve fordelingen af stikprøve middelværdien. Stikprøve fordelingen 8 . 7 5 6 4 3 2 1 X P ( ) Stikpøve fordeling X P(X) XP(X) X-X (X-X)2 P(X)(X-X)2

32 Stikprøvefordeling af middelværdien
Ved at sammenligne populations fordelingen og stikprøve fordelingen af middelværdien, ser man at: Stikprøve fordelingen er mere klokkeformet og den er symmetrisk. Begge har samme centrum. Stikprøve fordelingen er mere kompakt, med en mindre varians. 8 7 6 5 4 3 2 1 . X P ( ) U n i f o r m D s t b u , 8 . 7 5 6 4 3 2 1 X P ( ) Stikpøve fordeling X

33 Stikprøve-fordeling Den forventede værdi af stikprøve middelværdien er lig med populations middelværdien Variansen af stikprøve middelværdien er lig med populations variansen divideret med stikprøve størrelsen Hvis X normal fordelt, så er normalfordelt:

34 Den centrale grænseværdi sætning
Stikprøve fordelingen af middelværdien af en stikprøve taget fra en vilkårlig population er approksimativ normal fordelt for tilstrækkelig store n. Jo større n er, jo tættere er stikprøve middelværdien på at følge en normal fordeling. I praksis er n>30 ok. Så alt i alt: S Hvis X er normal, så er normal. Hvis stikprøve størrelsen er stor nok, er normal fordelt, selvom X ikke er normal fordelt.

35 Eksempler Normal Uniform Skewed Population n = 2 n = 30 X General


Download ppt "Normalfordelingen og Stikprøvefordelinger"

Lignende præsentationer


Annoncer fra Google