Normalfordelingen og Stikprøvefordelinger

Slides:



Advertisements
Lignende præsentationer
Valg med Excel Fordelingsmetoder med Excel
Advertisements

Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Dagens program Resumé - Normalfordelingen χ2-test (chi-i-anden)
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Sandsynlighedsfordelinger
Hypotese test – kapitel 6 (Signifikans test)
Anvendt Statistik Lektion 3
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Statistik og sandsynlighedsregning
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Matematikseminar foråret 2009
Statistik Lektion 5 Flere stikprøvefordelinger Estimatore og estimater
Akademi Merkonomer Statistik Aften 3
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Population, stikprøve og signifikans Mandag den 19. marts, kl ved.
Eksempel på brug af normalfordelingen
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 3
Statistik og sandsynlighedsregning
Statistik og sandsynlighedsregning
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Om variation og varians
Statistik – Lektion 2 Uafhængighed Stokastiske Variable
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Binær responsmodeller: Logit og probit 12. maj 2003
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Agenda Informationer Opsamling fra sidst Normalfordelingen
Grundlæggende teoretisk statistik
Kvantitative metoder 2: Inferens i den lineære regressionsmodel1 Kvantitative metoder 2 Inferens i den lineære regressionsmodel 12. marts 2007.
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik for geografer
Bernoulli og binomial fordelingerne
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 1. oktober 2004.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
Statistik Lektion 7 Hypotesetest og kritiske værdier
 Gennemgang af aflevering  Poisson Fordelingen  Kontinuerte Fordelinger ◦ Intro til kontinuerte fordelinger ◦ Normalfordelingen.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Grundlæggende teoretisk statistik
Økonometri – lektion 8 Multipel Lineær Regression
Betinget sandsynlighed Bayes’ regel Diskrete stokastiske variable
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Grundlæggende teoretisk statistik
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Eksperimentel metode.
Statistik II 4. Lektion Logistisk regression.
Statistik for geografer Lektion 8. Hvordan beskrives fordelingen?
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel.
Opgave i normalfordeling 2.g, HHX. Grundbegreber Middelværdi, μ (græsk: my) Standardafvigelse, σ(græsk: sigma) X ̴ N(μ,σ)
Stikprøve uden tilbagelægning - Hypergeometrisk fordeling
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Anvendt Statistik Lektion 4
Anvendt Statistik Lektion 3
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Normalfordelingen og Stikprøvefordelinger Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Sandsynlighedsfordelinger – kontinuerte variable Sandsynlighedsfordelingen for en kontinuert variabel tildeler sandsynligheder til et interval, for eksempel p(a<x<b). Ligeledes gælder at Sandsynligheden for intervallet, der indeholder alle mulige værdier af x, er lig med 1. Grafen for en sandsynlighedsfordeling for en kontinuert variabel er en glat kontinuert kurve. Arealet under kurven i et givet interval, er sandsynligheden for at x tilhører dette interval. Den meste brugte kontinuerte fordeling, er normal fordelingen. f(x) a b x

Normal fordelingen Dens kendetegn er: Klokkeformet og symmetrisk omkring dens middelværdi Middelværdi=median=mode Den er karakteriseret ved en middelværdi μ og varians σ² (eller standard afvigelse σ). X~N(μ,σ²) betyder, at X følger en normal fordeling med middelværdi μ og varians σ² Arealet under kurven indenfor zσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse. Er uanset parametre værdier, defineret for alle x (dvs x kan antage værdier fra minus uendelig til plus uendelig)  

Linear kombination af uafhængige normal-fordelte stokastiske variable Hvis X1, X2, …, Xn er uafhængige normalfordelte stokastiske variable, så vil variablen Q defineret som Q = a1X1 + a2X2 + … + anXn + b også være normal fordelt, med: Bemærk: Det er varianserne, der lægges sammen og ikke standard-afvigelserne.

Eksempel E(Q) = 12 – 2(-5) + 3(8) – 4(10) + 5 = 11 Eksempel 4.3: Lad X1 , X2 , X3 og X4 være uafhængige normal fordelte stokastiske variable med middelværdi og varians givet som i tabellen. Find middelværdien og variansen af Q = X1 - 2X2 + 3X2 - 4X4 + 5 Mean Variance X1 12 4 X2 -5 2 X3 8 5 X4 10 1 E(Q) = 12 – 2(-5) + 3(8) – 4(10) + 5 = 11 V(Q) = 4 + (-2)2(2) + 32(5) + (-4)2(1) = 73 SD(Q) =

Bogstav Eksempel Antag at vi har n uafhængige stokastiske variable X1 , X2 , …, Xn , der alle følger den samme normal-fordeling med middelværdi μ og varians σ2. Definer Hvad er middelværdi og varians for S? E(S) = V(S) = S ~ N( , )

Standard normal fordelingen Standard normal fordelingen, er normalfordelingen med middelværdi μ=0 og standard afvigelse σ=1, Z~N(0,1²) Standard Normal fordeling . 4 . 3 =1 { z ) ( f . 2 . 1 . - 5 - 4 - 3 - 2 - 1 1 2 3 4 5  = 0 Z NB: En standard normal fordelt stokastisk variabel betegnes sædvanligvis Z.

Tabellen Sandsynligheder for standard normal fordelingen er tabellagt i Tabel 2 i Appendiks C, side 776 De tabellagte værdier er sandsynligheder for intervaller fra μ=0 til punkter z til højre for 0, altså de positive z værdier Da normal fordelingen er symmetrisk, er hele arealet til venstre for 0 lig med ½ Denne halve skal man huske at trække fra eller lægge til – afhængig af hvilket interval man er interesseret i at finde sandsynligheden for, se Tips og Trix 5 4 3 2 1 - . Z f ( z ) S t a n d r N o m l D i s b u 1.56 { Figuren viser P(0<Z<1,56) Hvis nu man ville have: P(Z<1,56)=½+P(0<Z<1,56)

Find P(0 < Z < 1.56) tabel 2 i Appendiks C, side 776 Standard Normal Probabilities z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 5 4 3 2 1 - . Z f ( z ) S t a n d r N o m l D i s b u 1.56 { Kig i rækken med 1.5 og søjlen med .06 P(0  Z  1.56) = 0.4406

Find: P(Z < -2.47) 5 4 3 2 1 - . Z f ( z ) S t a n d r N o m l D i s b u Tabel areal for 2.47 P(0 < Z < 2.47) = 0.4932 Arealet til venstre for -2.47 P(Z < -2.47) = .5 - 0.4932 = 0.0068 For at finde P(Z<-2.47): Find tabel areal for 2.47 P(0 < Z < 2.47) = .4932 P(Z < -2.47) = .5 - P(0 < Z < 2.47) = .5 - .4932 = 0.0068 z ... .06 .07 .08 . . . . . . . . . . . . 2.3 ... 0.4909 0.4911 0.4913 2.4 ... 0.4931 0.4932 0.4934 2.5 ... 0.4948 0.4949 0.4951 .

Find: P(1< Z < 2) For at finde P(1  Z  2): 1. Find tabel arealet for 2.00 F(2) = P(Z  2.00) = .5 + .4772 =.9772 2. Find tabel arealet for 1.00 F(1) = P(Z  1.00) = .5 + .3413 = .8413 3. P(1  Z  2.00) = P(Z  2.00) - P(Z  1.00) = .9772 - .8413 = 0.1359 z .00 ... . . 0.9 0.3159 ... 1.0 0.3413 ... 1.1 0.3643 ... 1.9 0.4713 ... 2.0 0.4772 ... 2.1 0.4821 ... S t a n d a r d N o r m a l D i s t r i b u t i o n . 4 Areal mellem 1 og 2 P(1  Z  2) = .9772 - .8413 = 0.1359 . 3 ) z ( f . 2 . 1 . - 5 - 4 - 3 - 2 - 1 1 2 3 4 5 Z

Summe opgave Find P(0<Z<1,96) Find P(-1,5<Z<0)

Find: P(0 < Z < z) = 0.40 Find Z, så P( 0 ≤ Z ≤ z ) = 0,40 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 . . . . . . . . . . . . . . . . . . . . . . Find Z, så P( 0 ≤ Z ≤ z ) = 0,40 Find en sandsynlighed så tæt på 0.40. som muligt. 2. Bestem herefter værdien af z fra den pågældende række og søjle. P( 0 ≤ Z ≤ 1,28 ) = 0,40 Desuden, da P(Z ≤ 0) = 0,50 P( Z ≤ 1,28 ) = 0,90 Areal til venstre for 0 = .50 P(z  0) = .50 S t a n d a r d N o r m a l D i s t r i b u t i o n . 4 Areal til højre for 0 = .40 (.3997) . 3 z ) f ( . 2 . 1 . - 5 - 4 - 3 - 2 - 1 1 2 3 4 5 Z = 1.28 Z

Summe opgave Find P(Z<z)=0,975

Transformation til standard normal fordelingen og tilbage igen Enhver normal fordelt stokastisk variabel kan transformeres til en standard normal fordelt stokastisk variabel! Hvis X~N(μ,σ²), så er Den inverse transformation er også gyldig:

Transformation til standard normal fordelingen og tilbage igen Transformationen kan bruges til at finde sandsynligheder for normal fordelte stokastiske variable, der ikke er standard normal fordelt: Transformer X om til Z – ligeledes for interval grænserne Find sandsynlighederne for Z, der vil være de samme som for X

Eksempel Antag X~N(50,102) Find P(45<X<60)

Eksempler fra bogen ( ) ( ) æ è ç ö ø ÷ æ è ç ö ø ÷ Eksempel 4-9 X~N(160,302) Eksempel 4-10 X~N(127,222) ( ) P X Z . 100 180 160 30 2 6667 4772 2475 7247 £ = - + æ è ç ö ø ÷ m s ( ) P X Z . < = - + æ è ç ö ø ÷ 150 127 22 1 045 5 3520 8520 m s

Den inverse transformation Eksempel 4-12 Antag X~N(124,122). Find x, så P(X > x) = 0.10. Løsning: Bemærk P(Z > z) 0.10 for z=1.28. Derfor: x =  + z = 124 + (1.28)(12) = 139.36 1 8 3 . 4 2 X f ( x ) N o r m a l D i s t b u n :  = ,  0.1 139.36 z .07 .08 .09 . . . . . . . . . . 1.1 . . . 0.3790 0.3810 0.3830 1.2 . . . 0.3980 0.3997 0.4015 1.3 . . . 0.4147 0.4162 0.4177 . . . . . . . . . .

Statistik Statistisk Inferens: Prædiktere værdier af populations parametre Teste hypoteser om værdier af populations parametre Tage beslutninger på basis af stikprøver Drage konklusioner om egenskaber for en population... …på basis af observationer i en stikprøve, en del af populationen.

The Literary Digest Poll (1936) Ikke biased stikprøve Ikke biased, repræsentativ stikprøve fra hele populationen. Demokrater Republikanere Population Biased stikprøve Biased, ikke repræsentativ stikprøve af folk, der har telefon og/eller bil og/eller læser Digest. Folk, der har telefon og/eller bil og/eller læser Digest. Demokrater Republikanere Population

Data indsamling Data indsamling Direkte observationer Eksperimenter Registre Spørgeskemaer Et problem med spørgeskemaer er nonrespons bias – hvad gør man når folk ikke vil svare? Typisk vil gruppen af folk, der ikke svarer være anderledes end folk, der svarer. Lav for eksempel en opfølgning på spørgeskemaet ved at ringe til folk. Folk, der slet ikke svarer, vil ligne dem der svarer anden gang mere end de ligner dem, der svarer første gang (men ikke helt). Man kan også ”over sample” dem man tror ikke vil svare (hvis man ved det) og dermed have større chance for at nogen af dem svarer.

Hvordan laver man en stikprøve Simpel stikprøve I en simpel stikprøve er observationerne udvalgt, så enhver anden stikprøve med samme antal observationer, er lige så sandsynlig at vælge Observationerne kan for eksempel vælges ved hjælp af en ”Random numbers ” tabel (tabel 14 side 809 i jeres bog) 10495, 57931, 00234, 35640,……. Stratificeret stikprøve Opdele populationen i disjunkte mængder (strata) og tage en simpel stikprøve fra hver strata. Hvis man for eksempel ved, at der er forskel på hvordan mænd og kvinder svarer og der i populationen er 54 % mænd og 46 % kvinder. Klynger Simpel stikprøve af grupper (klynger) af elementer. Derefter måske simple stikprøver indenfor klyngerne Systematisk stikprøve Hvis elementer man skal udtage allerede er i tilfældig orden, kan man for eksempel tage hver 10. element, altså nummer 10, 20, 30 osv.

Estimator og estimat En stikprøve statistik er et numerisk mål for en opsummerende karakteristik af stikprøven. En populations parameter er et numerisk mål for en opsummerende karakteristik af populationen. En estimator af en populations parameter er en stikprøve statistik, der bruges til at estimere populations parameteren. Et estimat af en parameter er en bestemt numerisk værdi af en stikprøve statistik. Et punkt-estimat er en enkelt værdi, der bruges som et estimat for en populations parameter. Et interval-estimat er et interval, der bruges som et estimat for en populations parameter.

Estimatorer Stikprøve gennemsnittet er den mest almindelige estimator af populations middelværdien, μ. Stikprøve variansen, s², er den mest almindelige estimator af populations variansen, σ². Stikprøve standard afvigelsen, s, er den mest almindelige estimator af populations standard afvigelsen, σ.

Populations og stikprøve andele Populations andelen er lig med antallet af elementer i populationen der tilhører den kategori, man er interesseret i, divideret med det totale antal elementer i populationen: p X N = Stikprøve andelen er antallet af elementer i stik-prøven, der tilhører den kategori, man er interesseret i, divideret med det totale antal elementer i stikprøven: $ p x n = Stikprøve andelen er en estimator for populations andelen.

Populations fordeling, stikprøve, populations middelværdi og stikprøve gennemsnit. X Populations middelværdi () Stikprøve Frekvens fordeling af populationen Stikprøve gennemsnit ( ) er selv en stokastisk variabel, der følger en fordeling. X X

Eksempel Jeg påstår at gennemsnitshøjden er 175cm!! Antag at højden blandt oecon studerende er normalfordelt med middelværdi μ = 175 og standard afvigelse σ = 10. Antag vi har en stikprøve på n = , dvs. X1, X2,…,Xn er uafhængige stokastiske variable, hvor Xi ~ N(175,102). Hvilken fordeling følger ? Hvad er sandsynligheden for at ligger i intervallet [174;176] ? Hvad nu hvis højderne ikke var normalfordelte…?

Stikprøve fordelinger Uniform population af heltal fra 1 til 8: X P(X) XP(X) (X-x) (X-x)2 P(X)(X-x)2 1 0.125 0.125 -3.5 12.25 1.53125 2 0.125 0.250 -2.5 6.25 0.78125 3 0.125 0.375 -1.5 2.25 0.28125 4 0.125 0.500 -0.5 0.25 0.03125 5 0.125 0.625 0.5 0.25 0.03125 6 0.125 0.750 1.5 2.25 0.28125 7 0.125 0.875 2.5 6.25 0.78125 8 0.125 1.000 3.5 12.25 1.53125 1.000 4.500 5.25000 8 7 6 5 4 3 2 1 . X P ( ) U n i f o r m D s t b u , E(X) =  = 4.5 V(X) = 2 = 5.25 SD(X) =  = 2.2913

Stikprøve fordelinger Der er 8*8 = 64 forskellige men lige sandsynlige stikprøver af 2 tal, man kan tage (med tilbagelægning) fra en uniform population af hel tallene fra 1 til 8: Hver af disse stikprøver har et gennemsnit. For eksempel er gennemsnittet af (1,4) lig 2,5 og gennemsnittet af (8,4) er 6.

Stikprøve fordelinger Sandsynligheds fordelingen af stikprøve middelværdien kaldes stikprøve fordelingen af stikprøve middelværdien. Stikprøve fordelingen 8 . 7 5 6 4 3 2 1 X P ( ) Stikpøve fordeling X P(X) XP(X) X-X (X-X)2 P(X)(X-X)2 1.0 0.015625 0.015625 -3.5 12.25 0.191406 1.5 0.031250 0.046875 -3.0 9.00 0.281250 2.0 0.046875 0.093750 -2.5 6.25 0.292969 2.5 0.062500 0.156250 -2.0 4.00 0.250000 3.0 0.078125 0.234375 -1.5 2.25 0.175781 3.5 0.093750 0.328125 -1.0 1.00 0.093750 4.0 0.109375 0.437500 -0.5 0.25 0.027344 4.5 0.125000 0.562500 0.0 0.00 0.000000 5.0 0.109375 0.546875 0.5 0.25 0.027344 5.5 0.093750 0.515625 1.0 1.00 0.093750 6.0 0.078125 0.468750 1.5 2.25 0.175781 6.5 0.062500 0.406250 2.0 4.00 0.250000 7.0 0.046875 0.328125 2.5 6.25 0.292969 7.5 0.031250 0.234375 3.0 9.00 0.281250 8.0 0.015625 0.125000 3.5 12.25 0.191406 1.000000 4.500000 2.625000

Stikprøvefordeling af middelværdien Ved at sammenligne populations fordelingen og stikprøve fordelingen af middelværdien, ser man at: Stikprøve fordelingen er mere klokkeformet og den er symmetrisk. Begge har samme centrum. Stikprøve fordelingen er mere kompakt, med en mindre varians. 8 7 6 5 4 3 2 1 . X P ( ) U n i f o r m D s t b u , 8 . 7 5 6 4 3 2 1 X P ( ) Stikpøve fordeling X

Stikprøve-fordeling Den forventede værdi af stikprøve middelværdien er lig med populations middelværdien Variansen af stikprøve middelværdien er lig med populations variansen divideret med stikprøve størrelsen Hvis X normal fordelt, så er normalfordelt:

Den centrale grænseværdi sætning Stikprøve fordelingen af middelværdien af en stikprøve taget fra en vilkårlig population er approksimativ normal fordelt for tilstrækkelig store n. Jo større n er, jo tættere er stikprøve middelværdien på at følge en normal fordeling. I praksis er n>30 ok. Så alt i alt: S Hvis X er normal, så er normal. Hvis stikprøve størrelsen er stor nok, er normal fordelt, selvom X ikke er normal fordelt.

Eksempler Normal Uniform Skewed Population n = 2 n = 30 X  General