Stikprøvefordelinger og konfidensintervaller

Slides:



Advertisements
Lignende præsentationer
Valg med Excel Fordelingsmetoder med Excel
Advertisements

Den danske befolknings syn på handicappedes rettigheder
Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Statistik Lektion 5 Flere stikprøvefordelinger Estimatore og estimater
Hypotese test – kapitel 6 (Signifikans test)
Anvendt Statistik Lektion 3
v/ Professor Lars Ehlers, Aalborg Universitet
Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Statistik og sandsynlighedsregning
Program Informationer χ2-test (chi-i-anden) Projekt 3
Sortering af affald Dato: 17. december Agenda Sortering af affald Dato: 17. december 2010 TNS Gallup A/S Kontaktperson Celia Paltved-Kaznelson Danmarks.
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Matematikseminar foråret 2009
Anvendt Statistik Lektion 6
Statistik Lektion 5 Flere stikprøvefordelinger Estimatore og estimater
Statistik Lektion 5 Flere stikprøvefordelinger Estimatore og estimater
Anvendt Statistik Lektion 2
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Statistik og kvantitativ metode Politik & Administration og Samfundsfag 3. semester 2007 Lektion 5, tirsdag den 23. oktober Punkt- og intervalestimering.
Anvendt Statistik Lektion 2
Ugrupperede observationer Middelværdi, varians og spredning
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
MMP 21 Model og Metode til Programudvikling – MMP 2 Modellering og simulering af Posthus – 2: Ekspedienten Pointer operationer Disken, oprettelse af objekter.
Statistik – Lektion 2 Uafhængighed Stokastiske Variable
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 4 Kovarians og korrelation Mere om normalfordelingen
Agenda Informationer Opsamling fra sidst Normalfordelingen
Grundlæggende teoretisk statistik
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Matematik B 1.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
1 vare på 2 markeder, samme pris
Ugrupperede observationer Middelværdi, varians og spredning
Statistik for geografer
Bernoulli og binomial fordelingerne
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 6 Konfidensinterval for andele
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Grundlæggende teoretisk statistik
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Økonometri – lektion 8 Multipel Lineær Regression
Simpel Lineær Regression
Konfidensintervaller og Hypotesetest
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 3
Præsentationens transcript:

Stikprøvefordelinger og konfidensintervaller Stikprøvefordelingen for middelværdi Den Centrale Grænseværdi Sætning Egenskaber Ved Estimatore Konfidensintervaller t-fordelingen

Estimator og estimat En stikprøve statistik er et numerisk mål for en opsummerende karakteristik af stikprøven. En populations parameter er et numerisk mål for en opsummerende karakteristik af populationen. fx fx En estimator af en populations parameter er en stikprøve statistik, der bruges til at estimere populations parameteren. Et estimat af en parameter er en bestemt numerisk værdi af en stikprøve statistik. Et punkt-estimat er en enkelt værdi, der bruges som et estimat for en populations parameter. Et interval-estimat er et interval, der bruges som et estimat for en populations parameter. Eksempel: er en estimator for . er et (punkt) estimat af .

Populations fordeling, stikprøve, populations middelværdi og stikprøve gennemsnit. X Populations middelværdi () Stikprøve Frekvens fordeling af populationen Stikprøve gennemsnit ( ) er selv en stokastisk variabel, der følger en fordeling. X X

Stikprøve-fordeling Antag X1,X2,…,Xn er en uafhængig stikprøve, hvor μX=E[X] og σ2X=V[X] er populationens middelværdi og varians. Stikprøve-middelværdien er Den forventede værdi af stikprøve-middelværdien er lig med populations-middelværdien Variansen af stikprøve middelværdien er lig med populations variansen divideret med stikprøve-størrelsen

Stikprøve-fordeling – Normalfordelt stikprøve Hvis X normal fordelt, så er normalfordelt: Hvilken fordeling følger , hvis stikprøven ikke er normalfordelt…?

Stikprøve fordelinger Uniform population af heltal fra 1 til 8: X P(X) XP(X) X2 P(X)X2 0.125 0.125 1 0.125 2 0.125 0.250 4 0.5 3 0.125 0.375 9 1.125 4 0.125 0.500 16 2.0 5 0.125 0.625 25 3.125 6 0.125 0.750 36 4.5 7 0.125 0.875 49 6.125 8 0.125 1.000 64 8.0 1.000 4.500 25.5 V(X) = E[X2] - (E[X])2 = 25.5-4.52 = 5.25 U n i f o r m D i s t r i b u t i o n ( 1 , 8 ) . 2 X ) ( P . 1 . 1 2 3 4 5 6 7 8 X E(X) =  = 4.5 V(X) = 2 = 5.25 SD(X) =  = 2.2913

Stikprøve fordelinger Der er 8*8 = 64 forskellige men lige sandsynlige stikprøver af 2 tal, man kan tage (med tilbagelægning) fra en uniform population af heltallene fra 1 til 8: Hver af disse stikprøver har et gennemsnit. For eksempel er gennemsnittet af (1,4) lig 2.5 og gennemsnittet af (8,4) er 6.0.

Stikprøve fordelinger Sandsynligheds fordelingen af stikprøve middelværdien kaldes stikprøve fordelingen af stikprøve middelværdien. Stikprøve fordelingen X P(X) XP(X) X-X (X-X)2 P(X)(X-X)2 1.0 0.015625 0.015625 -3.5 12.25 0.191406 1.5 0.031250 0.046875 -3.0 9.00 0.281250 2.0 0.046875 0.093750 -2.5 6.25 0.292969 2.5 0.062500 0.156250 -2.0 4.00 0.250000 3.0 0.078125 0.234375 -1.5 2.25 0.175781 3.5 0.093750 0.328125 -1.0 1.00 0.093750 4.0 0.109375 0.437500 -0.5 0.25 0.027344 4.5 0.125000 0.562500 0.0 0.00 0.000000 5.0 0.109375 0.546875 0.5 0.25 0.027344 5.5 0.093750 0.515625 1.0 1.00 0.093750 6.0 0.078125 0.468750 1.5 2.25 0.175781 6.5 0.062500 0.406250 2.0 4.00 0.250000 7.0 0.046875 0.328125 2.5 6.25 0.292969 7.5 0.031250 0.234375 3.0 9.00 0.281250 8.0 0.015625 0.125000 3.5 12.25 0.191406 1.000000 4.500000 2.625000 8 . 7 5 6 4 3 2 1 X P ( ) Stikpøve fordeling

Stikprøvefordeling af middelværdien U n i f o r m D i s t r i b u t i o n ( 1 , 8 ) Ved at sammenligne populations-fordelingen og stikprøve-fordelingen af middelværdien, ser man at: Stikprøve-fordelingen er mere klokkeformet og den er symmetrisk. Begge har samme middelværdi. Stikprøve fordelingen er mere kompakt, med en mindre varians. . 2 ) X ( P . 1 . 1 2 3 4 5 6 7 8 X 8 . 7 5 6 4 3 2 1 X P ( ) Stikpøve-fordeling X

Den centrale grænseværdi sætning (CLT) Stikprøve fordelingen af middelværdien af en stikprøve taget fra en vilkårlig population er approksimativ normal fordelt for tilstrækkelig store n. I andre ord: Hvis X1,…,Xn er en uafhængig stikprøve fra en vilkårlig population, så gælder hvis n er stor nok. Jo større n er, jo tættere er stikprøve middelværdien på at følge en normal-fordeling. I praksis er n>30 nok.

Eksempler: Stikprøvefordelingen for Normal Uniform Skewed Population n = 2 n = 30 X  General

Summeopgave Gennemsnitsløn et år efter endt cand.oecon uddannelsen: 30.000kr/md Hvad er sandsynligheden for at 25 tilfældigt udvalgte cand.oecon’er har en gennemsnitsløn på mindre end 29.000kr/md? Antag, at standard afvigelsen er kendt og er 2.500kr/md.

Populations og stikprøve andele Populations andelen er andelen af ”succeser” i populationen: Stikprøve andelen er andelen af succeser i stikprøven: Stikprøve andelen er et estimat af populations andelen p.

Populations og stikprøve andele - fortsat Den tilsvarende estimator er Hvor X følger en binomial fordeling med antals parameter n og sandsynligshedparameter p, dvs. X~B(n,p). Eksempel: n=10 og p=0.40 Da X~B(5,0.4) kan vi slå op i Tabel 1 side 773 for den kumulerede binomialfordeling:

Populations og stikprøve andele - fortsat Genkald at X = X1+…+Xn , hvor Xi er et Bernoulli forsøg, hvor sandsynligheden for succes er P(Xi=1)=p. Derfor E[Xi]=p og V[Xi]=p(1-p). Ifølge CLT har vi (approksimativt): Approksimationen er god, hvis både np og n(1-p) er større end 5. Eksempel: n=10 og p=0.40 (her er approksimationen ikke god)

Central og ikke-central estimator En central (unbiased) estimator rammer i gennemsnit målet. { Bias En ikke-central (biased) estimator rammer i gennemsnit ikke målet.

Effektiv estimator En estimator er effektiv hvis den har en relativ lille varians (og standard afvigelse). En effektiv estimator er, gennemsnitlig set, tættest på parameteren, der estimeres. En ineffektiv estimator er, gennemsnitlig set, længere væk fra parameteren, der estimeres.

Konsistent og sufficient estimator En estimator er konsistent hvis sandsynligheden for at ligge tæt på den parameter, den estimerer, stiger, når størrelsen på stikprøven stiger. n = 100 n = 10 Konsistens

Estimatorerne Alle de gennemgåede estimatorer er ”de bedste” i ovenfor nævnte forstand. Se på estimatet for variansen: Hvorfor divideres med n-1 og ikke med n? Fordi ellers er den ikke en central estimator. Desuden handler det også om antallet af frihedsgrader… Bemærk:

Konfidens intervaller Konfidens intervaller for: Konfidens interval for middelværdi, varians kendt Konfidens interval for middelværdi, varians ukendt

Konfidens intervaller Et punkt-estimat estimerer værdien af en ukendt populations parameter ved en enkelt værdi. Fx: Middelhøjden blandt oecon studernde . Et konfidens interval er et interval, der estimerer værdien af en ukendt populations parameter. Kaldes også et interval estimat. Sammen med intervallet gives et mål for, hvor sikker man er på, at den sande populations parameter ligger i intervallet. Dette mål kaldes for konfidens niveauet. Et punkt estimat indeholder ikke meget information om den faktiske værdi af μ – fx hvor sikkert er vores punkt estimat? Et interval estimat indeholder flere informationer, for eksempel: Vi er 95% sikre på, at intervallet [164,8 ; 180,7] indeholde den sande middelværdi μ. Eller vi er 90% sikre på, at intervallet [166,1 ; 179,3] indeholder den sande middelværdi μ.

Konfidensinterval for middelværdien - når X er normal-fordelt eller stikprøven er stor Da gælder følgende: En 95% konfidensinterval for middelværdi Bemærk at estimatoren er er ersattet med estimatet .

Mellemregninger…. 0,95 0,025 0,025

Konfidens interval for middelværdi . 4 3 2 1 x f ( ) S a m p l i n g D s t r b u o h e M  2.5% 95% 2.5% falder over intervallet 2.5% falder nedenfor intervallet 95% falder indenfor intervallet Approksimativt 95% af stikprøve middelværdierne kan forventes at falde indenfor intervallet Omvendt, cirka 2.5% kan forventes at være under og 2.5% kan forventes at være over . Så 5% kan forventes at være udenfor intervallet. .

Konfidens interval for middelværdi p l i n g D i s t r i b u t i o n o f t h e M e a n Approksimativt 95% af intervallerne omring stikprøve middelværdien kan forventes at indeholde den faktiske værdi af populations middelværdien, . *5% af sådanne intervaller omkring stikprøve middelværdien kan forventes ikke at inkludere den faktiske værdi af populations middelværdien. . 4 95% . 3 f ( x ) . 2 . 1 2.5% 2.5% x x x . x  x x * x x x x x * x x x x

Et (1-a )100% konfidens interval for m Vi definerer som den z-værdi, hvor sandsynligheden for at Z er højere end denne værdi, er . Kaldes også fraktilen eller den kritiske værdi. (1-α)100% kaldes konfidens-niveauet. fordeling æ ö S t a n d a r d N o r m a l a/2 P ç z > z ÷ = è a ø . 4 2 æ ö a/2 P ç z < - z ÷ = . 3 è a ø 2 z ) æ ö ( f . 2 P ç - z < z < z ÷ = ( 1 - a ) è a a ø . 1 2 2 (1-a) 100% konfidens int erval: . - 5 - 4 - 3 - 2 - 1 1 2 3 4 5 Z

Kritiske værdier for z og konfidens-niveauer m a l D i s t r i b u t i o n . 4 . 3 z ) ( f . 2 . 1 . - 5 - 4 - 3 - 2 - 1 1 2 3 4 5 Z

Konfidens niveau og bredden af konfidens-intervallet Når man tager stikprøver fra den samme population og bruger den samme stikprøve størrelse, så jo højere et konfidens-niveau, jo bredere et konfidens-interval. S t a n d a r d N o r m a l D i s t r i b u t i o n S t a n d a r d N o r m a l D i s t r i b u t i o n . 4 . 4 . 3 . 3 z ) z ) f ( . 2 ( f . 2 . 1 . 1 . . - 5 - 4 - 3 - 2 - 1 1 2 3 4 5 - 5 - 4 - 3 - 2 - 1 1 2 3 4 5 Z Z

Stikprøvestørrelsen og bredden af konfidens-intervallet Når man tager stikprøver fra den samme population og bruger det samme konfidens niveau, så jo større stikprøvestørrelse, n, jo smallere et konfidens interval. . 4 3 2 1 x f ( ) S a m p l i n g D s t r b u o h e M 95% konfidensinterval: n = 20 . 9 8 7 6 5 4 3 2 1 x f ( ) S a m p l i n g D s t r b u o h e M 95% konfidensinterval: n = 40

Eksempel på tavlen

Student’s t fordeling Hvis populations standard afvigelsen, σ, er ukendt, erstat σ med stikprøve standard afvigelsen, s. Hvis populationen er normal, så er: t-fordelt med (n-1) frihedsgrader (degrees of freedom). t fordelingen er klokkeformet og symmetrisk og defineret ved antal frihedsgrader (df). Middelværdien er altid lig 0. Variansen af t er større end 1, men går mod 1, når antallet af frihedsgrader vokser. t fordelingen er fladere og har tykkere haler en standard normal fordelingen. t fordelingen går mod standard normal fordelingen nå antallet af frihedsgrader vokser. Standard normal t, df=20 t, df=10  

Konfidens interval for  når  er ukendt - t fordelingen Et (1-)100% konfidens interval for  når  er ukendt (og man antager en normalfordelt population): hvor er værdien i t fordelingen med n-1 frihedsgraders, hvor sandsynligheden for at t er højere end denne værdi, er .

t Fordelingen df t0.100 t0.050 t0.025 t0.010 t0.005 --- ----- ----- ------ ------ ------ 1 3.078 6.314 12.706 31.821 63.657 2 1.886 2.920 4.303 6.965 9.925 3 1.638 2.353 3.182 4.541 5.841 4 1.533 2.132 2.776 3.747 4.604 5 1.476 2.015 2.571 3.365 4.032 6 1.440 1.943 2.447 3.143 3.707 7 1.415 1.895 2.365 2.998 3.499 8 1.397 1.860 2.306 2.896 3.355 9 1.383 1.833 2.262 2.821 3.250 10 1.372 1.812 2.228 2.764 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.539 2.861 20 1.325 1.725 2.086 2.528 2.845 21 1.323 1.721 2.080 2.518 2.831 22 1.321 1.717 2.074 2.508 2.819 23 1.319 1.714 2.069 2.500 2.807 24 1.318 1.711 2.064 2.492 2.797 25 1.316 1.708 2.060 2.485 2.787 26 1.315 1.706 2.056 2.479 2.779 27 1.314 1.703 2.052 2.473 2.771 28 1.313 1.701 2.048 2.467 2.763 29 1.311 1.699 2.045 2.462 2.756 30 1.310 1.697 2.042 2.457 2.750 40 1.303 1.684 2.021 2.423 2.704 60 1.296 1.671 2.000 2.390 2.660 120 1.289 1.658 1.980 2.358 2.617 1.282 1.645 1.960 2.326 2.576 t D i s t r i b u t i o n : d f = 1 . 4 . 3 Areal = 0.10 } Areal = 0.10 } ) t ( f . 2 . 1 . } -1.372 1.372 } -2.228 2.228 t Areal = 0.025 Arela = 0.025 For store frihedsgrader kan t fordelingen approksimeres ved en standard normal fordeling.

Eksempel 6-2 En aktie analytiker vil estimere den gennemsnitlige gevinst på en bestemt aktie. En stikprøve på 15 dage giver en gennemsnitlig gevinst på og en standard afvigelse på s = 3.5%. Antag en normal population og giv et 95% konfidens interval for den gennemsnitlige gevinst på denne aktie. Den kritiske værdi af t for df = (n -1) = (15 -1) = 14 og et højre halet areal på α/2 = 0.025 er: Konfidens intervallet er: df t0.100 t0.050 t0.025 t0.010 t0.005 --- ----- ----- ------ ------ ------ 1 3.078 6.314 12.706 31.821 63.657 . . . . . . . . . . . . 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947

Konfidens interval for populations andelen, p, for store stikprøver

Eksempel 6-4 Hvor stor en andel har udenlandske firmaer af det amerikanske marked for et eller andet produkt. En stikprøve på 100 forbrugere udtages og 34 af disse bruger det udenlandske produkt; resten bruger det amerikanske produkt. Giv et 95% konfidensinterval for andelen af brugere af udenlandske produkter.

Konfidens interval for populations variansen: Chi i anden (2) fordelingen Stikprøve variansen, s², er en central estimator for populations variansen σ². Konfidens intervaller for populations variansen baseres på 2 fordelingen. 2 fordelingen er sandsynligheds fordelingen for en sum af uafhængige kvadrerede standard normal fordelte stokastiske variable. Middelværdien er lig med antallet af frihedsgraden, E(X)=df Variansen er lig med to gange antallet af frihedsgrader, V(X)=2df

2 fordelingen En 2 fordelt stokastisk variabel kan ikke være negativ, så den er begrænset af 0 til venstre. Fordelingen er højre skæv. Fordelingen går mod normal fordelingen, når antallet af frihedsgrader vokser. C h i - S q u a r e D i s t r i b u t i o n : d f = 1 , d f = 3 , d f = 5 . 1 . 9 df = 10 . 8 . 7 ) . 6 2  df = 30 ( . 5 f . 4 . 3 df = 50 . 2 . 1 . 5 1  2

Sandsynligheder i 2 fordelingen Areal i højre hale .995 .990 .975 .950 .900 .100 .050 .025 .010 .005 Areal i venstre hale df .005 .010 .025 .050 .100 .900 .950 .975 .990 .995 1 0.0000393 0.000157 0.000982 0.000393 0.0158 2.71 3.84 5.02 6.63 7.88 2 0.0100 0.0201 0.0506 0.103 0.211 4.61 5.99 7.38 9.21 10.60 3 0.0717 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84 4 0.207 0.297 0.484 0.711 1.06 7.78 9.49 11.14 13.28 14.86 5 0.412 0.554 0.831 1.15 1.61 9.24 11.07 12.83 15.09 16.75 6 0.676 0.872 1.24 1.64 2.20 10.64 12.59 14.45 16.81 18.55 7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28 8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95 9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.59 10 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19 11 2.60 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.72 26.76 12 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.30 13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82 14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32 15 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.80 16 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.27 17 5.70 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.72 18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16 19 6.84 7.63 8.91 10.12 11.65 27.20 30.14 32.85 36.19 38.58 20 7.43 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40.00 21 8.03 8.90 10.28 11.59 13.24 29.62 32.67 35.48 38.93 41.40 22 8.64 9.54 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.80 23 9.26 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.18 24 9.89 10.86 12.40 13.85 15.66 33.20 36.42 39.36 42.98 45.56 25 10.52 11.52 13.12 14.61 16.47 34.38 37.65 40.65 44.31 46.93 26 11.16 12.20 13.84 15.38 17.29 35.56 38.89 41.92 45.64 48.29 27 11.81 12.88 14.57 16.15 18.11 36.74 40.11 43.19 46.96 49.65 28 12.46 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.99 29 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.34 30 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67

Konfidens interval for populations variansen Et (1-)100% konfidens interval for populations variansen * (hvis populationen er normal fordelt) er givet som: hvor er fraktilen i 2 fordelingen og er fraktilen. Bemærk: Fordi 2 fordelingen er skæv, er konfidens-intervallet for populations- variansen ikke symmetrisk.

Eksempel 6-5 En maskine fylder kaffekander (med kaffe ;-) Hvis det gennemsnitlige indhold er forskellig fra hvad det skal være, kan maskinen justeres. Hvis variansen er for høj, skal maskinen sendes til reparation. En stikprøve på 30 kander giver et varians estimat på s2 = 18,540. Giv et 95% konfidens interval for populations variansen, 2.

Eksempel C h i - S q u a r e D s t b o n : d = 9 Areal i højre hale df .995 .990 .975 .950 .900 .100 .050 .025 .010 .005 . . . . . . . . . . . 28 12.46 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.99 29 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.34 30 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67 7 6 5 4 3 2 1 .  f ( ) C h i - S q u a r e D s t b o n : d = 9 0.025 0.95