Ugrupperede observationer Middelværdi, varians og spredning

Slides:



Advertisements
Lignende præsentationer
Atomer Et programmeret forløb. En måde at lære på.
Advertisements

At Dividere Decimaltal.
Funktioner Grundbegreber.
Hvad viser de foreløbige progressionsdata på tværs af landet? Michael Rosholm Aarhus universitet.
ADR (AUTOMATIC DELIVERY REWARDS ) (Nyt program - 1. september) LifePak ® (eksempel) – 72,40 PSV 401,60 DKK med 5 % rabat= 381,52 DKK (68,78 PSV) Fragt.
252 kg Punkt 1. Først beregnes betonbjælkens vægt.
Statistik 10A – Gentofte Ungdomsskole
Dagens program Kursusevaluering Information Spørgsmål om eksamen
Learnmark Horsens Patrik & Jakob HH1MB
v/ Professor Lars Ehlers, Aalborg Universitet
Statistik Lektion 17 Multipel Lineær Regression
Bolig selskabernes Landsforening– Almene lejeboliger - Maj/Juni Almene lejeboliger - Danmarkspanelet - Maj/Juni 2010.
F 45. Lad os se på et konkret eksempel… 45° 10 m 20 cm 8 m 5 m 2 m 3 m HOV!Der mangler jo noget… Øjenhøjden er 2m 20 cm = 10m 20 cm = 1000cm 20 : 1000.
Normalfordelingen Man siger at et talmateriale er normalfordelt, når der optræder mange observationer i midten af materialet og få i yderkanterne. Her.
Matematikseminar foråret 2009
Statistik Lektion 3 Simultan fordelte stokastiske variable
1 Effektiv forrentning Kjeld Tyllesen PEØ, CBS Erhvervsøkonomi / Managerial Economics Kjeld Tyllesen, PEØ, CBS.
Statistik.
Statistik og sandsynlighedsregning
Arbejdsmarkedsuddannelser – også for personer med læse-, skrive- og regnevanskeligheder Oplæg fra AMU-Fyn Konference d. 22/5 -07.
Statistik.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Statistik og sandsynlighedsregning
HUSKESPIL – den lille tabel
Statistik Matematik B.
Titel: Arial, fed, skriftstr. 20, mørkegrå. Tekst: Arial, normal, fed eller kursiv, skriftstr. 10, 12 og 14 til print – 16 og 18 til projektor – mørkegrå.
 2 3  3 =  83  43  53  63  73  93  10 4.
Start test 1 KLIK HER. Hvilken tast skal du bruge for at redigere en celle direkte? 2 F1 F2 F5 F7.
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Statistik – Lektion 2 Uafhængighed Stokastiske Variable
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistik Kristine og Søren.
Problemformuleringer med matematik
Grundlæggende teoretisk statistik
Globaliseringsredegørelsen 24.mar. 14 Figurer fra Danmark tiltrækker for få udenlandske investeringer i Sådan ligger landet
Matematik B 1.
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
1 Tråde 2 Plan Trådbegrebet Synkronisering Koordinering Eksempel: et flertrådet spil.
Grunde til at jeg elsker dig
Multipel Lineær Regression
DJF PeopleXS Workflows (uden forhandlingsdel) Stillingsfaser – Opslag Fremstilling/validering, godkendelse, annoncering – Bedømmelsesudvalg.
Ugrupperede observationer Middelværdi, varians og spredning
Bernoulli og binomial fordelingerne
Poissonfordelte observationer Deskriptiv analyse Jens Friis, AAU.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Statistik Lektion 14 Simpel Lineær Regression
Grundlæggende teoretisk statistik
Statistik Daniel og Vagn.
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Simpel Lineær Regression
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Globaliseringsredegørelse 21.mar. 11 Globaliseringsredegørelsen 2011 Grafer fra temakapitlet Eksporten som drivkraft for vækst og velstand.
Grundlæggende teoretisk statistik
Opgave i normalfordeling 2.g, HHX. Grundbegreber Middelværdi, μ (græsk: my) Standardafvigelse, σ(græsk: sigma) X ̴ N(μ,σ)
Præsentationens transcript:

Ugrupperede observationer Middelværdi, varians og spredning

Varians Nu er der jo ikke lige mange observationer i hvert interval, derfor må vi vægte disse forskelle: 12%*(8-10,59)2+15%*(9-10,59)2+21%*(10-10.59)2+20%*(11-10,59)2+18%*(12-10,59)2+14%*(13-10,59)2=2,46 Dette tal kaldes observationssættets varians: Var(X)=2,46 Hvad fortæller Var(X) ? Hvorfor tager vi kvadratet på forskellen mellem middelværdi og observation?

Spredning Vi tager nu kvadratroden af variansen: Og får spredningen, betegnet med det græske bogstav sigma Spredningen kaldes også standardafvigelsen

Forskellige observationssæt 5 3 1,50% 6 4 2,00% 3,50% 7 7,00% 8 10 5,00% 12,00% 9 30 15,00% 27,00% 42 21,00% 48,00% 11 40 20,00% 68,00% 12 36 18,00% 86,00% 13 20 10,00% 96,00% 14 3,00% 99,00% 15 2 1,00% 100,00%   200 1 Her har jeg lavet et mere spredt sæt, lad os se på forskelle i middelværdi, varians og spredning

Først stolpediagrammer Middelværdi: 10,59 Middelværdi:10,52 Beregn varians og spredning for andet observationssæt!

Varians og spredning Var(X)=1,5%*(5-10,52)2+…….. (resultat 3,6396) 1,50% 6 4 2,00% 7 3,50% 8 10 5,00% 9 30 15,00% 42 21,00% 11 40 20,00% 12 36 18,00% 13 20 10,00% 14 3,00% 15 2 1,00% Var(X)=1,5%*(5-10,52)2+…….. (resultat 3,6396) Sammenlignet med første observationssæt får vi altså en større varians og en større spredning som forventet!

Udregning af varians Summen af frekvenserne er 100%=1 3.Observationssæt x   f  9 50 25% 10 100 50% 11 Summen af frekvenserne er 100%=1 Middelværdien E(X)=μ=9*25%+10*50%+11*25% Var(X)= 25% * (9-μ)2 + 50% *(10-μ)2 + 25% * (11-μ)2 Hvis vi ganger parenteserne ud fås: 25%*(92+μ2-2*9*μ) + 50%*(102+μ2-2*10*μ) + 25%*(112+μ2-2*11*μ) = μ2 *(25%+50%+25%) -2μ*(9*25% + 10*50% + 11*25%)+ 25%*92+50%*102+25%*112 Altså er Var(X)=μ2-2μ* μ +25%*92+50%*102+25%*112 Sidste 3 led (grønne) er middelværdien af X2 derved får vi: Var(X)= - μ2 + E(X2) = E(X2) – E(X)2 og spredningen σ(X)=

Varians og spredning Var(X)= E(X2)-E(X)2 σ(X)=

I regneark: Antal (x) Frekvens (f) x*f x^2 x^2*f 8 0,12 0,96 64 7,68 9 0,15 1,35 81 12,15 10 0,21 2,1 100 21 11 0,2 2,2 121 24,2 12 0,18 2,16 144 25,92 13 0,14 1,82 169 23,66 E(X)=   10,59 E(X)^2 112,1481 E(X^2)= 114,61 Var(X)=E(X^2) - E(X)^2= 2,4619 σ(X)=  1,57

Grupperede observationer Hvis talmaterialet er grupperet: obs.interval Int. Midtp m Frekvens f m*f m^2 m^2*f ]10;12] 11 0,1 1,1 121 12,1 ]12;14] 13 0,175 2,275 169 29,575 ]14;16] 15 0,375 5,625 225 84,375 ]16;18] 17 0,2 3,4 289 57,8 ]18;20] 19 0,15 2,85 361 54,15 μ=E(X)=   15,25 E(X^2)= 238 Var(X)= E(X^2)-E(X)^2= 5,4375

Cov(X,Y)= E(X*Y)- E(X)*E(Y) Covarians Hvis vi ønsker at sammenligne to observationssæt X og Y, kan vi bestemme deres Covarians ved: Cov(X,Y)= E(X*Y)- E(X)*E(Y) Altså som middelværdien af produktet af observationerne minus produktet af de to middelværdier

Model v.hj.a. regression i regneark

Regression i regneark Marker de to observationssæt Vælg ”Diagram” Vælg XY-punkt Tegn grafen Højreklik på et af punkterne på grafen Vælg ”Tilføj tendenslinje” Klik på fanebladet ”Indstillinger”

Sæt hak i Vis ligning i diagram og i Vis R kvadreret

Bestemmelse af regressionslinje Vi kan ud fra to observationssæt også bestemme regressionslinjen y=ax+b ved hjælp af formler: Vi bestemmer a ved: Og derefter bestemme linjens ligning ved: Herved bestemmes b altså som E(Y)-a*E(X)

Korrelationskoefficienten Korrelationskoefficienten er et mål for hvor god sammenhæng der er mellem X og Y. Denne bestemmes ved: Regnearket beregner R2, som skal ligge tæt på 1, her skal r ligge tæt på -1 eller 1, for at vi vil finde en god sammenhæng.

Hvad kan regnearket beregne?