Om variation og varians

Slides:



Advertisements
Lignende præsentationer
Probabilistisk sårbarhedsanalyse
Advertisements

Anvendt Statistik Lektion 2
KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Statistik Lektion 3 Simultan fordelte stokastiske variable
Sammenligning af to grupper – kapitel 7
Statistik og sandsynlighedsregning
Grundlæggende teoretisk statistik
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Variansanalyse Modelkontrol
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Statistik II Lektion 5 Modelkontrol
Anvendt Statistik Lektion 2
1 Betydningen af præanalytiske forhold? DSKB Forårsmøde   Formiddag Kemiker, ph.d. Anne Schmedes Klinisk Biokemisk Afdeling ∙ Vejle & Give Sygehuse.
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Statistik II 5. Lektion Log-lineære modeller.
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Multipel Lineær Regression
Statistik Lektion 15 Mere Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik for geografer
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Inferens i den lineære regressionsmodel 1. oktober 2004.
Økonometri 1: F81 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri – lektion 8 Multipel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
KM2: F61 Kvantitative metoder 2 Den simple regressionsmodel 21. februar 2007.
Simpel Lineær Regression
Kvantitative metoder 2: Inferens i den lineære regressionsmodel1 Kvantitative metoder 2 Inferens i den lineære regressionsmodel 14. marts 2007.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 24. februar 2003.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
KM2: F201 Kvantitative metoder 2 Heteroskedasticitet 18. april 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Normalfordelingen og Stikprøvefordelinger
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Statistik II 4. Lektion Logistisk regression.
Økonometri – lektion 6 Multipel Lineær Regression
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Økonometri 1: F71 Økonometri 1 Inferens i den lineære regressionsmodel 29. september 2006.
Økonometri 1: F131 Økonometri 1 Heteroskedasticitet 30. oktober 2006.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Ellen Holm, Forskningscafé
Heteroskedasticitet 25. oktober 2005
Anvendt Statistik Lektion 8
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Om variation og varians Jørn Attermann Lektor, cand.scient. i matematik-statistik, ph.d. i biostatistik NANEA ved Institut for Folkesundhed, Aarhus Universitet DSKB årsmøde 23. marts 2006

Identifikation af varianskomponenter Varianskomponenter = kilder til usikkerhed Eksempel: Kalibrering (svarende til laboratorium) Analysedag Residual (det, der ikke kan forklares ved ovenstående komponenter) Varianskomponenterne er grunden til, at vi ikke måler den sande værdi. SAND VÆRDI MÅLT VÆRDI Varianskomponenter

En smule teori: Et histogram skitserer den statistiske fordeling af observerede data… Simulerer fra en normalfordeling: 10 observationer 100 observationer 1000 observationer 10000 observationer Tæthedsfunktion Med mange observationer bliver histogrammet næsten ”konstant”!

Tætheden beskriver den teoretiske statistiske fordeling… (Det ”uldne” ved kurven kan passende symbolisere, at tætheden er approksimativ… )

Eksempel med tre pæne* varianskomponenter Y I. (kalibrering) II. (analysedag) III. (residual) målt værdi sand værdi * ”Pæn” betyder her uafhængige og normalfordelte og med konstant spredning

Størrelsen af varianskomponenterne… Y I. II. III. total

Eksempel på del af et sæt data klar til analyse i en Linear Mixed Model Simulerede data med og sand værdi = 5.00.

Hvordan estimerer vi størrelsen af de enkelte varianskomponenter? Grundlaget for enhver form for estimation (selv et simpelt gennemsnit) er en statistisk model, som fortæller, hvordan data opfører sig, og hvilke parametre, som er nødvendige for at beskrive sandsynlighedsfordelingen af data. Hvis vi har pæne data (det vil sige approksimativt uafhængige og normalfordelte varianskomponenter), kan data beskrives ved en Linear Mixed Model. Din lokale statistiker kan estimere σ’erne ved hjælp af sådan en model. De fleste ikke-statistikere kan også lære at gøre det ved hjælp af god all-round statistisk software. Har vi ikke pæne data, kan man prøve transformationer (for eksempel naturlig logaritme) og standardiseringer, så man opnår pæne data. Her kan din statistiker hjælpe! Kan man ikke opnå pæne data, må man ty til mere komplicerede modeller som for eksempel Generalized Linear Mixed Models. Dette er en specialistopgave!

God statistisk all-round software Professionel, omfattende, gratis http://www.r-project.org Professionel, omfattende, let at bruge, god support, billig (USD 1075 for enkeltbruger evighedslicens) http://www.stata.com Professionel, meget omfattende med hensyn til Linear Mixed Models, dyr, svær at bruge http://www.sas.com

Denne præsentation kan downloades fra www.bisam.dk