Statistik niveau E og F Lars A. Clark.

Slides:



Advertisements
Lignende præsentationer
Kombinatorik, sandsynlighed og statistik
Advertisements

Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Løntermometer° Vedligehold dit lønsystem. Løntermometeret Mange virksomheder oplever, at et ellers godt lønsystem efter nogle år ikke længere har den.
Statistik 10A – Gentofte Ungdomsskole
Kombinatorik, sandsynlighed og statistik
Klik på Aktivér redigering i meddelelseslinjen,
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik.
Gennemsnit, median, typetal, hyppighed, frekvens, pindediagram
Statistik og sandsynlighedsregning
Statistik 9. Klasse.
Statistik.
Mdl. eksamen Emilie & Emil.
Statistik og sandsynlighedsregning
Statistik og kvantitativ metode Politik & Administration og Samfundsfag 3. semester 2007 Lektion 5, tirsdag den 23. oktober Punkt- og intervalestimering.
Statistik, kombinatorik & Sandsynlighed
Statistik Matematik B.
STATISTIK Nat og Rebecca .
Statistik Nikka og Hannah.
Statistik Kristine og Søren.
Statistik for geografer Lektion 4. Tidsrække Analyse Proces som varierer over tid Observationer til bestemte tidspunkter Eksempler Proces som varierer.
Kombinatorik, sandsynlighed og statistik
Emneopgave: statistik
Statistik Daniel og Vagn.
Kombinatorik, sandsynlighed og statistik
Statistik, kombinatorik & Sandsynlighed
Lektion 2. Definitioner En stikprøve (sample) Vi ønsker at generalisere ud fra en stikprøve Stikprøvefejls (samplings-error) Tilfældige fejl Systematikse.
Lektion 3. Noget teori og nogle begreber En stikprøve eller et observationssæt betegnes x 1,x 2,…………x n En a- fraktil er det mindste tal x, hvor den kumuleret.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Statistik for geografer
Videregående pc-vejledning
Undervisningsdag 2015 Undervisningsdag den 25. august 2015.
Indkomstfordeling og ulighed Konference om samspil mellem matematik og samfundsfag 17.September 2009 Per Henriksen.
Grundlæggende Statistik af Kenneth Hansen Kapitel 7.
Efterskoleforeningen Forhandling af lokal løn Christian Petersen Tlf: Kursus for nye forstandere.
Efterskoleforeningen
Statistik.
Anvendt Statistik af Kenneth Hansen
Undervisningsdag den 25. august 2015
Areal bestemt ved integration
Grupperede observationssæt
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Design Thinking Consultant Agnete Design Thinking Consultant
Årsmøde
Teoretiske kontinuerte fordelinger
Forenkling og systematisering af data
Årsmøde
Præsentationens transcript:

Statistik niveau E og F Lars A. Clark

Grupperet / ikke grupperet tal Oversigten Typetal Kumuleret frekvens Gennemsnit Grupperet / ikke grupperet tal Median Kvartil Største/mindste Variation Hyppighed Frekvens

Typetallet er det tal, som er ”typisk” for observationssættet. Det vil sige den observation, som forekommer flest gange i observationssættet. To er typetal da det forekommer flest gange (3 gange) 2 4 7 10 2 4 7 10 I Excel bruges funktionen =HYPPIGST.ENKELT(område), til at finde typetallet

Opgave Find typetal 2 7 8 6 5 4 9 Find typetal 2 7 8 6 5 4 9 3 7 9 Find typetal 4 6 8 5 2 3 7 9

Gennemsnittet Gennemsnittet eller middeltallet er det tal, som man får, hvis man lægger alle observationer sammen og dividerer dette tal med antallet af observationer. Summe af tallene er 48 Der er 10 tal Gennemsnittet =48/10 = 4,8 4 7 10 2 I Excel bruges funktionen =middel(område), til at finde gennemsnittet

Hvilket gennemsnit er højest Opgave Find gennemsnit 4 6 8 5 2 3 1 7 9 Resultatet = 5 Hvilket gennemsnit er højest mænd 6 5 8 4 kvinder 7 Mænd= 5,7 Kvinder = 6,2

Medianen hedder også 2 kvartil eller 0,50-kvartil. Den observation, som står i midten, hvis man stiller observationerne op i rækkefølge med de mindste tal først. Hvis der er et lige antal observationer, så der ikke er et tal i midten, tager du normalt tallet til venstre for midten. Median værdien er 7 i nedenstående talrække 2 4 7 10 12 Median værdien er 5,5 i nedenstående talrække De to midterste tal er 4 og 7 Median værdi = ( 4 + 7) / 2 = 5,5 2 4 7 10 I Excel bruges funktionen =median(område), til at finde medianværdien Medianen hedder også 2 kvartil eller 0,50-kvartil. Det er fordi, det er her, de første 50% af observationerne ligger indenfor, hvis observationerne sættes i rækkefølge med de mindste først.

Find Median værdien og gennemsnittet Opgave Find Median værdien Timelønnen for Tømrer 150 160 170 180 190 200 210 Timelønnen for Tømrer 150 160 170 180 190 200 210 Timelønnen for Tømrer 150 160 170 180 190 200 (170 + 180)/2 = 175 Find Median værdien og gennemsnittet Gennemsnittet er 180 i alle tre eksempler Timelønnen for Tømrer 150 160 170 180 190 200 210 Timelønnen for Tømrer 130 160 170 190 200 210 Timelønnen for Tømrer 155 160 165 175 195 200 210

Kvartilsæt Indenfor 0,25-kvartilen, 1. kvartil eller nedre kvartil ligger 25% af de første observationer, hvis observationerne sættes i rækkefølge med de mindste først. Indenfor 0,75-kvartilen, 3. kvartil eller øvre kvartil ligger 75% af observationerne, hvis observationerne sættes i rækkefølge med de mindste først. Tal række: 179 188 192 198 201 205 207 210 For at finde 1 kvartil, skal du finde de første 25% af tallene – det er de to første tal – du beregner så 1 kvartil ved at finde et tal i talrækken der er højere, her er det 192 Det højeste tal i 1 kvartil er 188 og et højere tal er 192 Du beregner 1. kvartil således (188 + 192 )/2 = 190 I Excel bruges funktionen =fraktil(område;n), til at finde fraktilværdien. n angiver hvilken fraktil du vil beregne. N >=0 og <=4

For at finde 0 kvartil, skal du finde det mindste tal = 179 Tal række: 179 188 192 198 201 205 207 210 1 kvartil: (188 + 192) / 2= 190 2 kvartil: (198 + 201) / 2= 199,5 = medianværdien 3 kvartil: (205 + 207) / 2= 206 For at finde 4 kvartil, skal du finde det største tal = 210 I Excel bruges funktionen =fraktil(område;n), til at finde fraktilværdien. n angiver hvilken fraktil du vil beregne. Excel beregner fraktilerne lidt anderledes, men du får rimeligt samme resultat 0 fraktil i Excel =fraktil(område;0) svarer til =min(område) 1 Fraktil I Excel =fraktil(område;1) 2 Fraktil I Excel =fraktil(område;2) svarer til =median(område) 3 Fraktil I Excel =fraktil(område;3) 4 Fraktil I Excel =fraktil(område;4)svarer til =maks(område)

DU skal finde følgende kvartiler 0, 1, 2, 3 , 4, Opgave DU skal finde følgende kvartiler 0, 1, 2, 3 , 4, beløb kvartil 150 165 1 180 2 195 3 210 4 Timelønnen for Tømrer 150 160 170 180 190 200 210 Hvis din timeløn er 182, hvad fortæller kvartilerne os om den?

Den største observation i observationssættet. Størsteværdi Den største observation i observationssættet. NB. Det er ikke det største antal gange en observation forekommer! Mindsteværdi Den mindste observation i observationssættet. NB. Det er ikke det mindste antal gange en observation forekommer! Talrække: 179 188 192 198 201 205 207 210 Største værdi er 210 Mindste værdi er 179 I Excel bruges funktionen =min(område) til at finde mindste værdi og =maks(område) for at finde den største værdi.

Variationsbredden Variationsbredden er forskellen på den største og den mindste observation i sættet. Variationsbredden finder man ved at trække størsteværdien og mindsteværdien fra hinanden. Variationsbredden er 210 -179 = 31 I Excel beregnes variationsbredden som =(q2-j2) =31 ell. =210-179

Hvad er variationsbredden Opgave Hvad er variationsbredden Timelønnen for Tømrer 150 160 170 180 190 200 210 210-150 =60

Normalt angiver man hyppigheden med ”h(x)” tal Hyppighed -3 1 Hyppighed - h(x) Hyppigheden angiver, hvor ofte (hyppigt) de forskellige observationer forekommer. Det er altså antallet af gange, en observation forekommer. Normalt angiver man hyppigheden med ”h(x)” 2 4 7 10 12 -3 tal Hyppighed -3 1 2 5 4 7 3 10 12 sum 18 Som det fremgår er summen af hyppighed tallene = antal tal I Excel bruges funktionen =tæl.hvis(område;tal), når man skal finde antallet af et bestemt tal fx =tæl.hvis(område;2) = 5

Summeret hyppighed - H(x) Den summede hyppighed er hyppighederne lagt sammen med de foregående hyppigheder. Den summerede hyppighed skrives ”H(x)” 2 4 7 10 12 -3 summeret hyppighed tal Hyppighed -3 1 2 5 7 4 11 3 14 10 17 12 18 sum Som det fremgår er den summerede hyppighed tallene = 18 i sidste tal I Excel bruges funktionen =frekvens(område;tal)

Det vil sige hyppighed divideret med antallet af observationer. Frekvens - f(x) Den hyppighed observationen kommer med i forhold til det samlede antal observationer. Det vil sige hyppighed divideret med antallet af observationer. Dette vil give et resultat i form af en brøk eller decimaltal. Vil man have resultatet i procent, skal man gange med 100. Frekvens kan enten være i procent, brøk eller decimaltal. Det bestemmer du selv! Det vil sige, at 10%,  1/10 eller 0,10 er det samme resultat på forskellige måde. Dog vil man oftest angive frekvenser i procent. 2 4 7 10 12 -3 tal Hyppighed -3 1 2 5 4 7 3 10 12 sum 18 Vi tager udgangspunkt i hyppigheden

tal Hyppighed Frekvens -3 1 5,6 2 5 27,8 4 22,2 7 3 16,7 10 12 sum 18 2 5 27,8 4 22,2 7 3 16,7 10 12 sum 18 100 Frekvensen beregner vi ved at tage hyppigheden af et tal og gange det med 100 og dividere med antal tal Fx 5*100/18 = 27,8 I Excel beregnes tallet fx =5*100/18

Summeret frekvens - F(x) Er ligesom ved summeret hyppighed, men her er det bare frekvenserne, som skal lægges sammen. summeret frekvens tal Hyppighed Frekvens -3 1 5,6 11,1 2 5 27,8 38,9 4 22,2 61,1 7 3 16,7 77,8 10 94,4 12 100,0 sum 18 100

Opgave Hvad er frekvensen På en sæson er der 306 kampe i alt, så N = 306. Hyppigheden af mål pr. kamp ser således ud (fiktiv): 0 mål: 21 1 mål: 30 2 mål: 56 3 mål: 87 4 mål: 45 5 mål: 39 6 mål: 17 7 mål: 8 8 mål: 2 9 mål: 1 Typetal for mål er 3

Karakter 2 4 7 10 12 -3 Karakter Hyppighed -3 1 3 2 9 4 13 7 11 10 12 Grupperede data og ikke grupperede data Karakter 2 4 7 10 12 -3 Disse karakterer er grupperede indenfor bestemte intervaller nemlig 7 trins skalaen Karakter Hyppighed -3 1 3 2 9 4 13 7 11 10 12 sum 50

Grupperede data og ikke grupperede data timer TV pr uge 4 5 25 8 9 44 30 6 7 42 10 16 24 29 15 32 11 22 18 17 14 12 40 33 35 38 37 19 46 Disse karakterer er ikke grupperede indenfor bestemte intervaller, vi kan risikere at alle forekommer med hyppigheden 1 – Vi bør derfor gruppere tallene Interval Hyppighed 5 6 10 9 15 8 20 25 30 4 35 40 45 3