Indkomstfordeling og ulighed Konference om samspil mellem matematik og samfundsfag 17.September 2009 Per Henriksen.

Slides:



Advertisements
Lignende præsentationer
Kombinatorik, sandsynlighed og statistik
Advertisements

Kombinatorik, sandsynlighed og statistik
Mdl. eksamen Emilie & Emil.
Kombinatorik, sandsynlighed og statistik
Statistik for geografer
Kombinatorik, sandsynlighed og statistik
Lektion 3. Noget teori og nogle begreber En stikprøve eller et observationssæt betegnes x 1,x 2,…………x n En a- fraktil er det mindste tal x, hvor den kumuleret.
Helhedsorienteret indsats Møde i økonomiudvalget 8. februar 2016.
GoMINIsite – og få en ny og bedre hjemmeside på minutter 0.
Anvendt Statistik af Kenneth Hansen Kapitel 7 KeHaTools.
P ROCEDURE K ONDITEST I C OLUMBUS L ABORATORIUM. Tjek kommunikation Kald Astronauterne i Columbus op via skype Tjek at astronauterne kan høre dig.
Lineære funktioner og udviklingsforløb. Tillægsspørgsmål  Tillægsspørgsmål 1: En særlig linje er tangenten. Redegør for hvordan man bestemmer tangentligningen.
Spieser på 16 øre Katalog version 1. Indhold Hvad fandt jeg ud af sidst (2011) Er der ændret på denne opfattelse Hvilke nye muligheder er der opstået.
Frederikshavn, september,  Lidt om ideen med læringsmålstyret undervisning  FFM og matematiske kompetencer  FFM, læringsmålsstyring og.
Forældres opfattelse af Den Danske Folkeskole
Persondata – kortlægning af skolens behandling
Hvad lærer eleverne i 1g på Gefion gymnasium?
Social Mobilitet Er der et problem?.
Når hørenedsættelse begrænser menneskers deltagelse i samfundet
Algoritmer og Datastrukturer 1 Hashing [CLRS, kapitel ]
Sammen vil vi lære En uddannelse handler om at blive klogere og dygtige, så I bliver parate til jeres drømmejob. Forestil jer, at vores klasse er verdens.
Anvendt Statistik af Kenneth Hansen
E-learning om ballonprojektet
Trivselsundersøgelse og ledelsesevaluering
Gennemgang af Pensionsberegningsløsning i Winformatik 3. december 2015
Målet med at give nogle elever en transitmentor
Lineær & eksponentiel funktion
Benchmark for ”almene” efterskoler for 2016
Oversigt over metoder til fastsættelse af kvælstofbehov på markniveau
Titel på naturvidenskabsprojekt
Experians statistik over nyetablerede selskaber i 4. kvartal 2016
Bedre Balance Fokus i offentligheden på skæv fordeling af velfærd!
9 gode råd til et styrket samarbejde med pårørende på hjerneskadeområdet
Evaluering af unge-kampagnen ”Tænk hvis alle arbejdede sort…” mod sort arbejde TNS Gallup februar 2006.
Vildledningssager - Hjemmelavet
Statistik Ugrupperet.
Grupperede observationssæt
Udviklingen i boligsituationen i København og nybyggeriets virkninger
Udvalgte resultater Januar 2016
Niveau 2: Hypotesetestning
Tjenestemandspension
RAR Sydjyllands indsatsområder Status på mangel og fordeling af arbejdskraftreserven Koordinationsforum Sydjylland – august 2018.
Styrk foreningen Fællesskab og samarbejde
RAR Fyns indsatsområder Status på mangel og fordeling af arbejdskraftreserven Koordinationsforum Fyn – august 2018.
Lf. nr. 123 af 23/ om ændring af (…) virksomhedsskatteloven (…) - med seneste ændringer Anders Lützhøft.
Medarbejderaktier TDC
Anvendt Statistik Lektion 4
Individuel supplerende elevstøtte
Stiliseret cost-benefit som ”evalueringsmetode”
Knallertens udstyr.
Statistik niveau E og F Lars A. Clark.
International økonomi for matematikere
Befolkning.
Søgårdsskolens økonomi 2017 og 2018
Funktioner Graf og forskrift Husk, at diasshowet skal afspilles!
Krav til informationsformidling
Anvendt Statistik Lektion 3
Titel på videnskabeligt projekt
Videnskabeligt projekt
Videnskabeligt projekt
Skrivedag 3: Fra skriftlig opgave til mundtligt oplæg
Årsmøde
Præsentationens transcript:

Indkomstfordeling og ulighed Konference om samspil mellem matematik og samfundsfag 17.September 2009 Per Henriksen

Oversigt Forskellige fordelingsmål –Decil Anvendelse Lorenz-diagram og Gini-koefficient Anvendelse Indkomstfordelingspåvirkende faktorer –Skat –overførsler

Nogle fordelingsmål Gennemsnit Median Kvintil, decil m.v.

Redskaber til at beskrive fordelinger Jeg skal i gennemgangen bruge følgende simple eksempel med 20 indkomster. Metoden vil blive vist løbende i Excel. Det første man kan gøre er at sortere data, så indkomsterne ordnes i stigende rækkefølge.

Sortér data i stigende rækkefølge Man sorterer tallene ved at markere alle tallene og derefter vælge data og sortér stigende. Resultatet bliver da som til højre. Man har nu et første overblik over data, fx minimum og maksimum. Minimum og maksimum kan også findes ved funktionerne: min(dataområde) maks(dataområde)

Gennemsnit og det betydning Ud fra data er det let at beregne (det aritmetiske) gennemsnit. I Excel bruges funktionen: middelv(dataområde) I eksemplet bliver gennemsnittet kr. Imidlertid tjener 60 pct. af befolkningen mindre end gennemsnittet og kun 40 pct. mere end gennemsnittet. Så gennemsnittet er altså ikke en helt almindelig indkomst.

Median Som supplement til gennemsnit kan beregnes medianen. Medianen er den indkomst, der deler befolkningen i to lige store grupper: Halvdelen har indkomster, der er lavere end medianen og den anden halvdel har indkomster større end medianen. Da der er 20 personer i fordelingen, så findes medianen som den indkomst, der ligger mellem person nr. 10 og 11. I eksemplet er medianen kr. hvilket er væsentlig mindre end gennemsnittet på

Median/fraktiler I Excel findes medianen ved funktionen fraktil(dataområde;0,50) Det fremgår af formlen, at medianen blot er en del af en større gruppe spredningsmål, der kalder: Fraktiler. Medianen er 50 pct. fraktilen

Nedre og øvre kvartil 25 pct. fraktilen kaldes også nedre kvartil og viser i dette eksempel den indkomst, der afskærer den nederste fjerdedel af indkomsterne. I Excel: fraktil(dataområde;0,25) I eksemplet har ¼ af befolkningen en indkomst på under kr. 75 pct. fraktilen kaldes også øvre kvartil og viser den indkomst, der afskærer den nederste trefjerdedel af indkomsten (eller omvendt den øverste fjerdedel). I Excel: fraktil(dataområde;0,75) I eksemplet har ¾ af befolkningen en indkomst på under kr.

En opsummering Vi har nu følgende oplysninger om indkomstfordelingen: Ved at beregne afstanden fra medianen til hhv. nedre og øvre kvartil får vi et indtryk af spredning og skævhed i fordelingen. Denne fordeling er højreskæv: Der er meget længere fra medianen til øvre kvartil end til nedre kvartil og gennemsnittet er større end medianen

Og hvad kan det bruges til? Fattigdomsgrænse -Absolut: USA og UNDP (1 USD/dag) -Relativ: 50 eller 60 % af medianindkomsten? -Afsavn: Red Barnet

Absolut fattigdom USA

Danmark

Man kan også Gennemføre en undersøgelse af -Indkomstfordelingen i klassen blandt eleverne -Indkomstfordelingen blandt forældrene  Datasæt at regne på…

Indkomster i Danmark

Andre fraktiler 10 pct. og 90 pct. fraktilerne kaldes hhv. nedre og øvre decil. Man kan beregne alle de fraktiler man har lyst til.

Boxplot

Boxplot: Eksempel med to fordelinger Det er umiddelbart let at se, at indkomstuligheden er størst i land B

Grupperede data En anden måde at illustrere indkomstfordelingen på er at gruppere data i indkomstintervaller og beregne, hvor mange pct. der er i hvert interval:

Grupperede data Det ses tydeligt, at fordelingen er højreskæv

Grupperede data Hvis vi kun havde de grupperede data, kunne vi så have beregnet gennemsnit, median mv.? Dette er et interessant spørgsmål, da vi jo som regel ikke har adgang til persondata, men kun aggregeret statistik. Man kan lave disse beregninger, men resultaterne bliver ikke helt præcise.

Grupperede data, gennemsnit Vi antager, at gennemsnitsindkomsten i hvert intervaller ligger i midten. Gennemsnittet findes da som et vejet gennemsnit: *0, *0, *0, *0, *0, *0,05 = kr., hvilket jo er noget lavere end Men indkomsten er jo heller ikke lige fordelt indenfor intervallerne.

Grupperede data, fraktiler Fraktilerne kan også beregnes tilnærmet. Fx 25 pct. fraktilen: Den ligger i intervallet kr. Intervallet begynder ved 20 pct. fraktilen og slutter ved 50 pct. fraktilen, dvs. det er 30 ”bredt”. Vi skal (25-20)/30 (dvs. 1/6) ind i intervallet, der er på kr. 25 pct. fraktilen bliver: *(25-20)/30 = kr. (lidt mindre end det rigtige: ) Metoden kaldes lineær interpolation. Der rammes ikke helt rigtigt og også her er forklaringen, at indkomsterne ikke er jævnt fordelt i intervallet.

Lorenz-kurven Lorenz-kurven er en tredje måde at illustrere indkomstfordelingen Kilde: ST s. 75

Hvad gør man i Excel? I søjle D er beregnet den kumulerede indkomst: D2: =C2 D3: =D2+C3 D4-D21: kopi af D3 I søjle E og F er hhv. søjle B og D omregnet til pct. af hhv. samlet antal personer og samlet indkomst. E2: =B2/B$21 F2: =D2/D$21 E2 og F2 kopieres til rækkerne 3 til 21. Række 21 giver naturligvis 100 pct. Søjle E og F giver Lorenz-kurven

Lorenz-kurven På Lorenz-kurven kan man fx aflæse, at de 20 pct. af befolkningen, der har de laveste indkomster kun tjener godt 10 pct. af de samlede indkomster, og at de 10 pct. af befolkningen, der tjener mest, har ca. 18 pct. af den samlede indkomst (de 90 pct. ”fattigste” har ca. 82 pct. af indkomsten)

Mål for ulighed Der anvendes typisk to mål for ulighed: Den maksimale udjævningsgrad (eller udjævningsprocent) Gini-koefficienten

Den maksimale udjævningsgrad = Robin Hood index Den maksimale udjævningsgrad måler, hvor stor en del af den samlede indkomst, der skal flyttes fra personer med indkomst over gennemsnittet til personer med indkomst under gennemsnittet for at få en helt lige indkomstfordeling Den maksimale udjævningsgrad ligger mellem 0 pct. (den helt lige indkomstfordeling, hvor alle har samme indkomst) og op mod 100 pct. (hvor én person har hele indkomsten) I Lorenz-diagrammet kan den maksimale udjævningsgrad aflæses som den maksimale afstand mellem Lorenz-kurven og 45-graderslinien. Den er, hvor hældningen på Lorenz- kurven er én.

Den maksimale udjævningsgrad

Beregning af den maksimale udjævningsgrad Når man har alle data på enkeltpersoner i et regneark, er det let at beregne den maksimale udjævningsgrad. Formlen er I regnearket behøver vi endda ikke at regne numerisk.

Den maksimale udjævningsgrad i Excel I søjle G beregnes forskellen mellem den faktiske indkomst og den gennemsnitlige indkomst: G2: =C2-MIDDELV($C$2:$C$21) G3-G21: Kopi af G2 Fra række 14 bliver tallene positive (Det er de personer, der skal betale). Tallene fra G14 til G21 flyttes til søjle H. Tallene i søjle G og H summeres i række 22. (De skal naturligvis blive ens, da det, der skal afleveres svarer til det, der modtages). Dette beløb divideres med den samlede indkomst: H23: =H22/C22*100 Dette er den maksimale udjævningsgrad

Beregning af ST’s maksimale udjævningsgrad I Tiårsoversigten er indkomsterne i tabellen side 75 opdelt i kvintiler (5’te dele). I en helt lige indkomstfordeling skulle hver kvintil have 20 pct. af indkomsten. Vi kan således let beregne, hvor meget hver gruppe mangler (eller har for meget). Eksemplet er fra 2003: Tabel 2 Beregning af den maksimale udjævningsgrad (ST s. 75) På nær en lille afrundingsfejl er den indkomst der skal afleveres lig den indkomst, der skal modtages. Den maksimale udjævningsgrad er således 25,8 i 2003, hvilket også kan aflæses på side 75 i ST. Pct.Andel af samlet indkomst ”for lidt indkomst””for meget indkomst” 1. Kvintil 5,914,1. 2. Kvintil 11,78,3. 3. Kvintil 16,63,4. 4. Kvintil 25,0.5,0 5. Kvintil 40,9.20,9 I alt 100,025,825,9

Gini-koefficienten Gini-koefficienten er forholdet mellem arealet mellem Lorenz-kurven og 45-graderslinien (cigaren) og hele arealet under 45- graderslinien Ved den helt lige indkomstfordeling er Gini- koefficienten 0 (der er ingen cigar) Hvis én person har hele indkomsten går Gini- koefficienten mod 1

Gini-koefficienten Man kan regne arealerne ud, men det er lidt besværligt (man kan finde tendenslinje (polynomium)  stamfunktion) Når data er ordnet stigende, er det lettere at bruge formlen: Hvor x i er de enkelte observationer, n er antallet af observationer og i er personens ”nummer” i rækkefølgen. Nævneren bliver da blot den samlede indkomst gange antal personer Tælleren findes let i Excel:

Gini-koefficienten i Excel I kolonne I beregnes tælleren i Gini-koefficienten: (2i-n-1)*x i I2: =(2*B2-20-1)*C2 I3 til I21: Kopi af I2 I række 22 findes summen af I kolonnen, og dermed tælleren i formlen. I I23 beregnes så Gini-koefficienten: I23: =I22/(C22*20)

Beregning af ST’s Gini-koefficient Pct.Andel af samlet indkomst (Her x i) (2i-n-1)*x i 1. Kvintil 5,9-23,6 2. Kvintil 11,7-23,4 3. Kvintil 16,60,0 4. Kvintil 25,050,0 5. Kvintil 40,9163,6 I alt 100,0166,6 Hvis vi fortolker tabellen som 5 personer, der tilsammen tjener 100, så kan vi umiddelbart bruge formlen, jf. sidste søjle. 166,6 skal da divideres med 5*100 og Gini-koefficienten bliver da 0,33. (Hvilket giver lidt afrundingsfejl ift. ST’s Gini-koefficient på 0,35, der formentlig er beregnet på væsentligt mere detaljeret niveau). Tabel 2 Beregning af Gini-koefficient (ST s. 75)

Lidt mere om maksimal udjævningsgrad og Gini-koefficient Vi siger normalt, at den maksimale udjævningsgrad ligger mellem 0 og 100 pct. og at Gini-koefficienten ligger mellem 0 og 1. Hvis nogen af personerne har negative indkomster, kan man dog i særlige tilfælde komme uden for dette interval

En Lorenz-kurve for formuefordelingen Formuefordelingen er meget skæv! De to øverste decil-grupper har tilsammen mere end den samlede nettoformue! Den maksimale udjævningsgrad er 85 pct. og Gini-koefficienten er 1,148 (dvs. > 1)

Eksempler på praktiske problemer Hvad er det for indkomster? –før eller efter skat –incl. eller ekskl. kapitalgevinster? –aktuelle indkomster eller livsindkomster Hvad er det for ”personer” –Personer eller familier –Familier korrigeret for ”stordriftfordele” jf. Finansministeriets Fordeling og incitamenter 2004

I praksis Opgave fra Støvring G.Støvring G Med regneark I og IIregneark I Opgave fra Odder (var med i materiale)Odder Skattemodel