Kvantitative metoder 2: F21 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 7. februar 2007.

Slides:



Advertisements
Lignende præsentationer
Den danske befolknings syn på handicappedes rettigheder
Advertisements

Dummyvariabler 13. oktober 2006
Program Informationer χ2-test (chi-i-anden) Projekt 3
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 5
Sammenligning af to grupper – kapitel 7
Statistik og sandsynlighedsregning
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Gentagne tværsnit og panel data II 9. maj 2007
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Økonometri 1 Gentagne Tværsnit og Paneldata II. Gentagne tværsnit og paneldata II 2 Gentagne tværsnit (W ): Opsamling.  Kombinerer tværsnit indsamlet.
Case.
Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I.
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Økonometri 1 Gentagne tværsnit og panel data I. 2 Gentagne tværsnit og paneldata: Oversigt Observationer over individuelle enheder og tid: Wooldridge.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 10. december 2004.
1 Borgerpanelet i Silkeborg Kommune.
Avancerede Paneldata Metoder I
Økonometri 1: Afslutningsforelæsning1 Økonometri 1 Afslutningsforelæsning 19. maj 2003.
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Økonometri 1 Gentagne tværsnit og panel data I 13. november 2006.
KM2: F221 Kvantitative metoder 2 Gentagne tværsnit og panel data I 7. maj 2007.
Økonometri 1 Gentagne Tværsnit og Paneldata II 20. november 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
KM2: F151 Kvantitative metoder 2 Funktionel form. Goodness-of-fit. Prediktioner og residualer 26. marts 2007.
Heteroskedasticitet 17. marts 2006
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri 1 Gentagne tværsnit og panel data I 5. april 2006.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 29. marts 2006.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Kvalitative variable 8. marts 2006.
KM2: F181 Kvantitative metoder 2 Heteroskedasticitet 11. april 2007.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 27. februar 2003.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Log lineære modeller for kontingenstabeller Kontingenstabeller Test for uafhængighed af inddelingskriterier Sammenligning med logistisk regression Odds.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Økonometri 1: F71 Økonometri 1 Inferens i den lineære regressionsmodel 29. september 2006.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Heteroskedasticitet 25. oktober 2005
Anvendt Statistik Lektion 6
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Kvantitative metoder 2: F21 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 7. februar 2007

Kvantitative metoder 2: F2 2 Program for i dag og næste gang: Beskrivende statistik som grundlag for en økonometrisk analyse Statistiske metoder til analyse af kvalitative data Test i multinomialfordelingen: Q-testet (BL ) To-dimensionale kontingenstabeller (BL.13.5)  2 x 2 tabeller  r x c tabeller  Test af uafhængighed og homogenitet

Kvantitative metoder 2: F2 3 Beskrivende statistik Formål: At analysere og dokumentere datasættets struktur Relevante spørgsmål:  Hvilke typer af ”individer” (personer, firmaer, lande,..)?  Hvilken perioder/hvilket land/region?  Hvad er de væsentligste karakteristika: Fx udelukkende kvinder: Uegnet til analyse af diskrimination Fx udelukkende OECD-lande: Uegnet til analyse af bistand Fx udelukkende små virksomheder: Uegnet til analyse af forskning og udvikling i erhvervslivet.  Fejl og mangler: Er der sket trunkering? Er der ”outliers” i data? Dokumenteres af en beskrivende analyse.

Kvantitative metoder 2: F2 4 Redskaber til beskrivende statistik (BL.7) Analytiske grafiske redskaber:  Krydsplots af kontinuerte variabler (Proc GPLOT)  Histogram (Proc UNIVARIATE) Analytiske tabeller:  Beregning af beskrivende statistik for kontinuerte og kvalitative variabler (Proc MEANS)  Krydstabulering af kategoriserede variabler (Proc FREQ) Eksempel: Datasæt til analyse af effekten af politiovervågning på økonomisk kriminalitet (biltyverier) (januar 2007-opgaven i Økonometri 1)

Kvantitative metoder 2: F2 5 Analyse af kvalitative data: Fordelinger af kategoriserede variabler Ofte indeholder datasættet en eller flere kategoriserede variabler: Hver enkelt observation falder i én af i alt k gensidigt udelukkende kategorierer (en klassedeling). Kategorierne er ikke (nødvendigvis) ordnede. Må nødvendigvis behandles som en kvalitativ variabel Eksempler i dag:  Ex: Kønsproportioner  Ex: Valg nu?  Ex: Kønsproportioner i store (!) familier Har det statistiske grundlag for at analysere og teste hypoteser på fordelingen over kategorier: Multinomialfordelingen (BL.4.8).

Kvantitative metoder 2: F2 6 En variabel med to udfald: BL.4.2 Binomial fordelt, KategoriSandsynlighedFrekvens 1 2 Sum

Kvantitative metoder 2: F2 7 En variabel med to udfald

Kvantitative metoder 2: F2 8 En variabel med to udfald

Kvantitative metoder 2: F2 9 En variabel med to udfald: Eksempel: Kønsproportioner (BL.ex.13.1a) Ser på nulhypotesen: H 0 : overfor H 1 : KategoriSandsyn lighed under H 0 Forventet frekvens Observeret frekvens Sum1145

Kvantitative metoder 2: F2 10 Eksempler på økonomiske modeller med børnefødsler og kønsproportioner Kvinders arbejdsudbud  Analyseret af mange, bl.a. Browning.  US: Fødsler påvirker kvinders arbejdsudbud senere i karrieren, størrelsen af effekten er omstridt.  Heller ikke afklaret, hvilken retning effekten (primært) går: Er det (forventet) fremtidig løn og beskæftigelse, der påvirker den aktuelle fertilitet? Ledelsestransitioner i familieejede virksomheder:  Analyseret af Bennedsen mfl. på et stort antal danske firmaer  Videreførelse af ledelsesposter indenfor familien sker oftere i firmaer, hvor ejerens/lederens førstefødte barn er en dreng.  Kønnet på den førstefødte er tilfældigt og uden relation til økonomiske variabler og valg: Nyttig information for den økonometriske analyse!

Kvantitative metoder 2: F2 11 En variabel med k udfald: Multinomialfordelingen

Kvantitative metoder 2: F2 12 En variabel med k udfald Ser på nulhypotesen: KategoriSandsyn- lighed under H 0 Forventet Frekvens Obser- veret frekvens 1 2 ………… k-1 k Sum 1 n n

Kvantitative metoder 2: F2 13 En variabel med k udfald: Opdatering af eksempel i AFJM.7: Megafonmåling 26/1-07 Parti/måling 21-25/ Frekvens Valget 2005 Soc. dem. 28,4% ,8% Rad. V. 9,2% 80 9,2% Kons. 10,5% 9010,3% CD 0,2% 21,0% SF 8,6% 756,0% Kristendem. 1,0% 91,7% DF 12,6% ,3% Venstre 25,8% ,0% EL 3,4% 29 3,4% Andre 0,4% 3 0,3% I alt100%867100%

Kvantitative metoder 2: F2 14 En variabel med k udfald: Megafon meningsmåling Er der sket signifikante forskydninger siden valget i 2005? H 0 : Ingen forskydning vs. H 1 : Forskydning af generel art VALG.SAS KategoriSandsyn- lighed under H 0 Forventet Frekvens Obser- veret frekvens Soc.dem *0.258= Rad.V *0.092=8080 ………… Enhedsl *0.034=2929 Andre *0.003=33 Sum

Kvantitative metoder 2: F2 15 En variabel med k udfald: r ukendte parametre i multinomialfordelingen

Kvantitative metoder 2: F2 16 En variabel med k udfald: r ukendte parametre i multinomialfordelingen

Kvantitative metoder 2: F2 17 Hvad bliver det næste? Næste forelæsning: Mandag den 12. februar: Mere om analyse af kvalitative data. Uafhængigheds- og homogenitetstest. BL.13.5, AFJM.7. Øvelserne: Begynder i næste uge. Ugeseddel 1: På hjemmesiden fra fredag. NB: Hold 1: Øvelser flyttet til onsdag kl i Større Øvelsessal