”…most current practices in quantitative data analysis in sociology do a very poor job of integrating theory and research. There has been an enormous progress.

Slides:



Advertisements
Lignende præsentationer
Kombinatorik, sandsynlighed og statistik
Advertisements

Dagens program Resumé - Normalfordelingen χ2-test (chi-i-anden)
Kvantitative metoder 2 Dummyvariabler 28. marts 2007 KM2: F16.
Hypotese test – kapitel 6 (Signifikans test)
Dummyvariabler 13. oktober 2006
Dagens program Kursusevaluering Information Spørgsmål om eksamen
At skabe den livsnære samtale David Viftrup. Kristne venner Relation til præst Kristne aktiviteterBibelenÆgtefælle BørnForældre Resarch by John Finney,
Sammenligning af to grupper – kapitel 7
We choose to go to the moon in this decade and do the other things... Not because they are easy, but because they are hard...
Anvendt Statistik Lektion 6
Deskriptiv analyse af enkelt variable
Psykologi, Human Factors og HCI
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation 26. november 2004.
Case.
Statistik Lektion 5 Log-lineære modeller.
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Dagens program Test of Independence (chi-i-anden) Videre med projekt 3
Økonometri 1 Gentagne tværsnit og panel data I. 2 Gentagne tværsnit og paneldata: Oversigt Observationer over individuelle enheder og tid: Wooldridge.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.
Simpel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Statistik for geografer
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Datamanipulation, rekodning etc. Christian Albrekt Larsen Centre for Comparative Welfare Studies (
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Kvalitative variable 8. marts 2006.
Lektion 2. Definitioner En stikprøve (sample) Vi ønsker at generalisere ud fra en stikprøve Stikprøvefejls (samplings-error) Tilfældige fejl Systematikse.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Økonometri 1: F141 Økonometri 1 Specifikation og dataproblemer 6. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Økonometri 1: Instrumentvariabelestimation1 Økonometri 1 Instrumentvariabelestimation I 2. December 2005.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Romerbrevet v. Rolf W. Jørgensen. 7 følger af retfærdiggørelsen jf. Rom 5,1-11 1) Fred med Gud v.1 2) Adgang til Gud v.2a 3) Håb om herlighed v.2b 4)
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Samarbejde mellem matematik og samfundsfag. Disposition Indledning Hvorfor skal vi bruge 2 i samfundsfag? Hvordan kan matematikken bruges? Eksempel. Oplæg.
Virker det? Fortællinger om maveorm, myggenet og andre samfundsvidenskabelige forsøg med mennesker i Afrika og Asien Henrik Hansen, Professor Fødevareøkonomisk.
Jeopardy Del 3: International økonomi. FrihandelProtektionismeØkonomisk integration Globaliseringens vindere Globaliseringens tabere
Ellen Holm, Forskningscafé
Den multiple regressionsmodel 21. september 2005
Kapitel 5: Tabeller og sammenhænge
Videnskabeligt projekt
Program – dag 2 (11. april 2011) Dag 2:
Anvendt Statistik Lektion 6
Niveau 3: Regressionsanalyse: Tværsnitsundersøgelser
Forenkling og systematisering af data
Præsentationens transcript:

”…most current practices in quantitative data analysis in sociology do a very poor job of integrating theory and research. There has been an enormous progress in what we can do with data … Nevertheless, quantitative sociology remains very theory poor. In fact, the mainstream has regressed rather than progressed. Quantitative sociology is now less theoretically informed and less relevant for theoretical progress than it was three decades ago” Aage B. Sørensen 1998, s. 238 Noget af det der er gået galt: -Tankeløs anvendelse af komplekse statistiske teknikker -Fokus på at forklare variation i den afhængige variabel og ikke på at forstå sammenhænge

Pct. that chooses freedom of speech as most important goal Specifikation af en sammenhæng

Lazarsfeld traditionen

Hvad kendetegner et godt redskab til analyse af samfundsvidenskabelige data? det skal kunne håndtere nominelle og ordinale data det skal kunne håndtere såvel kausale som symmetriske sammenhænge det skal være let at forstå (inspireret af Davis 1983)

Det skal kunne håndtere nominelle og ordinale data fordi det er næsten de eneste vi har i samfundsvidenskaberne Datatyper Nominelle: ingen mulighed for rangorden Fx regioner, stilling Ordinale: rangorden, men ingen information om afstand mellem kategorier Fx meget enig, enig, hverken eller uenig, meget uenig Interval: lige stor afstand mellem kategorier (ratio: interval med nulpunkt) Fx alder (men i tolkningen vil det ofte være ordinale data: fx livsfaser) Aritmetiske beregninger (gange, dividere) er uvenner med nominelle eller ordinale data

det skal kunne håndtere såvel kausale som symmetriske sammenhænge, for det er ofte svært at fastslå årsagssammenhæng i samfundsvidenskaberne Kausalitet og forklaring Meget sjældent eksperimenter, men teorier om sandsynligheder Y x symmetriske (tillid til politiet tillid til domstole) YxPartivalg højre-venstreorientering

det skal kunne håndtere nominelle og ordinale data det skal kunne håndtere såvel kausale som symmetriske sammenhænge det skal være let at forstå Alle tre kriterier er opfyldt med krydstabeller, men hvis man vil lave mere omfattende analyser (ud over tre-fire variable), bliver det uoverskueligt og derfor uforståeligt

DIGRAM program -En cykel med hjælpemotor Cyklen: (Durkheim), Lazarsfeld, Rosenberg, (Davis, Hellevik, Aneshensel … ) Hjælpemotoren: systematisering, estimationer og ikke faktiske tal, separationstesen, computerkraft Fordele Kategorielle, ordinale data Alle variabler inde i modellen fra start Symmetriske og asymmetriske relationer Mulighed for flere afhængige variable Visuelt Let at forstå, let at bruge??

Analyse Valg af variable Opstille en model (antagelser om sammenhænge) Symmetriske eller asymmetriske relationer Tre variable (valg af 3. variabel og dens placering) Fire og mange flere variable (følger samme principper) Før du gå i gang med den egentlige modelanalyse Deskriptive analyser af data En variabel: beskrive fordelinger To variable: sammenhænge

En variabel

Beskrivelse af variable Gennemsnit: tage bil 1,16; Sort arbejde: 3,80; Aktiv dødshjælp 6,81

To variable 1.symmetri: gensidig påvirkning. Den ene har ikke indflydelse på den anden 2.asymmetri: den ene påvirker den anden, men det omvendte er ikke tilfældet

Symmetriske relationer Typer 1.funktionel gensidig afhængighed (hvor der er trapper er der også elevatorer. Den ene er ikke årsag til den anden, men begge er funktionelle i høje huse) 2.Kausaliteten kan gå begge veje (børnetal og beskæftigelse) 3.I nogle tilfælde kan det måske være alternative indikatorer på samme begreb. Fx forskellige former for tro. I så fald muliggør det skalakonstruktion eller klassifikationer. 4.De to variable kan være dele af et kompleks. Fx folk der spiser stegt flæsk, lytter også til ABBA. Benyt fx korrespondanceanalyse. (men der kan også være en fælles årsag – kulturel kapital)

Symmetriske variable: procenter summerer til 100 Tror på et liv efter døden janej Tror på Gudja nej53338 i alt

(2) Kausaliteten går veje Børnetal/ Beskæftigelse FåMange Fuldtid Deltid Forklaringen går begge veje Fuld tid -> få børn Mange børn -> deltid Eksempel: børnetal og beskæftigelse for kvinder (Hypotetisk fordeling) (Davis eksempel: Desværre ser det ikke ud til at eksemplet holder empirisk i Danmark, 2008) Bedre eksempler?

Symmetriske relationer (3) alternative indikatorer på samme begreb Elementer i tro Pct af totalen Tror på et liv efter døden janej Tror på Gudja nej53338 i alt Figur: kombinationer af de to variable y =,75; p= 0,000; n=1286

Symmetriske relationer (4) Et kompleks Læse romaner gå i teateret Romanlæsning Går i teateret ofte sjældent

Asymmetriske relationer Antagelse om kausalitet B kan påvirke A, men A kan ikke påvirke B A B Afhængig variabel (tro) Uafhængig variabel (køn)

Tabelopstilling: Den uafhængige variabel summeres til 100 pct. Y1Y2I alt X1100 pct X2100 pct. Tror på Gud Tror ikke på Gud I alt Mænd Kvinder

Figurer: Den uafhængige variabel på x-aksen, den afhængige på y aksen

Antagelser om kausalitet Variable med klare start og stop punkter. I så fald: y<- x hvis y er startet efter x er stoppet. Fx kirkegang som voksen <- religiøs opdragelse. Sekvenser. y<- x hvis y følger efter x i en sekvens fx livscyklus holdninger til børns uddannelse <- holdninger til egen uddannelse; Fikserede, relativt stabile tilstande y<- x hvis x er mere fikseret end y (hvis x ikke forandrer sig, men y gør). A) helt fikseret Fx Holdning til abort <- køn B) ret stabilt fx kirkegang <- urbanisering; politiske holdninger <- religiøsitet (?) Frugtbare variable (variable der kan forklare mange ting) påvirker mere begrænsede variable. Fx holdning til abort <- religiøsitet. En ændring i x skal følges af en ændring i y (parforhold og lykke)

Tre variable Symmetriske klassifikation skala Asymmetriske Forklaringsformer

Pct.Kombination Gud Liv Paradis Gud Liv – Paradis Gud – Liv Paradis Gud – Liv – Paradis Gud Liv Paradis Gud – Liv Paradis Gud Liv – Paradis Gud – Liv - Paradis Kombinationer

Pct.Kombination - Gud – Liv - Paradis Gud – Liv – Paradis Gud Liv Paradis Gud Liv – Paradis Gud Liv – Paradis Gud – Liv Paradis Gud Liv Paradis Gud – Liv Paradis Sorteret efter hyppighed

Pct.Kombination - Gud – Liv – Paradis Gud – Liv – Paradis Gud Liv – Paradis Gud Liv Paradis De fire hyppigste sorteret efter kombination

Paradis +Paradis - Gud +Liv Gud +Liv -327 Gud -Liv +05 Gud -Liv -033 Klassifikation: nominelle kategorier /egenskabsrum

Paradis +Paradis - Gud +Liv Gud +Liv -327 Gud -Liv +05 Gud -Liv -033 Tro på paradis er vigtig for at skelne mellem troende og ikke troende

Paradis +Paradis - Gud +Liv +16 Kristne 15 Blandings religion? Gud +Liv -3 meningsløs 27 Spirituelle? Gud -Liv +0 meningsløs 5 Meningsløs? Gud -Liv -0 meningsløs 33 Ikke troende

Peger i retning af at sammenslå de to midterste kategorier

Latent variabel Skala for kristentro? Antal ja-svar Pct.KombinationSkala - Gud – Liv - Paradis Ikke kristen Gud – Liv – Paradis Lidt kristen Gud Liv – Paradis Noget kristen Gud Liv Paradis Meget kristen Andre kombinationer9Andet eller tælle antal +’er

Konstruktion: spørgsmålsbatteriet Analyse en latent variabel Symmetriske. En latent variabel

Asymmetriske relationer Fasthold den centrale (primære) sammenhæng /forskningsspørgsmålet Fastlæg rækkefølge mellem variablene

Afhængig variabel primær uafhængig variabel Tredje variabel y x z

Afhængig variabel primær uafhængig variabel Tredje variabel y x z Valg af 3. variabel Teori Mindst en korrelation Placering i forhold til rekursiv struktur

1) Mellemkommende variabel y z x y x z 2) Falsk korrelation Sammenhængen specificeres Den oprindelige sammenhæng forsvinder / mindskes De to almindeligste

Mellemkommende variabel y z x y x z Falsk korrelation Sammenhængen specificeres Den oprindelige sammenhæng forsvinder / mindskes Rekursiv struktur skal fastlægges

1) Mellemkommende variabel y z x Sammenhængen specificeres (z) Ytringsfrihedpolitisk holdningår (1999,2008) -.15 Opposition går mere ind for ytringsfrihed (0,03) Ingen ændring Marginale sammenhænge Flere går ind for ytringsfrihed Teori: Zaller: ændring påvirkes af generelle holdninger Placering: holdning efter år

Kun sammenhæng for regeringstro Stratificeres efter den variabel der specificerer sammenhængen Tilslutning til ytringsfrihed vokser stærkt for de regeringstro, men den ændrer sig ikke for oppositionen. Tolkning: Framing af spørgsmålet om ytringsfrihed

Som figur (den primære relation opdelt på den mellemkommende variabel)

2) Falsk korrelation Tro på liv efter døden Sus-uddannelse 0.23 Den primære sammenhæng: teori: Heelas/woodhead

2) Falsk korrelation Introduktion af 3. variabel får sammenhængen til at forsvinde 3. variabel skal være årsag til (kunne forklare, komme før i den rekursive struktur) til begge de to andre variable + være teoretisk relevant, her kønsteori. Tro på liv efter døden Sus-uddannelse 0.23 Den primære sammenhæng køn ,72 Kvinder vælger sus-uddannelser, kvinder er mere religiøse; sammenhængen mellem sus og tro forsvinder, når man kontrollerer for køn (den primære sammenhæng gøres betinget af en 3. variabel)

Marginalt Gamma: 0.23, p= 0,001 Falsk korrelation??

Eksemplet i Svends bog (12.2) BoligkvalitetArbejde Kohorteår Kohorteår medfører at den oprindelige sammenhæng mellem boligkvalitet og arbejde forsvinder

Afhængig variabel y Uafhængig variabel x1 Uafhængig variabel x2 c) To primære sammenhænge, ingen sammenhæng mellem de uafhængige variable. Forklare variationen i y

Afhængig variabel y gudstro Uafhængig variabel x1 urbanisering Uafhængig variabel x2 køn c) To primære sammenhænge, ingen sammenhæng mellem de uafhængige variable. Forklare variationen i y

MændKvinder Center4854 Midt imellem6077 Periferi5979 Pct. der siger at de tror på Gud fordelt på køn og urbanisering

Afhængig variabel y1 Uafhængig variabel x d) To primære sammenhænge, afhængige variable på samme niveau. Forklare sammenhængen mellem y1 og y2 Afhængig variabel y2

Hvor vigtigt er arbejde køn d) To primære sammenhænge, afhængige variable på samme niveau. Forklare sammenhængen mellem y1 og y2 Hvor vigtigt er familie Gamma mænd = 0.29 Gamma kvinder = ,15 -0,47

Lige mange kvinder og mænd synes at både arbejde og familie er meget vigtigt Flere kvinder end mænd synes at arbejdet er ret vigtigt og familien er meget vigtig etc.

Digram: mange kombinationer af variable

Den primære relation, sammenhængen specificeres

Specificerer sammenhængen

Medvirker til at forklare variationen i speech

Partivalg bidrager ikke til forklaringerne

v270_2 immi dikotomiseret v204_2 freedom dikotom Total 1,00 freedom of speech2,00 other Positive1999,0029,6%70,4%100,0% 2008,0029,8%70,2%100,0% 29,8%70,2%100,0% negative1999,0019,2%80,8%100,0% 2008,0025,8%74,2%100,0% 22,9%77,1%100,0% Ingen ændring Mere ytringsfrihed Specifikation af den primære relation