Program – dag 2 (11. april 2011) Dag 2:

Slides:



Advertisements
Lignende præsentationer
Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Advertisements

Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Hypotese test – kapitel 6 (Signifikans test)
Dummyvariabler 13. oktober 2006
Analyse af kontingenstabeller
Statistik Lektion 18 Multipel Linear Regression
Anvendt Statistik Lektion 4
Stratificering, vægtning, statistiske test og elaborering af sammenhænge Plan & Miljø, forår 2009 Onsdag den 21. april.
Statistik Lektion 17 Multipel Lineær Regression
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 9
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Variansanalyse Modelkontrol
Anvendt Statistik Lektion 6
Statistik og sandsynlighedsregning
SPSS: basale dataanalyser
Variansanalyse Modelkontrol
Case.
Statistik 1 – Lektion 5 By, energi & miljø, forår 2010 v. Morten Skou Nicolaisen.
By, energi & miljø, forår 2010 v. Morten Skou Nicolaisen
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Anvendt Statistik Lektion 8
Statistik II Lektion 5 Modelkontrol
Analyse af kontingenstabeller
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Learning Objectives 5 Steps of a Significance Test Assumptions
Statistik II 5. Lektion Log-lineære modeller.
Anvendt Statistik Lektion 7
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Simpel Lineær Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 16 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik for geografer
Anvendt Statistik Lektion 10  Regression med både kvantitative og kvalitative forklarende variable  Modelkontrol 1.
Simpel Lineær Regression
Lektion 2. Definitioner En stikprøve (sample) Vi ønsker at generalisere ud fra en stikprøve Stikprøvefejls (samplings-error) Tilfældige fejl Systematikse.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statistik II 4. Lektion Logistisk regression.
Økonometri – lektion 6 Multipel Lineær Regression
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Log-lineære modeller ● Analyse af symmetriske sammenhænge mellem kategoriske variable. ● Ordinal information ignoreres.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel.
Samarbejde mellem matematik og samfundsfag. Disposition Indledning Hvorfor skal vi bruge 2 i samfundsfag? Hvordan kan matematikken bruges? Eksempel. Oplæg.
AKTIV HELE LIVET HJEMMEPLEJEN UNDERSØGELSE AF BRUGERTILFREDSHEDEN MED HJEMMEPLEJEN APRIL 2015.
Ellen Holm, Forskningscafé
Statistik.
Kapitel 5: Tabeller og sammenhænge
Videnskabeligt projekt
Anvendt Statistik Lektion 8
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Forløb: Ligestilling mellem køn i Danmark
Anvendt Statistik Lektion 6
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Program – dag 2 (11. april 2011) Dag 2: Hvordan kan man bearbejde data; Undersøgelse af datamaterialet; Forskellige typer statistik; Indledende dataundersøgelser; Hvad kan man sige om sammenhænge; Videre perspektiver.

Hvordan kan man behandle data? Tre niveauer Beskrivende statistik – alene tallene selv Analytisk statistik – antagelse om bagvedliggende idealfigur (fordeling) Modeller – komplekse computerberegninger som bruges til at forudsige sammenhænge Jo højere målniveau (=tal) Jo flere muligheder for statistisk bearbejdning

Fra forberedelsen: Antagelser om sammenhænge Hvis ingen antagelser om sammenhænge mellem 2 spørgsmål, bliver det uoverskueligt! Hvis vi for eksemplets skyld antager, at hvert spørgsmål har bare 2 svarmuligheder, så kan 2 spørgsmål kan kombineres på 1 måde 3 spørgsmål kan kombineres på 6 måder 4 spørgsmål kan kombineres på 12 måder 5 spørgsmål kan kombineres på 20 måder n spørgsmål kan kombineres på n! (n-r)! måder r er antallet af spørgsmål, der skal indgå i kombinationen n! betyder, at man ganger et tal, n, med talrækken op til n: Eksempel: hvis n = 7 betyder n! 7*6*5*4*3*2*1

SPSS – hvad er det? SPSS (originally, Statistical Package for the Social Sciences) PASW Statistics 17.0.3 - September 2009 IBM SPSS Statistics 19.0 - August 2010 Alternativer – ’R’

SPSS – hvordan ser det ud?

SPSS – 3 vinduer: Data – Output - Log

SPSS – hvad skal man gøre? Indledende øvelser 1/2 Hente data – downloade fra elektronisk spørgeskema, importere fra Excel, indtaste direkte Rådata kan sjældent bare bruges – de skal først tjekkes for fejl Kategoriske variable Udskriv frekvenser (Analyze  descriptive Statistics  frequences) Vælg en variabel, vælg ’statistics’, sæt hak ved ’min’ og ’max’ Er antallet sandsynligt? Er der mange ’missing values’ og hvorfor? Kontinuerte variable Sæk hak ved forskellige ’statistics’ Er resultaterne sandsynlige? Fordeler besvarelserne sig fornugtigt

SPSS – hvad skal man gøre? Indledende øvelser 2/2 3. Undersøg for deciderede fejl: Hvilket årstal er du født? Svar 1962 eller svar 62 Hvilke 3 ting betyder mest for dig? Svar 2 eller 5 ting Spørgsmål: Dyrker du motion. Svar ’nej’. Andet spørgsmål: Hvad er dit erhverv? Svar ’flyttemand’ - Vælg Analyze  Descriptive statistics  Explore Hvert spørgsmål skal tjekkes: Er svarfordelingen sandsynlig? Er der ’underlige svar’?

SPSS – Indledende analyser Fx undersøg fordeling: Er kurven til højre over respondenternes fødselsår normaltfordelt? Hvad hvis man deler gruppen op i mænd og kvinder – er den så (stadig) normalfordlet?

SPSS – beskrivelse af data vha grafer Brug Graphs  chart builder Træk graftype og variable på plads

- Samme data kan vises på flere måder Her udgør hver gruppe 100% Her udgør hver kategori 100% Her udgør søjlerne tilsammen 100%

Boxplot Variabelen skal være kontinuert, men kan grupperes i forhold til kategorier

Ændring af data Man kan omkode data: Alder  aldersintervaller: Respondenter født mellem 1960 – 1970  I 40’erne Kategorier  færre kategorier: Meget enig og noget enig  enig Lægge variable sammen til nye variable: Respondenter, der angiver ’ja til EU’ og ’kvinder’  ’EU-positive kvinder’ Brug Transpose  Recode into new variable

Hvad kan man læse af tabeller?

At analysere relationer mellem variable Variabeltype Måder at vise relationer mellem variablene Metode at analysere relationen med Nominal – nominal Kontingenstabel Grupperede søjlediagrammer Procentvis sammenligning ml. en af variablene Nominal – ordinal Grupperede søjlediagrammer (evt. akkumuleret) Procentvis sammenligning ml. den nominelle variable Nominal – skala Boxplot Sammenligning af middel eller median Ordinal - ordinal Spearman korrelation Ordinal - skala Skala - skala Scatterplot Hvis lineær: Pearson, hvis ikke-lineær: Spearman

At undersøge sammenhængen mellem holdning til forældres ansvar og køn 83. Hvilket af disse to udsagn beskriver bedst Deres mening om forældres ansvar/pligter over for deres børn? 1. Det er forældrenes pligt at gøre alt, hvad der står i deres magt for deres børn, uanset om det skulle gå ud over deres egen trivsel ............................................. 1 2. Forældre har også deres eget liv, og man kan ikke forlange, at de skal ofre deres egen trivsel for børnenes skyld ................................................................ 2 3. Ingen af delene ............................................................... 3

Svaret på spørgsmålet fordeler sig således Kan vi på baggrund af ovenstående konkludere, at kvinder går meget mere ind for, at ”Det er forældrenes pligt at gøre alt, hvad der står i deres magt for deres børn, uanset om det skulle gå ud over deres egen trivsel ” end mænd?

Opstille en hypotese Man tester altid konservativt – altså H(nul): Der er ikke forskel på kvinder og mænd. Falder hypotesen bliver alternativet H(alt) tilfældet: Der er forskel på kvinder og mænd Vælg Descriptive  Crosstab  Variable Vælg ’Statistics’  sæt hak i Chi-square og Phi and Cramers V

2. Dette tal skal rapporteres sammen med tabellen 2. Dette tal skal rapporteres sammen med tabellen. Det, der står er, at der er en chance på 7,6% for at forskellen, vist i tabellen, skyldes tilfældighed Konvention: p > 5%, dvs p > 0,05 kan vi ikke forkaste H(nul) 1. Her skal rapporteres ’ingen fejl’. Dvs ingen celler må have expected < 5. Dette er en forudsætning for at kunne bruge chi-testen 3. Tabeller på 2*2  Phi, større  V Samlet konklusion: Undersøgelsen viste ikke statistisk signifikant forskel på mænd og kvinder med hensyn til opfattelse af forældres ansvar. (p=0,076, Chi-square=5,166, df=2)