Ellen Holm, Forskningscafé

Slides:



Advertisements
Lignende præsentationer
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Advertisements

Dagens program Kursusevaluering Information Spørgsmål om eksamen
PRAKTISK STATISTISK ANALYSE
Statistik Lektion 18 Multipel Linear Regression
Statistik Lektion 17 Multipel Lineær Regression
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 9
Sammenligning af to grupper – kapitel 7
Variansanalyse Modelkontrol
Grundlæggende teoretisk statistik
Variansanalyse Modelkontrol
DATAHÅNDTERING GIGO.
Case.
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Anvendt Statistik Lektion 8
Statistik II Lektion 5 Modelkontrol
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Statistik II 5. Lektion Log-lineære modeller.
Statistik II Lektion 4 Generelle Lineære Modeller
Anvendt Statistik Lektion 7
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Forudsigelse i markedsanalyse Burns & Bush ch. 19 Carsten Stig Poulsen Mandag d. 6. april 2009.
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Inge Henningsen Stat BK uge Sammenligning af regressionslinier Opsummering af regressionsanalyse (Gennemgang af udvidet version af eksamen Blok.
Multipel Lineær Regression
Statistik Lektion 15 Mere Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 16 Multipel Lineær Regression
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Statistik for geografer
Introduktion Deskriptiv statistik Sandsynslighedregning
Anvendt Statistik Lektion 10  Regression med både kvantitative og kvalitative forklarende variable  Modelkontrol 1.
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Simpel Lineær Regression
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Kvalitative variable 8. marts 2006.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 7. september 2004.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006.
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statikstik II 4. Lektion Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Økonometri – lektion 6 Multipel Lineær Regression
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Reliabilitet. Disposition Kapitel 4 Artikel: Reliability of SF-36 in an Internet- and a pen-and-paper version Pause Artikel v. Annette de Thurah.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Den multiple regressionsmodel 21. september 2005
Videnskabeligt projekt
Anvendt Statistik Lektion 8
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Niveau 2: Hypotesetestning
Program – dag 2 (11. april 2011) Dag 2:
Niveau 3: Regressionsanalyse: Tværsnitsundersøgelser
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Ellen Holm, Forskningscafé 8.1.2015 Databearbejdning Ellen Holm, Forskningscafé 8.1.2015

Indhold Præsentation – af jer og af mig Hvad er data? Statistiske tests (ingen formler) Praktiske eksempler (med brug af excel og SPSS) Hvordan kommer I videre? Pas på statistikprogrammer – man kan let blive troldmandens lærling

Læringsmål: Hvad kan du efter denne time? Forklare hvad data og variable er Forklare hvad en p-værdi betyder Forstå hvad parametrisk og nonparametrisk statistisk metode er Lave simple tabeller, diagrammer og statistiske beregninger i excel Forstå eller fornemme betydning af regression og OR

Præsentation Hvem er I? Hvem er jeg?

Data Spørgeskema/ interview oplysninger Klinisk målte parametre Registerdata Data kan være tekst eller tal

Bearbejdning af data Kvalitative data Kvantitative data

Organisering af data Variable Cases ID alder Vægt_1 Højde Vægt_2 Ødemer Vægt_3 1 94 71 165 65,3 ja 66 2 87 104 180 nej 98 3 80 168 76,4 73,3 4 76 182 69,3 65,7 5 68 87,8 86,5 6 75 83,9 160 77,6 77 7 81 60,2 60 8 174 72 70,9 9 108 187 108,5

Data typer (variable) Kategoriske Kvanititative Dikotome variable(Ja/Nej, Mand/Kvinde) Flere kategorier (fx blodtype A, B, AB og 0) Ordinale – ordnede kategoriske data (aldersgrupper, vurderinger god-bedre-bedst) Kvanititative Diskrete – kan antage værdi af hele tal (antal personer, antal hjerteslag osv.) Kontinuerte – kan antage alle værdier (højde, vægt, tid)

Præsentation af data Start med at se på dine data: Frekvenstabeller (hvor mange får…) Middelværdi, spredning (varians, SD, range) for normalfordelte data Median og percentiler for ikke normalfordelte data

Forklaringsmodeller Med et forskningsstudie er målet at finde forklaringer og mønstre Vi vil derfor gerne kunne påvise statistiske sammenhænge

Statistiske tests Husk: inden du anvender en test at undersøge om forudsætningerne (antagelserne) for at anvende testen er tilstede T-test når man sammenligner gennemsnit i 2 grupper (enkel at gennemføre i excel) Hvad betyder p < 0.05 ? P=0.07 ? Korrelationskoefficient bruges til at beskrive sammenhæng mellem 2 variable

Statistiske tests, fortsat Regressionsanalyse – beskriver sammenhængen mellem 2 variable (eller flere variable i en multipel regressionsanalyse) Variansanalyse anvendes til at sammenligne middelværdien i mere end 2 grupper (ANOVA)

Regressionsanalyse Beskriver i hvor høj grad x (henad) er korreleret med y (opad). Regressionslinje er y=b0+b1* x1 hvor b0 er skæring med y-aksen også kaldet interceptet. Metoden bygger på ”mindste kvadraters metode” least square methods hvor den mindste kumulerede afstand til linjen findes. Du kan vise regressionsanalysen med fx antal medikamenter og alder (R2 angiver den procentdel af variationen, der kan forklares med alderen.

Statistiske tests, kategoriske data Relativ risiko og OR anvendes til at belyse sammenhæng mellem kategoriske variable (Ja/Nej data) Chi i anden test bruges til at vurdere signifikant forskel på 2 proportioner (RR)