DATAHÅNDTERING GIGO.

Slides:



Advertisements
Lignende præsentationer
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Advertisements

Kvalitetskontrol af fiskedata fra oversigtsfiskeri både i NOVA/ NOVANA søer og andre søer fra perioden
Analyse af kontingenstabeller
v/ Professor Lars Ehlers, Aalborg Universitet
PRAKTISK STATISTISK ANALYSE
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Statistik Lektion 20 Ikke-parametriske metoder
Valg af studie-type for projektet
Körper-koordinationstest für Kinder (KTK)
Laboratoriet, HGO Januar 2006
Anvendt Statistik Lektion 4
Basal statistik 24. okt Tom Bendix Videncenter for
Kildedata and Kilde- dokumenter Auditor’s synspunkt ved Mette Nørgaard, Afd. Leder, CQA, Lundbeck.
Studietyper Katharina M.Main
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
. Vejledning til udfyldelse af screeningsskema og sundhedskort Bemærk: trin 3 og 4 i algoritmen side 14 udføres kun på afsnit P202, P402 og P601. Screeningskema:
Anvendt Statistik Lektion 9
Sammenligning af to grupper – kapitel 7
Variansanalyse Modelkontrol
Anvendt Statistik Lektion 6
SPSS: basale dataanalyser
Fra idé til projektbeskrivelse – Hjerte CT
Variansanalyse Modelkontrol
Gennemsnitlige udgifter til sundhedsvæsen, Alder kr
Case.
Statistik II Lektion 5 Modelkontrol
" Hvad er det perfekte samarbejde mellem hospitaler og almen praksis om diabetesbehandlingen? Hvordan måler vi kvaliteten af diabetesbehandlingen?" Henning.
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Høje Tåstrup kommune Sundhedsprofil og forebyggelse 11. september 2006
Statistik II Lektion 4 Generelle Lineære Modeller
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik for geografer Lektion 4. Tidsrække Analyse Proces som varierer over tid Observationer til bestemte tidspunkter Eksempler Proces som varierer.
Statistik for geografer
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Prægraduat Forskningsstuderende Sofie Tind
Rationel klinik Wulff & Gøtzsche, Munksgaard Medical Informatics
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statistik for geografer
Statistik Lektion 16 Multipel Lineær Regression
Kvantitative metoder 2: F21 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 7. februar 2007.
Økonometri – lektion 5 Multipel Lineær Regression
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Dansk Landbrugsrådgivning Landscentret | Byggeri og Teknik Landbrugets 3D-stalddesign Konsulent Benjamin B. Andersen og landskonsulent Niels H. Lundgaard.
Statistik for geografer
Introduktion Deskriptiv statistik Sandsynslighedregning
Kvantitative metoder.
XML 2. Formatering af XML data med CSS Når man arbejder med XML og CSS er fremgangsmåden den samme som i forbindelse med HTML og CSS.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 Kvalitative variable 8. marts 2006.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
NavnFødselsår AdressePostnr. ByTelefon Klub/Team Ansøgningsblanket til Team Copenhagen Eliteidrætsakademi 2011/12 CYKELSPORT Ansøgning indsendes.
Økonometri 1: Inferens i den lineære regressionsmodel1 Økonometri 1 FunktioneI form i den lineære regressionsmodel 11. oktober 2005.
Inge Henningsen Stat BK uge
Statikstik II 4. Lektion Generelle Lineære Modeller.
Eksamensopgave i statistik for FSV-kandidatstuderende – maj 2002
Økonometri – lektion 6 Multipel Lineær Regression
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Kvantitativ undersøgelse om hjerteflimmer 2016
Ellen Holm, Forskningscafé
Spil: overvægt lotteri
Kvalitative og kvantitative undersøgelser
2 Kvalitative og kvantitative metoder
Videnskabeligt projekt
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Niveau 2: Hypotesetestning
Workshop ”Byg en graf”.
Program – dag 2 (11. april 2011) Dag 2:
Anvendt Statistik Lektion 6
Præsentationens transcript:

DATAHÅNDTERING GIGO

DATATYPER Demografiske karakteristika Spørgeskemaoplysninger Fx patientidentifikation, køn, alder, sociale oplysninger Spørgeskemaoplysninger Fx tidligere sygdomme, symptomer, livskvalitet Registeroplysninger Fx indlæggelsesdato, diagnose, dødsårsag Kliniske parametre Fx højde, vægt, blodtryk Laboratoriedata Fx blodprøveværdier, urindyrkninger

DATAHÅNDTERING Per håndkraft fx kvadreret papir Elektronisk regneark fx Microsoft Excel Database fx Microsoft Access Statistikprogram fx SPSS, SAS

DATABASE Systematisk samling af data, typisk i digital form Rækker: Forsøgsindivider (personer, patienter, dyr) Kolonner Baggrundsvariable (ID, køn, alder, højde, vægt) Øvrige parametre (blodtryk, puls, alder ved diagnose) Så detaljeret og præcist som muligt Dikotome variable: 0 og 1 Kontrol af: Outliers Manglende værdier (missing values) (9999) Obs. datoformat

DATABASE Eksempel ID-nr. Fødeår Køn (m/k) Vægt (kg) Højde (m) BMI (kg/m2) Blodtryk (mmHg) 001 02.08.1956 1 67.3 167 24,1 120/80 002 1968 93 2,00 23,2 167/85 003 2002 M 56 1,87 16,0 135/77 005 03.11.1947-1234 1,78 80 25,2 145

DATABASE Eksempel – find fejl/uhensigtsmæssigheder ID-nr. Fødeår Køn (m/k) Vægt (kg) Højde (m) BMI (kg/m2) Blodtryk (mmHg) 001 02.08.1956 1 67.3 167 24,1 120/80 002 1968 93 2,00 23,2 167/85 003 2002 M 56 1,87 16,0 135/77 005 03.11.1947-1234 1,78 80 25,2 145

DATABASE Eksempel – find fejl/uhensigtsmæssigheder ID-nr. Fødeår Køn (m/k) Vægt (kg) Højde (m) BMI (kg/m2) Blodtryk (mmHg) 001 02.08.1956 1 67.3 167 24,1 120/80 002 1968 93 2,00 23,2 167/85 003 2002 M 56 1,87 16,0 135/77 005 03.11.1947-1234 1,78 80 25,2 145

DESKRIPTIV STATISTIK Data indsamlet på forsøgsobjekter kaldes observationer Observationer vedr. køn, alder, vægt etc. kaldes variable Variable inddeles i to hovedkategorier: Kategoriske (kvalitative) variable Numeriske (kvantitative) variable

DESKRIPTIV STATISTIK Kategoriske variable kan være: Dikotome Udfald: A eller B Mand eller kvinde Nominelle Udfald: A,B,C eller D Blodtype Ordinale Udfald: A<B<C<D NYHA-klasse Numeriske variable kan være: Diskrete (heltal) 80 Puls Kontinuerte 79,6 Vægt

Valg af signifikanstests Normalfordelte data  parametrisk statistik (kun numeriske variable) Ikke-normalfordelte data  non-parametrisk statistik (kategoriske og numeriske variable)

Valg af signifikanstests Kvalitative data Kvantitative data 2 x 2 n x m uparret parret N ≤ 60 N > 60 McNemar Fisher Chi2 Mann Whitney Wilcoxon Kruskall-Wallis Friedman Uparret t-test Parret ANOVA

Valg af signifikanstests Kvalitative data Kvantitative data 2 x 2 n x m uparret parret N ≤ 60 N > 60 McNemar Fisher Chi2 Mann Whitney Wilcoxon Kruskall-Wallis Friedman Uparret t-test Parret ANOVA Parametrisk statistik

DIKOTOME UDFALD Deskriptive begreber ARR Absolute Risk Reduction RRR Relative Risk Reduction RR Relative Risk OR Odds ratio NNT Number Needed to Treat NNH Number Needed to Harm

Udregning af dikotome udfald 2x2 tabel til vurdering af dikotome udfald Udfald Ja Nej Total Eksposition a b a+b c d c+d a+c b+d a+b+c+d

DIKOTOME UDFALD Deskriptive begreber ARR c/(c+d)−a/(a+b) RRR AAR/(c/c+d) = (c/(c+d)−a/(a+b))/(c/c+d) RR (a/a+b)/(c/c+d) OR (a/c)/(b/d) NNT 1/ARR = 1/(c/(c+d)−a/(a+b)) (hvis >0) NNH 1/ARR = 1/(c/(c+d)−a/(a+b)) (hvis <0) Udfald Ja Nej Total Eksposition a b a+b c d c+d a+c b+d a+b+c+d

Absolute Risk Reduction (ARR) ARR er nedsættelsen i sandsynligheden for et udfald blandt eksponerede i forhold til hos ueksponerede. 6-års studie Udfald Ja Nej Total Eksposition 15 135 150 100 250 115 285 400 ARR = c/(c+d)−a/(a+b) = 100/250−15/150 = 0,4-0,1 = 0,3 (30%)

OR = (a/c)/(b/d) = ad/bc = (15x150/135x100) = 2250/13500 Odds Ratio (OR) OR er forholdet mellem odds for udfaldet blandt eksponerede og odds for udfaldet blandt ueksponerede. 6-års studie Udfald Ja Nej Total Eksposition 15 135 150 100 250 115 285 400 OR = (a/c)/(b/d) = ad/bc = (15x150/135x100) = 2250/13500 = 0,167 (17 %)

RR = (a/a+b)/(c/c+d) = (15/150)/(100/250) = 0,1/0,4 Relative Risk (RR) RR er forholdet mellem sandsynligheden for et udfald blandt eksponerede i forhold til et udfald hos ueksponerede. 6-års studie Udfald Ja Nej Total Eksposition 15 135 150 100 250 115 285 400 RR = (a/a+b)/(c/c+d) = (15/150)/(100/250) = 0,1/0,4 = 0,25 (25 %)

Relative Risk Reduction (RRR) RRR er nedsættelsen i sandsynligheden for et udfald blandt eksponerede i forhold til blandt ueksponerede. 6-års studie Udfald Ja Nej Total Eksposition 15 135 150 100 250 115 285 400 RRR = AAR/(c/c+d) = 30/(100/250) = 30/40 = 0,75 (75%) (100−RR = 100−25 = 75%)

Number Needed to Treat (NNT) NNT er det antal eksponerede patienter, der skal behandles for at få ét positivt udfald i et defineret tidsrum. 6-års studie Udfald (Virkning) Ja Nej Total Eksposition 15 135 150 100 250 115 285 400 NNT = 1/ARR = 1/((100/250)−15/150)) = 150/250−15/150 = 1/(0,4−0,1) = 3,33 ptt. i 6 år eller 20 ptt. i 1 år

Number Needed to Harm (NNH) NNH er det antal eksponerede patienter, der skal behandles for at få ét negativt udfald i et defineret tidsrum. 6-års studie Udfald (Bivirkning) Ja Nej Total Eksposition 135 15 150 100 250 285 115 400 NNH = 1/ARR = 1/(c/(c+d)−a/(a+b)) = 150/250−135/150 = 1/(0,6−0,9) = 1,11 ptt. i 6 år eller 7 ptt. i 1 år

ARR, RRR og NNT i JUPITER Rosuvastatins forebyggende effekt på kardiovaskulær syg- dom og død hos raske med forhøjet hsCRP (JUPITER). 1,9-års studie Udfald (CVD composite) Ja Nej Total Eksposition 142 8901 9043 251 9152 393 17802 18195 ARR = ??? RRR = ??? NNT = ??? (Ridker et al. N Engl J Med 2008;359:2195-207)

ARR, RRR og NNT i JUPITER Rosuvastatins forebyggende effekt på kardiovaskulær syg- dom og død hos raske med forhøjet hsCRP (JUPITER). 1,9-års studie Udfald (CVD composite) Ja Nej Total Eksposition 142 8901 9043 251 9152 393 17802 18195 ARR = c/(c+d)−a/(a+b) = 251/9152−142/9043 = 0,0117 (1,2%) RRR = ARR/(c/(c+d)) = 0,0117/0,0274 = 0,42 (42%) NNT = 1/ARR = 1/0,0117 = 85 i 1,9 år, 161 i 1 år eller 32 i 5 år (Ridker et al. N Engl J Med 2008;359:2195-207)

(ACCORD Study Group, N Engl J Med 2008;358:2545-59) ARR og NNH i ACCORD Effekt af intensiv glukosekontrol på død af enhver årsag hos patienter med type 2 diabetes. 3½-års studie Udfald (død) Ja Nej Total Eksposition 257 4871 5128 203 4920 5123 460 9791 10251 ARR = ??? NNH = ??? (ACCORD Study Group, N Engl J Med 2008;358:2545-59)

(ACCORD Study Group, N Engl J Med 2008;358:2545-59) ARR og NNH i ACCORD Effekt af intensiv glukosekontrol på død af enhver årsag hos patienter med type 2 diabetes. 3½-års studie Udfald (død) Ja Nej Total Eksposition 257 4871 5128 203 4920 5123 460 9791 10251 ARR = c/(c+d)−a/(a+b) = 203/5123−257/5128 = -0,0105 (-1,1%) NNH = 1/ARR = 1/0,0105 = 95 i 3,5 år eller 333 i 1 år (ACCORD Study Group, N Engl J Med 2008;358:2545-59)

ARR og NNH calciumbeh. Effekt af calciumtilskud på risiko for myokardieinfarkt: Metaanalyse. 3,8 års studie Udfald (AMI) Ja Nej Total Eksposition 309 5807 6116 241 5564 5805 550 11371 11921 (Bolland et al. BMJ 2010;341:c3691)

ARR og NNH calciumbeh. Effekt af calciumtilskud på risiko for myokardieinfarkt: Metaanalyse. 3,8 års studie Udfald (AMI) Ja Nej Total Eksposition 309 5807 6116 241 5564 5805 550 11371 11921 ARR = ??? NNH = ??? (Bolland et al. BMJ 2010;341:c3691)

ARR og NNH calciumbeh. Effekt af calciumtilskud på risiko for myokardieinfarkt: Metaanalyse. 3,8 års studie Udfald (AMI) Ja Nej Total Eksposition 309 5807 6116 241 5564 5805 550 11371 11921 ARR = c/(c+d)−a/(a+b) = 241/5807−309/6116 = -0,009 (-0,9%) NNH = 1/ARR = 1/0,009 = 111 i 3,8 år eller 422 i 1 år (Bolland et al. BMJ 2010;341:c3691)

Signifikanstests Signifikans tests Kvalitative data Kvantitative data 2 x 2 n x m uparret parret N ≤ 60 N > 60 McNemar Fisher Chi2 Mann Whitney Wilcoxon Kruskall-Wallis Friedman Uparret t-test Parret ANOVA