Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel.

Slides:



Advertisements
Lignende præsentationer
Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Advertisements

Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Hypotese test – kapitel 6 (Signifikans test)
Anvendt Statistik Lektion 3
Dummyvariabler 13. oktober 2006
Statistik Lektion 18 Multipel Linear Regression
Anvendt Statistik Lektion 4
Statistik Lektion 17 Multipel Lineær Regression
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 3 Simultan fordelte stokastiske variable
Sammenligning af to grupper – kapitel 7
Anvendt Statistik Lektion 3
Logistisk regression Den lineære sandsynlighedsmodel
SPSS: basale dataanalyser
Repetition: likelihood ratio test Test af hvorvidt faktorer med flere end 2 niveauer (mere end 1 parameter) kan udelades fra model: likelihood ratio test.
SPSS II: lineære modeller
Grundlæggende teoretisk statistik
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Statistik 1 – Lektion 5 By, energi & miljø, forår 2010 v. Morten Skou Nicolaisen.
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Statistik II Lektion 5 Modelkontrol
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Statistik II 5. Lektion Log-lineære modeller.
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Binær responsmodeller: Logit og probit 12. maj 2003
Statistik II Lektion 4 Generelle Lineære Modeller
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik for geografer
Statistik Lektion 16 Multipel Lineær Regression
Poissonfordelte observationer Deskriptiv analyse Jens Friis, AAU.
Økonometri – lektion 7 Multipel Lineær Regression
Økonometri – lektion 5 Multipel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri – lektion 8 Multipel Lineær Regression
Anvendt Statistik Lektion 10  Regression med både kvantitative og kvalitative forklarende variable  Modelkontrol 1.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Normalfordelingen og Stikprøvefordelinger
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Statikstik II 3. Lektion Multipel Logistisk regression Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Log lineære modeller for kontingenstabeller Kontingenstabeller Test for uafhængighed af inddelingskriterier Sammenligning med logistisk regression Odds.
Økonometri – lektion 6 Multipel Lineær Regression
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Log lineære modeller for 3- og flervejskontingenstabeller
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Lineær og logistisk regression - fortsat
Logistisk regression - fortsat
Log-lineære modeller ● Analyse af symmetriske sammenhænge mellem kategoriske variable. ● Ordinal information ignoreres.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Anvendt Statistik Lektion 8
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Program – dag 2 (11. april 2011) Dag 2:
Anvendt Statistik Lektion 6
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel

Bernouilli/binomial fordelingen Gennemsnits antal døde: E[Y] = np. Gennemsnits andel døde: E[Y/n] = p.

Odds Odds for at dø vs. overleve er Ex: odds=2 betyder sandsynlighed p for dø dobbelt så stor som sandsynlighed 1-p for at leve.

Odds fortsat Fra odds til sandsynlighed: Dvs. odds=2 giver p=2/3 (og 1-p=1/3)

Logistisk regression ● Udgangspunkt i binomialfordeling (det naturlige valg): ● Modellerer log odds (logit af sandsynlighederne):

Logit og invers logit transformation NB: logit strækker ]0,1[ ud til hele den reelle talakse og invers logit ligger altid mellem 0 og 1.

Dose-respons: 10 insekter for hver dose Andel døde ud af ti. Hvad er sandsynlighed for at dø, hvis dosis er 5,7?

Dose-respons: Mere insektgift p = sandsynlighed for at dø. Hvert insekt (100 stk) sin dose.

Odds og odds ratio

Eksempel Hældning b: exp(b) er forøgelse af odds, når dosis øges med 1

Probit model Sandsynligheds tætheden for en standard normal: Fordelings funktionen for en standard normal: Probit model: p i =Φ(η i ) og η i =Φ -1 (p i ), hvor η i =c + d ·dosis i NB: Ingen explicitte formler for Φ og Φ -1 !

Logistisk og probit Invers probit mere stejl end invers logistisk men samme form. Parameter for logistisk ca gange parameter for probit:

Latent variabel fortolkning Samme fortolkning for logistisk regression hvis logistisk fordeling i stedet for standard normal fordeling.

Den logitiske og normale fordeling Logistiske Normal Begge har middelværdi 0 og varians 1.

Fortolkning i forhold til transport

SPSS procedurer analyze-regression-binary logistic: Bernouilli (b(1,p)) og logistisk (ikke b(n,p) med n>1) analyze-regression-multinomial regression: multinomial og logistisk (herunder Bernouilli) (ikke b(n,p) med n>1) output analogt til general linear model output. analyze-regression-probit: b(n,p) eller Bernouilli og probit eller logistisk. Jeg foretrækker multinomial regression eller probit (for grupperede data).

Eksempel: valg af transportmiddel til arbejde i forhold til alder Undersøge om valg af transportmiddel til/fra arbejde afhænger af alder. Logistisk regression hvor responsen 'Nej (kører ej bil)' er kodet som 0 og 'Ja (kører bil)' er kodet som 1.

Output fra multinomial regression: parameter estimater NB: reference kategori er 'Ja', dvs vi modellerer sandsynlighed for 'Nej', dvs. ikke at køre i bil.

Alder som kategorisk/faktor: krydstabel Kategoriser kvalitativ variabel i SPSS: Transform -> Recode... Krydstabel i SPSS: Analyze -> Descriptive Statistics -> Crosstabs...

Parameter estimater fra multinomial logistic med alder som kategorisk Koder nu alder som faktor: 1 svarer til 25 og under, 2 til 26-50, 3 til og 4 til over 63 og over.