Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.

Lignende præsentationer


Præsentationer af emnet: "Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS."— Præsentationens transcript:

1 Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS miniprojekt Software: ● SPSS Eksamen: ● Individuel – bestået/ikke bestået

2 Typer af variable ● Nominelle: Navngivne kategorier uden ordning ● Fx farve (rød, grøn, gul,...) ● Ordinale: Navnegivne kategorier med ordning ● Fx bilklasse (mini, kompakt, mellem, stor, limo) ● Kvantitative: Målbare størrelser ● Fx temperatur, dæktryk, længde, antal sæder ● Binære: To svarmuligheder ● Kan betragtes som specialtilfælde af alle de ovenstående variabeltyper. Kontinuert vs Diskret Kategoriske variable (nominelle el ordinale): diskrete. Kvantitative: Både kontinuerte (tryk) og diskrete (antal). Binære: Kan fortolkes som både kont. og diskrete.

3 Statistisk analyse Finde sammenhæng mellem variable, fx. Temperatur og varmeforbrug. Lineær regression undersøger om en (kont.) kvantitativ (varmeforbrug) variabel kan forklares af andre kvantitative variable (temperatur). Hvis den afhængige variabel er binær og den forklarende erkvantitativ - hva' så? Eksempel: Hvordan reagere et insekt (Binær afhængig: død/levende) på en given dosis insektgift (kvantitativ forklarende variabel)?

4 Lineær regression Model: En kvantitativ variabel skal forklares -hvordan er det nu man gør? Dvs ε er normalfordelt med middelværdi 0 og varians σ 2.

5 Least-squares linie Output og graf fra SPSS SPSS funktion: Analyze→Regression→Linear SPSS funktion: Graphs→Scatter/Dot Finder estimater af hhv a og b givet ved

6 Residualer Modelkontrol: Residualerne bør være normalfordelte - er de? Residualer : SPSS funktion: Under Regression->LInear vælg Save... Studentized residuals

7 Multipel regression Model: Ekstra variabel: Isolation (x 2 ) med værdierne 0 (før) og 1(efter). Obs! Her fortolkes den binære variabel som kvantitativ.

8 Fortolknin g Model: Hvis isolation=før, dvs. x 2 =0: Hvis isolation=efter, dvs. x 2 =1:

9 adbcadbc Model parametre

10 Residualer

11 Kvantitativ afhængig og kategorisk forklarende Fx. er Y afstand til jobbet i km ogX er løngruppe med kategorier Lav, Mid og Høj. Model: y = a + b Lav x Lav + b Mid x Mid + b Høj x Høj + ε x Lav = 1 hvis x tilhører kategori Lav, ellers er x Lav =0. Tilsvarende for x Mid og x Høj. Dvs. præcis èn af x Lav, x Mid og x Høj er lig 1. Hvis x=Mid y = a + b Lav 0 + b Mid 1 + b Høj 0 + ε= a + b Mid + ε (opfundet eksempel)

12 De tre ligninger y = a + b Høj + ε y = a + b Mid + ε y = a + b Lav + ε Bemærk: Overparametriseret! Løsning: Lad 'Høj' være reference kategori og sæt b Høj =0. y = a + ε y = a + b Mid + ε y = a + b Lav + ε Fortolkning: b Lav er forskellen i km mellem referencen kategorien og kategorien Lav. SPSS: Analyze -> General Linear Models -> Univariate

13 Kategorisk afhængig og kvalitativ forklarende Dosis (d) insekt gift. Respons (r): 0=Levende 1=Død Lineær regression dur ikke! Lad os prøve med lineær regression...

14 To kategoriske variable Køn og valg af transportmiddel for 496 personer Krydstabel: Afhængige variabel: Antal personer i hver af de fire kategorier. Bemærk at 'Køn' og 'Transport' indgår på lige fod!

15 Bernouilli/Binomial fordelingen Insektgift eksemplet igen: Lad X=0 angive doed og X=1 overlevelse. Hvis sandsynligheden for at doe er p, saa skriver vi P(X=0)=p og P(X=1)=(1-p). Generelt: En variabel X som kun kan antage vaerdierne 0 og 1, og hvor P(X=0)=p og P(X=1)=(1-p) er Bernouilli fordelt med sandsynligheds parameter p. Lad X=X 1 + X 2 +... + X n sum af uafhængige Bernouilli fordelte variable. Så er X binomal fordelt b(n,p). Antag n insekter udsættes for samme dosis. Hvert insekt har samme sansynlighed p for at overleve. Lad X i være status for det i'te insekt. Da er X antal overlevende insekter.

16 Sammenligning Lineær regression: Middelværdien er en funktion forklarende variable

17 Insektgift: Forskellige doser For hver dose observeres antal døde blandt ti insekter. En binomal fordelte variable for hver dose – med hver sit p.

18 Lineær model p i : sandsynligheden for at dø af dosis i. y i : % døde ud af 10 Lineær model: p i = a + b dosis i y i = p i + ε i ε i er normal fordelt.

19 Resultat med lineær model ● Problemer: ● For dosis 1 forudsiger (predikterer) modellen et negativt anatal døde. ● Frekvenser ikke normalfordelte ● Ikke samme varians: var(y i ) = p i (1-p i )/10 Løsning: Logistisk regression.... det ser vi på næste gang!


Download ppt "Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS."

Lignende præsentationer


Annoncer fra Google