Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.

Lignende præsentationer


Præsentationer af emnet: "Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt."— Præsentationens transcript:

1 Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt

2 Generelle lineære modeller ● Definitioner ● Modelsøgning ● Modelkontrol

3 GLM - definitioner Kvantitativ (skala) variabel for klaret af en kombination af kvantitative og kategoriske variable. Generelt kan højre siden bestå af mange led: Kategoriske variable bliver omkodet vha dummy-variable.

4 Bemærkning: Varians analyse Hvis en enlig forklarende variabel er kategorisk, så betegnes den generelle lineære model en varians analyse (på engelsk ANalysis Of VAriance = ANOVA). Består de forklarende variable af to kategoriske variable (og ikke andre), så kaldes det en to-sidet varians analyse.

5 Modelsøgning Backwards under hensyntagen til det hierarkiske princip. Hertil bruges et såkaldt F-test.

6 Eksempel Model:y i = α + βx i + ε i

7 Estimater Konklusion: Interceptet kan testes væk. Dvs. hypotesen α=0 accepteres. Tænk på eksemplet om sammenhængen mellem estimerede og faktiske anlægs-omkostninger... Her var den interessant hypotese: β=1? Hvad kan vi gøre ved den?

8 ● Tommelfinger regel: Vi er 95% ”konfidente”, at: ● Den ”Sande” parameter værdi ligger i intervallet ● ”Parameter estimat” +/- 2*”Standard error” ● α = 0,439 +/- 2*2,961 ● β = 0,994 +/- 2*0,051 ● Hvordan passer det med hypotesen α = 0? ● Hypotesen β=1.Skal vi acceptere den?

9 Modelkontrol Husk: er den ”sande” linie. SPSS finder estimater a og b af hhv. α og β. I teorien: I praksis: (residualet) r i = ”observeret” - ”forventet” 1) r i 'erne bør være normalfordelte 2) r i 'ernes størrelse er uafhængig af ”obs” og ”forv”.

10 Normalfordelte residualer: Histogram

11 Q-Q plot ”Prikkerne” skal ligge usystematisk omkring linien – og det gør de! SPSS: Graph - Q-Q

12 Mere residual check Predicted = a + bx i Observed = y i Observed = Predicted + ε Observed ≈ Predicted Std. Resisdual uafh. af Predicted SPSS: Analyze – General Linear Models – Univariate – Options: Residual plot

13 Tegn selv slide!

14 Logistisk regression ● Definitioner ● Modelsøgning ● Fortolkning af parameter estimater

15 Logistisk regregssion - Definitioner Binær variabel forklaret af en eller flere kategoriske eller kvantitative variable. Y i binær med 0 og 1 som mulige værdier. Sandsynlighed for at Y er 1 skrives som

16 Logistisk regression - fortsat Odds: Logit: Højresiden han generaliseres... Omskrivninger:

17 Model søgning Backwards under hensyntagen til det hierarkiske princip.

18 Parameterfortolkning Antag Ændring i odds når x vokser: Hvis b>0, så ”følges” odds, p i og x i ad.

19 Log-lineære modeller ● Definitioner ● Modelsøgning ● Modelkontrol

20 Log-lineær model - Definitioner Med tre kategoriske variable A, B og C betegner den forventet frekvens af kobinationen A=a, B=b og C=c ud af n personer. betegner den obs. frekvens. ”Forventet frekvens” er det samme som ”Gennemsnits antal obs. under modellen” Model:

21 Modelcheck Residualer: SPSS udregner standardiserede residualer, så variansen er ”ens” for alle residualer. De standardiserede residualer er ca. normalfordelte. Plots: Q-Q + 3x3 residual-plot

22 Mini-projekt Omfang: ca. 30 sider Indhold ● Beskrivelse af data ● Opstilling af (generelle) hypoteser ● Anvendelser af metoder fra kurset Aflevering: Senest mandag d. 22. oktober kl 12. pr email til kkb@math.aau.dk kkb@math.aau.dk Eksamen: Onsdag d. 24. November

23 Beskrivelse af data Beskrivelse af udvalgte variable, henderunder variabel-type (kat/kvant). Omkode variable, fx skala til kategorisk Deskriptive teknikker såsom histogrammer, boxplots, tabeller, scatter plot osv. Sikre at manglende data er kodet korrekt!

24 Hypoteser Hvilke hypoteser (i generel forstand) eller sammenhæng vil I forsøge at afdække vha. data?Er der sammenhæng mellem sko nummer og IQ? Hvilken model er mest passende? Generel Lineær Model – sko nr som kvant. afh. og IQ som kvant. forklarende var. Hvilken statistisk hypotese for modellen svarer til jeres?Parameter svarende til IQ forskellig fra nul.

25 Mini-projektet - konkret Data: Københavnernes sundhed 1995 Ca. 2500 københavnere har svaret på spørgsmål vedrørende deres helbred. Herunder fysisk aktivitet, rygning, socialt netværk med mere. Desuden også køn, vægt, højde alder.


Download ppt "Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt."

Lignende præsentationer


Annoncer fra Google