Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.

Slides:



Advertisements
Lignende præsentationer
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Advertisements

Dummyvariabler 13. oktober 2006
Statistik Lektion 18 Multipel Linear Regression
Statistik Lektion 17 Multipel Lineær Regression
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Anvendt Statistik Lektion 9
Sammenligning af to grupper – kapitel 7
Variansanalyse Modelkontrol
Anvendt Statistik Lektion 6
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Variansanalyse Modelkontrol
Statistik 1 – Lektion 5 By, energi & miljø, forår 2010 v. Morten Skou Nicolaisen.
Anvendt Statistik Lektion 8
Statistik Lektion 5 Log-lineære modeller.
Anvendt Statistik Lektion 8
Statistik II Lektion 5 Modelkontrol
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: F3 Økonometri 1 Den simple regressionsmodel 15. september 2006.
Statistik II 5. Lektion Log-lineære modeller.
Statistik II Lektion 4 Generelle Lineære Modeller
Anvendt Statistik Lektion 7
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Simpel Lineær Regression
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Inge Henningsen Stat BK uge Sammenligning af regressionslinier Opsummering af regressionsanalyse (Gennemgang af udvidet version af eksamen Blok.
Multipel Lineær Regression
Statistik Lektion 15 Mere Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 16 Multipel Lineær Regression
Økonometri – lektion 7 Multipel Lineær Regression
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 14 Simpel Lineær Regression
Økonometri – lektion 8 Multipel Lineær Regression
Anvendt Statistik Lektion 10  Regression med både kvantitative og kvalitative forklarende variable  Modelkontrol 1.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Simpel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Repetition Forårets højdepunkter…. Simpel Lineær Regression Simpel lineær regression: Mindste kvadraters metode Kovarians og Korrelation.
Statistik Lektion 8 Test for ens varians.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Grundlæggende teoretisk statistik
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 26. oktober 2004.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Inge Henningsen Stat BK uge
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Statikstik II 4. Lektion Generelle Lineære Modeller.
Statikstik II 3. Lektion Multipel Logistisk regression Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri – lektion 6 Multipel Lineær Regression
Statistik II Lektion 5 Modelkontrol Modelkontrol Modelsøgning Større eksempel.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Lineær og logistisk regression - fortsat
Logistisk regression - fortsat
KM2: F211 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007.
Log-lineære modeller ● Analyse af symmetriske sammenhænge mellem kategoriske variable. ● Ordinal information ignoreres.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel.
Ellen Holm, Forskningscafé
Heteroskedasticitet 25. oktober 2005
Anvendt Statistik Lektion 8
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Anvendt Statistik Lektion 6
Niveau 3: Regressionsanalyse: Tværsnitsundersøgelser
Præsentationens transcript:

Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt

Generelle lineære modeller ● Definitioner ● Modelsøgning ● Modelkontrol

GLM - definitioner Kvantitativ (skala) variabel for klaret af en kombination af kvantitative og kategoriske variable. Generelt kan højre siden bestå af mange led: Kategoriske variable bliver omkodet vha dummy-variable.

Bemærkning: Varians analyse Hvis en enlig forklarende variabel er kategorisk, så betegnes den generelle lineære model en varians analyse (på engelsk ANalysis Of VAriance = ANOVA). Består de forklarende variable af to kategoriske variable (og ikke andre), så kaldes det en to-sidet varians analyse.

Modelsøgning Backwards under hensyntagen til det hierarkiske princip. Hertil bruges et såkaldt F-test.

Eksempel Model:y i = α + βx i + ε i

Estimater Konklusion: Interceptet kan testes væk. Dvs. hypotesen α=0 accepteres. Tænk på eksemplet om sammenhængen mellem estimerede og faktiske anlægs-omkostninger... Her var den interessant hypotese: β=1? Hvad kan vi gøre ved den?

● Tommelfinger regel: Vi er 95% ”konfidente”, at: ● Den ”Sande” parameter værdi ligger i intervallet ● ”Parameter estimat” +/- 2*”Standard error” ● α = 0,439 +/- 2*2,961 ● β = 0,994 +/- 2*0,051 ● Hvordan passer det med hypotesen α = 0? ● Hypotesen β=1.Skal vi acceptere den?

Modelkontrol Husk: er den ”sande” linie. SPSS finder estimater a og b af hhv. α og β. I teorien: I praksis: (residualet) r i = ”observeret” - ”forventet” 1) r i 'erne bør være normalfordelte 2) r i 'ernes størrelse er uafhængig af ”obs” og ”forv”.

Normalfordelte residualer: Histogram

Q-Q plot ”Prikkerne” skal ligge usystematisk omkring linien – og det gør de! SPSS: Graph - Q-Q

Mere residual check Predicted = a + bx i Observed = y i Observed = Predicted + ε Observed ≈ Predicted Std. Resisdual uafh. af Predicted SPSS: Analyze – General Linear Models – Univariate – Options: Residual plot

Tegn selv slide!

Logistisk regression ● Definitioner ● Modelsøgning ● Fortolkning af parameter estimater

Logistisk regregssion - Definitioner Binær variabel forklaret af en eller flere kategoriske eller kvantitative variable. Y i binær med 0 og 1 som mulige værdier. Sandsynlighed for at Y er 1 skrives som

Logistisk regression - fortsat Odds: Logit: Højresiden han generaliseres... Omskrivninger:

Model søgning Backwards under hensyntagen til det hierarkiske princip.

Parameterfortolkning Antag Ændring i odds når x vokser: Hvis b>0, så ”følges” odds, p i og x i ad.

Log-lineære modeller ● Definitioner ● Modelsøgning ● Modelkontrol

Log-lineær model - Definitioner Med tre kategoriske variable A, B og C betegner den forventet frekvens af kobinationen A=a, B=b og C=c ud af n personer. betegner den obs. frekvens. ”Forventet frekvens” er det samme som ”Gennemsnits antal obs. under modellen” Model:

Modelcheck Residualer: SPSS udregner standardiserede residualer, så variansen er ”ens” for alle residualer. De standardiserede residualer er ca. normalfordelte. Plots: Q-Q + 3x3 residual-plot

Mini-projekt Omfang: ca. 30 sider Indhold ● Beskrivelse af data ● Opstilling af (generelle) hypoteser ● Anvendelser af metoder fra kurset Aflevering: Senest mandag d. 22. oktober kl 12. pr til Eksamen: Onsdag d. 24. November

Beskrivelse af data Beskrivelse af udvalgte variable, henderunder variabel-type (kat/kvant). Omkode variable, fx skala til kategorisk Deskriptive teknikker såsom histogrammer, boxplots, tabeller, scatter plot osv. Sikre at manglende data er kodet korrekt!

Hypoteser Hvilke hypoteser (i generel forstand) eller sammenhæng vil I forsøge at afdække vha. data?Er der sammenhæng mellem sko nummer og IQ? Hvilken model er mest passende? Generel Lineær Model – sko nr som kvant. afh. og IQ som kvant. forklarende var. Hvilken statistisk hypotese for modellen svarer til jeres?Parameter svarende til IQ forskellig fra nul.

Mini-projektet - konkret Data: Københavnernes sundhed 1995 Ca københavnere har svaret på spørgsmål vedrørende deres helbred. Herunder fysisk aktivitet, rygning, socialt netværk med mere. Desuden også køn, vægt, højde alder.