Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.

Slides:



Advertisements
Lignende præsentationer
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Advertisements

Dummyvariabler 13. oktober 2006
Statistik Lektion 18 Multipel Linear Regression
Statistik og sandsynlighedsregning
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 6
Statistik og sandsynlighedsregning
SPSS II: lineære modeller
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Variansanalyse Modelkontrol
Case.
Statistik 1 – Lektion 5 By, energi & miljø, forår 2010 v. Morten Skou Nicolaisen.
Statistik Lektion 5 Log-lineære modeller.
Anvendt Statistik Lektion 2
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Statistik II 5. Lektion Log-lineære modeller.
Statistik – Lektion 2 Uafhængighed Stokastiske Variable
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistik for geografer
Statistik II Lektion 4 Generelle Lineære Modeller
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Opsamling Simpel/Multipel Lineær Regression Logistisk Regression
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 16 Multipel Lineær Regression
Kvantitative metoder 2: F21 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 7. februar 2007.
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Statistik for geografer Lektion 6. Sandsynlighedsregning Statistisk eksperiment Udfald Udfaldsrum Hændelse Statistisk eksperiment Udfald Udfaldsrum Hændelse.
Økonometri – lektion 8 Multipel Lineær Regression
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Simpel Lineær Regression
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2004.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
KM2: F51 Kvantitative metoder 2 Den simple regressionsmodel 19. februar 2007.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1 Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 21. oktober 2004.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 28. februar 2007.
Normalfordelingen og Stikprøvefordelinger
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 14. september 2005.
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statikstik II 4. Lektion Generelle Lineære Modeller.
Statikstik II 3. Lektion Multipel Logistisk regression Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Økonometri – lektion 6 Multipel Lineær Regression
Log lineære modeller for 3- og flervejskontingenstabeller
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Lineær og logistisk regression - fortsat
Logistisk regression - fortsat
KM2: F41 Kvantitative metoder 2 Den simple regressionsmodel 14. februar 2007.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Statistik II - PM5 Fokus: Analyse af kategoriske variable ● Logistisk regression ● Log-lineære modeller Kursets opbygning: ● 1 ECTS forelæsninger ● 1 ECTS.
Logistisk regression –Odds/Odds ratio Probit model Fortolkning udfra latent variabel.
Ellen Holm, Forskningscafé
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Program – dag 2 (11. april 2011) Dag 2:
Anvendt Statistik Lektion 6
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression og introduktion til kategoriske data.

Lineær regression Temp (x) -.8 -.7 .4 6.0 6.2 .8 1.0 1.4 … Forbrug (y) 7.2 6.9 6.4 4.9 4.5 4.8 4.6 4.7 4.0 Naturligt at se paa y givet x (kausalitet) Model:

Least-squares linie Output og graf fra SPSS Viser hvordan man tilpasser model vha. SPSS, test, p-vaerdi, konfidensinterval

Residuals Residuals: Normal ?

Multipel regression Isolering (x1) 1 … Temp (x2) -.8 -.7 .4 6.0 6.2 .8 1 … Temp (x2) -.8 -.7 .4 6.0 6.2 .8 1.0 1.4 Forbrug (y) 7.2 6.9 6.4 4.9 4.5 4.8 4.6 4.7 4.0 Vis igen hvordan i SPSS, dummy variabel…..

Least-squares linie Output og graf fra SPSS: Viser hvordan man tilpasser model vha. SPSS

Residuals

Typer af variable Kvantitativ vs kategorisk Diskret vs kontinuert Temperatur, forbrug: kvantitativ Isolering: kategorisk Diskret vs kontinuert Isolering: diskret Temperatur, forbrug: kontinuerte

Klassifikation af variable Giv en masse eksempler NB: kategorisk variabel er diskret pr. definition

Kategorisk afhængig variabel d: dosis insektgift r: død (1)/levende (0) d r 0.2 1 0.1 0.4 Hvorfor er det ikke en god ide med lineaer regression: fejl ej normal fordelt, resultat afhaenger af kodning (0,1 1,4 (da kategorisk afh. variabel), vi kan prediktere meningsloese vaerdier (dosis´0.4 giver r >1). Lineær regression dur ikke !!

Bernouilli/binomial fordelingen Eksempel: antal døde ved given dosis er binomialfordelt med n=3

2 kategoriske variable Person Køn Att. 1 M pos 2 3 K neg 4 5 … Pos Neg Køn og attitude til TV-reklame for 100 personer Person Køn Att. 1 M pos 2 3 K neg 4 5 … Krydstabellering: Pos Neg M 13 25 K 20 42

Uafhængighed og betinget sandsynlighed Eksempler på hændelser: A: tilfældigt udvalgt person er kvinde. B: personen er positivt indstillet overfor reklame. 2 hændelser A og B er uafhængige hvis P(A og B)=P(A)P(B) Betinget sandsynlighed: P(A|B)=P(A og B)/P(B)

Multinomialfordeling TV-reklame tabel giver 4 mulige udfald: M og pos, M og neg, K og pos, K og neg

Tilbage til TV-reklamen Pos Neg M 13 25 38 K 20 42 62 33 67 100 13/38=0.34 P(Pos|K)=20/62=0.32 P(K)=0.62 P(pos)=0.33 P(K og Pos)=0.20 P(K)*P(Pos)=0.2046 Estimater for P(K) ?, P(M) ? P(pos)? Er P(Pos|K)=P(Pos|M) ? Er køn og holdning uafhængige ?

Næste gang: logistisk regression