Sammenligning af to grupper – kapitel 7

Slides:



Advertisements
Lignende præsentationer
Valg med Excel Fordelingsmetoder med Excel
Advertisements

Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Hypotese test – kapitel 6 (Signifikans test)
Anvendt Statistik Lektion 3
Dummyvariabler 13. oktober 2006
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Akademi Merkonomer Statistik Aften 5
Program Informationer χ2-test (chi-i-anden) Projekt 3
Statistik Lektion 8 Parrede test Test for forskel i andele
Anvendt Statistik Lektion 6
Anvendt Statistik Lektion 2
KM2: F221 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007.
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 9
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
Akademi Merkonomer Statistik Aften 6
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
KM2: F171 Kvantitative metoder 2 Dummyvariabler 2. april 2007.
Statistik og kvantitativ metode Politik & Administration og Samfundsfag 3. semester 2007 Lektion 5, tirsdag den 23. oktober Punkt- og intervalestimering.
Case.
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Signifikanstest ved (en eller) to stikprøver
Test i to populationer Hypotesetest for parrede observationer
Learning Objectives 5 Steps of a Significance Test Assumptions
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Grundlæggende teoretisk statistik
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 8 Parrede test Test for forskel i andele
Simpel Lineær Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri – lektion 5 Multipel Lineær Regression
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Simpel Lineær Regression
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 10. marts 2003.
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Økonometri 1: F151 Økonometri 1 Specifikation og dataproblemer 10. november 2006.
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Normalfordelingen og Stikprøvefordelinger
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 15. marts 2006.
Opsamling ● Generelle lineære modeller ● Logistisk regression ● Log-lineære modeller ● Mini-projekt.
Samarbejde mellem matematik og samfundsfag. Disposition Indledning Hvorfor skal vi bruge 2 i samfundsfag? Hvordan kan matematikken bruges? Eksempel. Oplæg.
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 4
Anvendt Statistik Lektion 6
Præsentationens transcript:

Sammenligning af to grupper – kapitel 7 Slides: http://www.socsci.aau.dk/~sgb/

Hypoteser og hypotesetest. En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable, for eksempel: ”Er middelværdien af de 5.semesters studerendes vægt lig med 70 kilo?” I en hypotesetest (signifikanstest) testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 68 kilo. Er det (signifikant) forskellig fra 70? Det er forskellig fra 70, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhænger af eksempelvis stikprøvestørrelsen. En hypotesetest består af 5 elementer: antagelser, hypoteser, test størrelse, p-værdi og beslutning/konklusion.

Test af middelværdi Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: . 8 7 6 5 4 3 2 1 0 x

P-værdi og forkastelse af H0 Når nul hypotesen er falsk, er p-værdien meget lille og når nul hypotesen er sand, vil p-værdien være stor (større end for eksempel 0.05). Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand.

Beregning af p-værdi Når H0 er sand, er fordelingen af Z approksimativt standard normal fordelt (dvs. normal fordelt med middelværdi 0 og standard afvigelse 1). P-værdien er sandsynligheden for at observere en test størrelse mindst så ekstrem som den observerede, givet at H0 er sand. I formler: p( |Z| > beregnet z værdi) . I praksis: I tabellen for standard normalfordelingen aflæses sandsynligheden ud fra værdien af z-værdien og ganges med 2, da det ”er i begge sider af fordelingen”. Dvs. skal ganges med 2, da vi både ser på værdier der er mindre end og større end middelværdien opgivet i H0. Meget nemmere at se ved hjælp af et eksempel:

Eksempel H0: m = 30 Ha: mm 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: P-værdi: Fordeling: . 8 . 7 . 6 . 5 . 4 . 3 . 2 .017 .017 . 1 . 0=30 x- x

Signifikans niveau Signifikans niveauet a er et tal, således at H0 forkastes, hvis p-værdien er mindre end a. Er normalvis 0.05 eller 0.01. Vælges før analysen foretages. Hvis man tester på signifikans niveau 0.05, svarer det til en z-værdi på 1.96 i en to-sidet test og 1.645 i en højresidet test. Normal ses dog på p-værdien i stedet, da de i de fleste tilfælde ikke er smart at have en standard procedure for om man forkaster eller ej. Konklusion P-værdi H0 H1 P<0.05 Forkast Accepter P>0.05 Forkast ikke Accepter ikke

Kritiske værdier, to-sidet test, α=0.05 Eksemplet er for standard normal fordelingen. Tilsvarende kritiske værdier kan findes andre fordelinger, for eksempel t-fordelingen.

SPSS

Sammenligning af to grupper Tjener mænd og kvinder lige meget? (Respons:Løn, Forklarende:Køn) Er andelen af helbredte kræftpatienter den samme for to forskellige typer kemoterapi? (Respons: helbredte patienter, Forklarende:Kemotype) Er andelen af overvægtige i 2006 den samme som andelen af overvægtige i 1999? (Forklarende: årstal, Respons: overvægtige) Kører en VW Touran og en Skoda det samme antal kilometer per liter? (Forklarende: Bilmærke, Respons: antal kilometer per l) Kører en VW Touran det samme antal kilometer per liter på almindelig benzin, som på bio benzin? (Forklarende: Benzin type, Respons: antal kilometer) Er der forskel på hvor mange mænd og kvinder, der benytter et værested for misbrugere? Er der forskel på hvor hurtigt man løber 5 km, når man har originale Nike sko og Super Nike sko på?

Afhængige og uafhængige stikprøver Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe. Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper. Kilometer per liter: Tilfældig stikprøve af Touraner og tilfældig stikprøve af Skodaer. Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer. Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touraner og test dem med de to forskellige typer benzin. Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.

Forklarende variabel og respons variabel. To grupper, der sammenlignes, udgør en bivariat variabel – dvs. en variabel, der kun har to kategorier, for eksempel mænd og kvinder. Denne variabel kaldes den forklarende variabel (eller den uafhængige variabel). Den variabel, der sammenlignes, kaldes respons variablen (eller den afhængige variabel), for eksempel løn. Når respons variablen er kvantitativ, sammenlignes middelværdier. Når respons variablen er kvalitativ, sammenlignes andele. Summeopgave: Se på eksemplerne – identificer respons og forklarende variabel og se på om responsen er kvalitativ eller kvantitativ.

Resten af forelæsningen Sammenligning af to middelværdier – store stikprøver Hypotesetest Konfidens interval Sammenligning af to andele Sammenligning af to middelværdier – små stikprøver Sammenligning af to middelværdier – parrede observationer

Sammenligning af to middelværdier – store stikprøver Population 1 Population 2

Sammenligning af to middelværdier – store stikprøver

Konfidens intervaller

Eksempel – er der forskel på hvor langt bilerne kører på 25 l. benzin?

SPSS

SPSS

SPSS Gennemsnit S S/√n Test størrelsen. SPSS bruger altid t-fordelingen og ikke z, da det er det mest korrekte. P-værdien Konfidensinterval

Sammenligning af to andele

Eksempel - Titanic Er andelen af mænd, der overlevede, den samme som andelen af kvinder, der overlevede?

Eksempel - Titanic

Konfidens interval for differencen mellem to andele

Små stikprøver SPSS som før!

Eksempel

Konfidensintervaller

Parrede observationer Nike Super 20 17 18 15 16 Nike Original 21 19 Lav differencer: Super-Original -1 -2 -5 1

SPSS

Eksempel Nike-sko Gennemsnit af differencer Teststørrelse P-værdi