Sammenligning af to grupper

Slides:



Advertisements
Lignende præsentationer
Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Advertisements

Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Hypotese test – kapitel 6 (Signifikans test)
Anvendt Statistik Lektion 3
Dagens program Kursusevaluering Information Spørgsmål om eksamen
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Akademi Merkonomer Statistik Aften 5
Statistik Lektion 17 Multipel Lineær Regression
Program Informationer χ2-test (chi-i-anden) Projekt 3
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Anvendt Statistik Lektion 6
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 5
Sammenligning af to grupper – kapitel 7
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
Akademi Merkonomer Statistik Aften 6
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Statistik og kvantitativ metode Politik & Administration og Samfundsfag 3. semester 2007 Lektion 5, tirsdag den 23. oktober Punkt- og intervalestimering.
Case.
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 2
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Signifikanstest ved (en eller) to stikprøver
Learning Objectives 5 Steps of a Significance Test Assumptions
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Statistik – Lektion 2 Uafhængighed Stokastiske Variable
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
Statistik Lektion 3 Bernoulli og binomial fordelingerne
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri 1: Binær responsmodeller: Logit og probit1 Økonometri 1 Binær responsmodeller: Logit og probit 8. maj 2003.
Fejl  Afleveringen  Stikprøvestørrelse  Type I-II Fejl  Styrkefunktionen.
Grundlæggende teoretisk statistik
Anvendt Statistik Lektion 9
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Økonometri 1: F121 Økonometri 1 Heteroskedasticitet 27. oktober 2006.
Simpel Lineær Regression
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 6 Konfidensinterval for andele
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Økonometri – lektion 5 Multipel Lineær Regression
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 22. marts 2006.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Konfidensintervaller og Hypotesetest
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Økonometri 1: F51 Økonometri 1 Den multiple regressionsmodel 22. september 2006.
Økonometri 1: Den simple regressionsmodel Økonometri 1 Den simple regressionsmodel 13. februar 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Kvantitativ metode del 1 Gymnasielærer-kursus forår 2007 Aalborg Universitet Sammenhænge ml. variabler, styrke og signifikans Tirsdag den 20. marts, kl.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 29. oktober 2004.
Samarbejde mellem matematik og samfundsfag. Disposition Indledning Hvorfor skal vi bruge 2 i samfundsfag? Hvordan kan matematikken bruges? Eksempel. Oplæg.
Anvendt Statistik Lektion 8
Anvendt Statistik Lektion 4
Anvendt Statistik Lektion 6
Præsentationens transcript:

Sammenligning af to grupper Repetition, herunder om kritiske værdier Sammenligning af to grupper: Sammenligning af to middelværdier Sammenligning af to andele Sammenligning af to varianser

Hypoteser og hypotesetest. En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable, for eksempel: ”Er middelværdien af de 3.semesters HA studerendes vægt lig med 70 kilo?” I en hypotesetest (signifikanstest) testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 68 kilo. Er det (signifikant) forskellig fra 70? Det er forskellig fra 70, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhænger af eksempelvis stikprøvestørrelsen. En hypotesetest består af 5 elementer: antagelser, hypoteser, test størrelse, p-værdi og beslutning/konklusion.

Test af middelværdi Antagelse: Test af m, X kvantitativ variabel og n>30. Hypoteser: Stikprøve fordeling af når H0 er sand er approksimativ normal med middelværdi og standard afvigelse Teststørrelse: . 8 7 6 5 4 3 2 1 0 x

Eksempel H0: m = 30 H1: mm 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: P-værdi: Lille p-værdi, så H0 forkastes. Fordeling: . 8 . 7 . 6 . 5 . 4 . 3 . 2 .017 .017 . 1 . 0=30 x- x

P-værdi og forkastelse af H0 Når nul hypotesen er falsk, er p-værdien meget lille og når nul hypotesen er sand, vil p-værdien være stor (større end for eksempel 0.05). Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand.

Signifikans niveau Signifikans niveauet a er et tal, således at H0 forkastes, hvis p-værdien er mindre end a. Er normalvis 0.05 eller 0.01. Vælges før analysen foretages. Hvis man tester på signifikans niveau 0.05, svarer det til en z-værdi på 1.96 i en to-sidet test og 1.645 i en højresidet test. Normal ses dog på p-værdien i stedet, da de i de fleste tilfælde ikke er smart at have en standard procedure for om man forkaster eller ej. Konklusion P-værdi H0 H1 P<0.05 Forkast Accepter P>0.05 Forkast ikke Accepter ikke

Kritiske værdier, to-sidet test, α=0.05 Eksemplet er for standard normal fordelingen. Tilsvarende kritiske værdier kan findes andre fordelinger, for eksempel t-fordelingen.

Eksempel H0: m = 30 H1: mm 30 Stikprøve: n = 50 = 31.5 s = 5 Test størrelse: Kritiske værdi: Da 2,12 > 1,96 forkastes H0 (eller hvis den var mindre end -1,96) Hvis højresidet test, dvs. H1:μ>30: Da 2,12 > 1.645 forkastes H0 Hvis venstresidet test, dvs. H1:μ<30: Da 2,12 ikke er mindre end -1,645, forkastes H0 ikke

Sammenligning af to grupper Tjener mænd og kvinder lige meget? (Respons: Løn, Forklarende: Køn) Er andelen af helbredte kræftpatienter den samme for to forskellige typer kemoterapi? (Respons: helbredte patienter, Forklarende: Kemotype) Er andelen af overvægtige i 2006 den samme som andelen af overvægtige i 1999? (Forklarende: årstal, Respons: overvægtige) Kører en VW Touran og en Skoda det samme antal kilometer per liter? (Forklarende: Bilmærke, Respons: antal kilometer per l) Kører en VW Touran det samme antal kilometer per liter på almindelig benzin, som på bio benzin? (Forklarende: Benzin type, Respons: antal kilometer) Er der forskel på hvor mange mænd og kvinder, der benytter et værested for misbrugere? Er der forskel på hvor hurtigt man løber 5 km, når man har originale Nike sko og Super Nike sko på?

Afhængige og uafhængige stikprøver Ved en uafhængig stikprøve udtages en stikprøve fra hver gruppe. Mænd og kvinders løn: Tag en stikprøve fra gruppen af mænd og en stikprøve fra gruppen af kvinder og sammenlign gennemsnitslønnen for de to grupper. Kilometer per liter: Tilfældig stikprøve af Touran’er og tilfældig stikprøve af Skoda’er. Ved en afhængig stikprøve er observationerne i de to grupper parrede. Oftest er det den samme person/genstand, der bliver observeret i to forskellige situationer. Bio benzin kontra almindelig benzin: Vælg tilfældigt et antal VW Touran’er og test dem med de to forskellige typer benzin. Original Nike sko kontra Super Nike sko: Vælg tilfældigt nogle personer til at løbe 5 km og lad dem teste begge par sko.

Forklarende variabel og respons variabel. To grupper, der sammenlignes, udgør en bivariat variabel – dvs. en variabel, der kun har to kategorier, for eksempel mænd og kvinder. Denne variabel kaldes den forklarende variabel (eller den uafhængige variabel). Den variabel, der sammenlignes, kaldes respons variablen (eller den afhængige variabel), for eksempel løn. Når respons variablen er kvantitativ, sammenlignes middelværdier. Når respons variablen er kvalitativ, sammenlignes andele. Summeopgave: Se på eksemplerne – identificer respons og forklarende variabel og se på om responsen er kvalitativ eller kvantitativ.

Resten af forelæsningen Sammenligning af to middelværdier – kendt varians Hypotesetest Konfidens interval Sammenligning af to middelværdier – ukendt varians Sammenligning af to andele Sammenligning af to middelværdier – parrede observationer Sammenligning af to varianser Hypotese test

Sammenligning af to middelværdier – kendte varianser og store stikprøver eller populationer normalfordelte Population 1 Population 2

Sammenligning af to middelværdier – kendte varianser og store stikprøver eller populationer normalfordelte

Konfidens interval

Eksempel – er der forskel på hvor langt bilerne kører på 25 l. benzin?

SPSS

SPSS

SPSS

Ukendt varians, normalfordeling Hvis store stikprøver, bruges z i stedet for t-fordelingen. Bogen bruger z, når n1 og n2 er større end 30. SPSS regner altid med t-fordelingen

Eksempel

Konfidens intervaller

Sammenligning af to andele, p1=p2, store stikprøver

Eksempel - Titanic Er andelen af mænd, der overlevede, den samme som andelen af kvinder, der overlevede?

Eksempel - Titanic H0 forkaste, da p-værdi=0

Sammenligning af to andele, p1-p2=D, store stikprøver

Konfidens interval for differencen mellem to andele

Parrede observationer Lav differencer: Nike Super 20 17 18 15 16 Nike Original 21 19 Super-Original -1 -2 -5 1 Beregn selv eksemplet til opgaveregningen!

F fordelingen og test for lighed af to populations varianser F fordelingen er fordelingen af brøken af to chi-i-anden stokastiske variable, der er uafhængige og hver er divideret med antallet af dens frihedsgrader. En F fordelt stokastisk variable med k1 og k2 frihedsgrader:

F tabellen Critical Points of the F Distribution Cutting Off a Right-Tail Area of 0.05 k1 1 2 3 4 5 6 7 8 9 k2 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 F D i s t r i b u t i o n w i t h 7 a n d 1 1 D e g r e e s o f F r e e d o m . 7 . 6 . 5 ) F . 4 ( f . 3 . 2 . 1 . F 1 2 3 4 5 3.01 F0.05=3.01 Det venstresidet kritiske punkt, der hører til F(k1,k2) er givet ved: hvor F(k2,k1) er det højresidet kritiske punkt for en F fordelt stokastisk variabel, men det omvendte antal frihedsgrader.

Kritiske punkter i F fordelingen F(6, 9),  = 0.10 5 4 3 2 1 . 7 6 F f ( ) D i s t r b u o n w h a d 9 e g m F0.05=3.37 F0.95=(1/4.10)=0.2439 0.05 0.90 Det højresidet kritiske punkt: F(6,9) =3.37 Det tilsvarende venstresidet punkt:

Test for ens varians 1 = 2 I: Tosidet test: H0: 1 = 2 H1: 2 II:Ensidet test 12 H0: 1  2 H1: 1  2

Eksempel 8-10