Dagens program Kursusevaluering Repetition One way hhv. two way anova

Slides:



Advertisements
Lignende præsentationer
Case: Tekst på Call-To-Action link
Advertisements

Atomer Et programmeret forløb. En måde at lære på.
Dagens program Resumé - Normalfordelingen χ2-test (chi-i-anden)
Sandsynlighedsfordelinger
Hypotese test – kapitel 6 (Signifikans test)
Repræsentativitet Opsamling fra sidst Repræsentativitet (χ2-test)
Anvendt Statistik Lektion 3
Dagens program Kursusevaluering Information Spørgsmål om eksamen
Repræsentativitet Sandsynligheden for at få krone ved kast med en mønt
Statistik Lektion 6 Konfidensinterval for varians Hypoteseteori
Anvendt Statistik Lektion 4
Program Informationer χ2-test (chi-i-anden) Projekt 3
Bolig selskabernes Landsforening– Almene lejeboliger - Maj/Juni Almene lejeboliger - Danmarkspanelet - Maj/Juni 2010.
Anvendt Statistik Lektion 6
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 9
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Eksempel på brug af normalfordelingen
Anvendt Statistik Lektion 3
Anvendt Statistik Lektion 6
1 Collaboration and Control Crisis Management and Multimedia Technology in London Underground Control Rooms Christian Heath and Paul Luff Journal of Computer.
Psykologi, Human Factors og HCI
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 4. november 2005.
Eksperimentel metode John Paulin Hansen ITC, Usability F2003.
Dagens program 1.Information Hvordan går det med projekt 3 Evaluering 2.Opsamling Hvad er forudsætningerne for kausalitet? 3.Om eksperimenter 4.Variansanalyse,
Case.
Statistik Lektion 5 Log-lineære modeller.
Statistik Lektion 6 Konfidensinterval for andele og varians
Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Økonometri 1: Dummy variable
Signifikanstest ved (en eller) to stikprøver
Learning Objectives 5 Steps of a Significance Test Assumptions
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Dagens program Test of Independence (chi-i-anden) Videre med projekt 3
Statistik II 5. Lektion Log-lineære modeller.
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 7. april 2003.
Website-optimering gennem statistisk analyse (med GA Experiments)
Statistisk inferens Dagens program Grupper, opgave 1
Learning Objectives 5 Steps of a Significance Test Assumptions
Program 1.Påmindelser Pivottabeller og pivotgrafer Omkodning af data (sortering, søg-erstat) Bevar de originale data og lav kontroller 2.Hvem er målgruppen.
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik Lektion 7 Hypotesetest og kritiske værdier
Statistik II Lektion 4 Generelle Lineære Modeller
Anvendt Statistik Lektion 9
Grunde til at jeg elsker dig
Inge Henningsen Stat BK uge Sammenligning af regressionslinier Opsummering af regressionsanalyse (Gennemgang af udvidet version af eksamen Blok.
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Multipel Lineær Regression
Fundamentale datastrukturer
Statikstik II 2. Lektion Lidt sandsynlighedsregning
Statistik Lektion 7 Hypotesetest og kritiske værdier
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation, og dataproblemer 9. november 2004.
Carsten Stig Poulsen1 HA 4. semester Markedsanalyse 3. gang Torsdag d. 23. april 2009.
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Heteroskedaticitet (Specifikation og dataproblemer) 2. november 2005.
Simpel Lineær Regression
Økonometri – lektion 4 Multipel Lineær Regression Model Estimation Inferens.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Simpel Lineær Regression
Side Grundlæggende teoretisk statistik Hypotesetest: Test i 2 populationer.
Grundlæggende teoretisk statistik
Grundlæggende teoretisk statistik
Statistik Lektion 8 Test for ens varians.
Statikstik II 4. Lektion Generelle Lineære Modeller.
Statistik II 4. Lektion Logistisk regression.
Ellen Holm, Forskningscafé
Videnskabeligt projekt
Anvendt Statistik Lektion 6
Præsentationens transcript:

Dagens program Kursusevaluering Repetition One way hhv. two way anova Between groups hhv. within groups Teori Variansanalyse (two-way anova) Øvelser Forberedelse af kritik af opgave 2 (kl. 12 - 13) Øvelser i to vejs variansanalyse (kl. 13 – 13.45) 1

Problemstilling: Konversionsrate www.houseofkids.dk flyttede sit e-mærke op ved siden af indkøbskurven og opnåede et løft i konversionsraten på 32% !!! Kilde: www.emaerket.dk, klik på den orange knap: ”Bliv e-mærket her” for at læse casen.

Problemstilling: Konversionsrate (hitrate) Artiklen oplyser ingen antal, kun en procentsats. Konversionsraten: Andelen af besøgende, der køber. Stigning i konversionsraten kan eksempelvis beregnes til: (0,02-0,01) / 0,01 = 100% !!! Ved 100 besøgende på hjemmesiden E-mærke placering Køber Køber ikke ”Usynlig” 1 99 Synlig ved indkøbskurv 2 98 Hvad med andre ændringer af hjemmesiden? Betalingskort (Dankort, VISA, Mastercard, Diners Club, ...) Visuelt indtryk (billeder, farver, fonte), ... Sidens struktur, navigation, sprog, ...

Værktøj: Google Website Optimizer

Problemstilling: E-mærke og/eller betalingskort? Hvad skal en virksomhed gøre med sin hjemmeside for at øge salget? Tilmelde sin hjemmeside e-mærke ordningen og/eller Tilbyde flere betalingsmetoder, f.eks. Internationale betalingskort Bankoverførsel Andre betalingsmetoder De to tiltag e-mærke (ja / nej) med de fire betalingsmetoder giver otte kombi-nationer der kan påvirke salget, bl.a.: E-mærke og Dankort Ikke e-mærke og Dankort E-mærke og int. betalingskort Ikke e-mærke og internationale betalingskort E-mærke og ... ... E - mærke Betalings-metode Ja Nej Dankort Internationale kort Bankoverførsel Andre, fx. Paypal

Hypoteser Nul-hypotesen i en to faktor variansanalyse (two way anova) er, at populationernes middel-værdier på den ene faktor er ens, for hvert niveau af den anden faktor. Nul-hypotese: H0: Gns. salg med e-mærke = Gns. salg uden e-mærke, for hver betalingsmetode H0: μ11 = μ12 og μ21 = μ22 og μ31 = μ32 og μ41 = μ42 Der er ikke noget krav om, at μ11 = μ21 E - mærke Betalings-metode Ja Nej Dankort μ11 μ12 Internationale kort μ21 μ22 Bankoverførsel μ31 μ32 Andre, fx. Paypal μ41 μ42

Hypoteser Betalingsmetode E - mærke Dankort Internationale kort Bank-overførsel Andre metoder Ja μ11 μ12 μ13 μ14 Nej μ21 μ22 μ23 μ24 Nul-hypotesen i en to faktor variansanalyse (two way anova) er, at populationernes middelværdier på den ene faktor er ens, for hvert niveau af den anden faktor. Nul-hypotese H0: Gns. salg med Dankort = Gns. salg med int.betalingskort = Gns. salg med bankoverførsel = Gns. salg med andre betalingsmetoder H0: μ11 = μ12 = μ13 = μ14 og μ21 = μ22 = μ23 = μ24 Den individuelle effekt på salget fra de to faktorer kaldes hovedeffekter (main effects). Hvorvidt faktorerne har en effekt, testes i de to hypoteser.

Forudsætninger Populationsfordelingerne af de g responsvariable er normalfordelte og har samme standardafvigelse. Randomisering I stikprøvebaserede undersøgelser (surveys) stammer data fra g uafhængige stikprøver (fra de g populationer). I et eksperiment er forsøgsenhederne allokeret tilfældigt (randomly) på de g grupper.

ANOVAs teststørrelse F Til at teste hver faktors hovedeffekt benyttes teststørrelsen: Faktorens MS (Mean Square) er et variansestimat, der beregnes ud fra variationen mellem faktorens grupper (between groups) MS error er et variansestimat, der beregnes ud fra variationen indenfor faktorens grupper (within groups) Når nul-hypotesen om ens populationsmiddelværdier for faktorens g grupper er sand, svinger teststørrelsen omkring 1. Jo større variationen er mellem grupper (between groups) i fht. variationen indenfor grupper (within groups), des større bliver teststørrelsen. Jo større F er, des stærkere er beviserne mod H0 9

Eksempel: Effekt af e-mærke og betalingsmetode En virksomhed overvejer, om den skal: Benytte til e-mærke ordningen på sit site eller fortsætte uden. Tilbyde betaling med internation-ale kort eller fortsætte med Dankort alene Fire kombinationer af de to tiltag kan påvirke salget: E-mærke og Dankort E-mærke og int. betalingskort Ikke e-mærke og Dankort Ikke e-mærke og int. betalingskort Den første dag, hvor E-mærket blev vist samtidig med Dankort, var salget kr. 13,700,- Betalingsmet. E-mærke U. mærke Kun Dankort 13,7 15,0 15,8 15,1 13,9 12,0 16,6 15,7 15,5 12,2 Int. betal.kort 16,4 12,4 12,5 10,6 14,1 14,4 8,7 10,9

Eksempel: Data og ANOVA i Excel I Excel vælges Data Analyse (efter installation af Analysis ToolPak) og derefter ANOVA: Two-Factor With Replication Antallet observationer oplyses og signifikansniveauet sættes (til 5 %) Bemærk det specielle krav til opstilligen af data

Eksempel: ANOVA output fra Excel

Eksempel: ANOVA output fra Excel

Eksempel: Hypotese vedr. betalingsmetode Nul-hypotese H0: Gns. salg med Dankort = Gns. salg med internationale betalingskort, både med og uden e-mærket H0: μ11 = μ12 og μ21 = μ22 Excels output viser for betalingsmetode, at P er 0,018; hvilket er under 5% Den lille P værdi er stærke beviser mod H0, hvorfor vi afviser H0 og tror på, at betalingsmetoden (Dankort eller internationale kort) har betydning for salget

Eksempel: Hypotese vedr. e-mærket Nul-hypotese: H0: Gns. salg med e-mærke = Gns. salg uden e-mærke, for hver betalingsmetode Excels output viser for E-mærket, at P er 0,023; hvilket er under 5 %. Den lille P værdi er stærke beviser mod H0, hvorfor vi tror på, at E-mærket har betydning for salget

Interaktion Hvis effekten (salget) fra den ene faktor skifter ved forskelliger niveauer af den anden faktor, er der interaktion mellem de to faktorer. Man tester for interaktion, før man tester for hovedeffekter. Nul-hypotesen er, at der ingen interaktion er, H0: Ingen interaktion. Excel udskriver teststørrelsen og P-værdi for interaktionseffekten. P=0,311 i eksemplet, hvorfor vi opretholder nul-hypotesen om ingen interaktion.

Interaktion Ingen Interaktion E - mærke Betalings-metode Ja Nej Dankort 15,1 14,0 Internat. kort 13,9 11,3 Interaktion E - mærke Betalings-metode Ja Nej Dankort 15,1 14,0 Internat. kort 13,9 16,2

Fremgangsmåde ved tovejs ANOVA Hovedeffekternes nul-hypotese er, at populationernes middel-værdier på den ene faktor er ens, for hvert niveau af den anden faktor. Det er meningsløst at teste hypoteserne om hovedeffekter, hvis der er interaktion mellem de to faktorer. Derfor tester man først hypotesen om ingen interaktion. Hvis der ikke er tegn på interaktion (dvs. hvis P ikke er lille), tester man hypoteserne om hovedeffekter. Hvis der er tegn på interaktion, tester man gennemsnittene for en faktor, for hvert niveau på den anden faktor. I begge situation tegner man grafer med de to faktorers gennemsnit.

Fordelen ved tovejs ANOVA Med to faktorer er det også en mulighed at gennemføre 2 envejs ANOVA, i stedet for 1 tovejs ANOVA, men en tovejs analyse... Frembringer mere viden. Den fortæller om der er interaktion. Er billigere end at gennemføre 2 envejs analyser.