Eksperimentel metode John Paulin Hansen ITC, Usability F2003.

Slides:



Advertisements
Lignende præsentationer
Kombinatorik, sandsynlighed og statistik
Advertisements

GAF Samrating & Statistik.
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Dagens program Kursusevaluering Information Spørgsmål om eksamen
Afsætning og matematik Eksemplificeret ved materiale fra STELTON
Usability E2002, IT-højskolen CPH, Paulin Hansen Fjernstyret og automatiseret usability John Paulin Hansen (7)
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Kvantitative metoder. Indsamlingsflow 4-ugers projekt 03 Web-popup på på dagligvarekoncerns hjemmeside som led i større Usability test Spurgte om: –køn,
Statistik Lektion 3 Simultan fordelte stokastiske variable
Anvendt Statistik Lektion 9
Anvendt Statistik Lektion 5
Sammenligning af to grupper
Sammenligning af to grupper – kapitel 7
Anvendt Statistik Lektion 6
Statistik og sandsynlighedsregning
Ekspertvurderinger og tilstandstjek John Paulin Hansen 7 september 2011 DUST.
Psykologi, Human Factors og HCI
Biostatistics mm5 SPSS crash course II. But why? Hvorfor læser vi videnskabelig litteratur? Hvordan læser vi?
Case.
Anvendt Statistik Lektion 8
Dagens program Kursusevaluering Repetition One way hhv. two way anova
Økonometri 1: Dummy variable
Signifikanstest ved (en eller) to stikprøver
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Økonometri 1 Gentagne tværsnit og panel data I. 2 Gentagne tværsnit og paneldata: Oversigt Observationer over individuelle enheder og tid: Wooldridge.
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
Anvendt Statistik Lektion 9
Statistik for geografer
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Hypotesetest Hypotesetest og kritiske værdier Type 1 og Type 2 fejl
Økonometri 1 Gentagne tværsnit og panel data I 13. november 2006.
Kombinatorik, sandsynlighed og statistik
Mobil Usability , ITU. Spørgsmål jeg gerne vil høre: ”Det gik lidt hurtigt, kan du ikke gentage?” ”Kan du ikke snakke lidt langsommere?” ”Skruer.
Psykologi, Human Factors og HCI John Paulin Hansen ITC, Usability f2003.
Grundlæggende teoretisk statistik
Statistik for geografer
Statistik Lektion 2 Betinget sandsynlighed Bayes’ regel
Økonometri 1: Specifikation og dataproblemer1 Økonometri 1 Specifikation og dataproblemer 2. november 2004.
Kvantitative metoder.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Økonometri 1: Inferens i den multiple regressionsmodel1 Økonometri 1 Inferens i den multiple regressionsmodel 3. marts 2003.
Kvantitative metoder 2: Den multiple regressionsmodel1 Kvantitative metoder 2 Den multiple regressionsmodel 26. februar 2007.
Økonometri 1: F41 Økonometri 1 Den multiple regressionsmodel 18. september 2006.
Kvantitative metoder 2: F31 Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 15. februar 2006.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 31. marts 2003.
Statistik PM5 Indhold: statistiske metoder til at analysere kategoriske data Logistisk regression Loglineære modeller I dag: repetition af lineær regression.
Eksperimentel metode.
Eksperimentel metode HUSK HOVEDTELEFONER!. Den eksperimentelle metode Måler effekten af systematiske ændringer i uafhængige variable på den afhængige.
Eksperimentel metode John Paulin Hansen ITC, Usability F2004.
Normalfordelingen og Stikprøvefordelinger
Økonometri 1: Dummyvariabler1 Økonometri 1 Dummyvariabler 12. oktober 2005.
Statistik II 4. Lektion Logistisk regression.
Økonometri 1: Heteroskedasticitet1 Økonometri 1 Heteroskedasticitet 27. marts 2003.
Økonometri 1: Den multiple regressionsmodel1 Økonometri 1 Den multiple regressionsmodel 17. september 2004.
Biostatistik ST8 Carsten Dahl Mørch Fredrik Bajers Vej 7 D2-109
Viden kan være erfaringsbaseret eller forskningsbaseret
Den multiple regressionsmodel 21. september 2005
Kapitel 5: Tabeller og sammenhænge
Videnskabeligt projekt
Titel på naturvidenskabsprojekt
Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Naturvidenskabelig metode
Niveau 2: Hypotesetestning
Program – dag 2 (11. april 2011) Dag 2:
Anvendt Statistik Lektion 6
Titel på videnskabeligt projekt
Videnskabeligt projekt
Teoretiske kontinuerte fordelinger
Præsentationens transcript:

Eksperimentel metode John Paulin Hansen ITC, Usability F2003

Den eksperimentelle metode Måler effekten af systematiske ændringer i uafhængige variable på den afhængige variabel - mens alle andre variable holdes konstant

Variable i GazeTalk eksperimentet Afhængige: –Word per minute –Error rate –Key stroke per Character –Subjektive ratings på spørgeskema Uafhængige: –Antal ordforslag –Skriveform

5 trin i et eksperiment 1. Definer problem og hypotese 2. Opstil den eksperimentelle procedure 3. Udfør eksperimentet 4. Analyser data 5. Uddrag konklusioner

Eksperimentelle designs –Two-group design: Eksperimentel gruppe og kontrolgruppe –Multiple group designs: Evaluere flere niveauer af den uafhængige variabel –Factorial design: kombinerer flere niveauer af to (eller flere) forskellige uafhængige variable –Between-subjects:to forskellige forsøgsgrupper –Within-subjects: samme person oplever alle niveauer af den uafhængige variable –Mixed design: bruger between-subjects på en uafhængig variabel i et et factorielt design og with-in på en anden uafhængig variabel

Design 2x2x2

Design af Gazetalk eksperiment Otte ordforslag Fire ordforslag Skriveform museklik N = 12 N = 11 Skriveform dvæletid N = 10 N = 12

Resultateksempel WPM Otte ordforslag Fire ordforslag Skriveform museklikWpm = 8,2 SD = 2,1 Wpm = 7,2 SD = 2,0 Skriveform dvæletidWpm = 6,9 SD = 2,8 Wpm = 4,2 SD = 3,1

Mange slags afhængige variable Ofte flere i samme forsøg Typer: Opgavetid, antal rigtige, antal fejl, præcision, antal falske alarmer, subjektive skalavurderinger, hjerterytme, galvanisk hud respons, pupilreaktioner, reaktionstid på secondary task, stresshormoner i blod, ekspertvurderinger af præstationer m.fl.

Eksperimentel planlægning Udstyr Deltagere Kontrol af andre variable - eg. ved tilfældig fordeling af opgaver til subjekter fra en homogen gruppe eller fra en stor gruppe med normal diversitet Neutraliser rækkefølge-effekten

Eksperimentet udføres Lav et pilot-forsøg for at sikre, at der ikke sker uventede ting Gennemfør forsøget med nøjagtig samme betingelser (eller stop det og lav et nyt forsøg) Sørg for at tjekke kalibrering af måleudstyr undervejs Overhold alle etiske regler

Data analyse Deskriptiv statistik: gennemsnit og standardafvigelsen Statistiske analyser: –T-test for two-group design –Anova hvis der er mere end to grupper –Udregner sandsynlighed for, at den fundne forskelle er tilfældige (p<0.05) –Type I fejl og type II fejl

Lindsay and Staffon (1988) nuclear control interface

Increase of temperatures

Time tunnels in an unstable state

4 experimental displays

Analysis 3 factor analysis of variance (ANOVA) with the factors: –Display format (4 levels), –Data type (3 levels “slow”, “medium” an “Noise”) –Information type (2 levels: graphical and graphical plus digital).

Reaction time

Hit rate on all data types

Hit rate on HF data

Conclusion “ Both the temporal and the configural dimension seem important for the design of effective process displays. The result …… suggest that the spatial integration of temporal information in the time tunnel format shows promise as a support for process data when targets are to be detected in the presence of noise” (Human Factors, 37 (3), )

Eksempel: Mate

Beskrivende metoder Målinger i den virkelige verden –Fx. fra web log filer –Hastighedsmålinger i trafikken Udvikle taxonomi til at score observationer –Ofte videooptagelser der scores Opinionsmålinger og spørgeskema-undersøgelser –Fra selvadministrerede til strukturerede interviews Hændelsesanalyser –Ulykkesrapporter og indberetninger i databaser

Dataanalyse ved beskrivende metoder Gruppeforskelle - ANOVA Relationer mellem kontinuerlige variable (korrelationskoefficient (r)) Komplekse modeller - kendes fx. fra makroøkonomiske modeller –Modeller kan være konceptuelle eller det kan være matematiske ligninger, vægte i et netværk m.m. –Eksempel ”COMBIMAN” som er en matematisk model for den menneskelige fysiognomi –Navigatørmodel til skibssimulatorer

Målinger af variable Hvordan måler man den mentale arbejdsbelastning ? –Ikke bare tælle samtidige arbejdsopgaver, for nogen af dem kan være automatiseret –I stedet har man fx. brugt: Subjektive angivelser Præstationsmålinger Fysiologiske målinger (hjernebølgeaktivitet og hjerterymer) Secondary task metoden

Objektive versus subjektive målinger Objektive målinger som fx. præstationer, fysiologiske data er efter manges mening bedre end subjektive angivelser I HCI forskning kan computeren samle enorme mængder af objektive data - men hvad siger de? Ofte fundet af subjektive data er de bedste til at forudsige senere reaktioner eller adfærd Det er ofte nemmere at indsamle subjektive data

Kvalitetskriterier for human factors forskning (1) Konstruktionsvaliditet: Manipulerede man den variabel man ville og målte man den rigtige afhængige variabel (er forsøgspersonerne virkelig trætte i et eksperiment om sammenhæng mellem fejlhyppighed og træthed) Intern validitet: Er det KUN de kausale variable der har været i spil?

Kvalitetskriterier for human factors forskning Ekstern validitet: Kan de fundne resultater bruges udenfor den eksperimentelle situation - er præmisserne beskrevet så klart, at de umiddelbart kan generaliseres? Etisk korrekthed: Har forsøgspersonerne været skånet for fysisk og psykisk overlast, er deres anonymitet bevaret, er de frivillige og har de vidst hvad de gik ind til?

20 minutters opgave: Forsøgsdesign 1. Bliver man dårligere til at stave almindeligt dansk, når man benytter automatisk stavekontrol? 2. Hjælper det på effektiviteten af en fly-evakuering, at besætningen instruerer om nødprocedurer før take off ? 3. Har advarsler på tobaksannoncer nogen effekt på rygere ? 4. Hvad er den ideelle placering af knap-paneler på en hjemmeside: for oven, til venstre eller andre steder ? 5. Hvordan afbilder man mest effektivt et web-steds struktur med en knap-struktur ? 6. Hvad har størst betydning for om brugere kan huske en hjemmeside de har besøgt