Eksperimentel metode John Paulin Hansen ITC, Usability F2004.

Slides:



Advertisements
Lignende præsentationer
COMENIUS NAGOLD BRIEF PRESENTATION OF THE SCHOOLS FROM THE PROJECT COMENIUS.
Advertisements

Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Dagens program Kursusevaluering Information Spørgsmål om eksamen
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Dagens program  Emne: Tim Berners-Lees WWW koncept og deraf følgende innovationer Forbered hver for sig Præsenter og diskutér i grupper Fremlæggelse med.
Camptema 2013 Hvordan kan Henne-området udvikles og kvalitetsudvikles med fokus på børnefamilier ?
Etiske & metodiske problemer i online research - kort diskussionsoplæg.
Forretning og Ledelse lektion 7
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling,
Kvantitative metoder. Indsamlingsflow 4-ugers projekt 03 Web-popup på på dagligvarekoncerns hjemmeside som led i større Usability test Spurgte om: –køn,
Usability ITU, efterår Usability metoder 2. oktober 2008 Usability, IT-Universitetet Ole Gregersen.
Magtteori I 7. September 2005.
Database Normalization without Mathmatics
Psykologi, Human Factors og HCI
Eksperimentel metode John Paulin Hansen ITC, Usability F2003.
Magtteori II 14. September Én-dimensionel magt Aktøradfærd Aktuel magtudøvelse Politisk beslutningsproces Observerbar interessekonflikt = konflikt.
Biostatistics mm5 SPSS crash course II. But why? Hvorfor læser vi videnskabelig litteratur? Hvordan læser vi?
Case.
1 Dagens program 1.Information –Klaus’ frokost: 11:45-12:30, går 13:15. –Winston Churchill –Sidste forelæsning (19/11): Eksamen, kursus- evaluering, eksperimentelt.
Evidenshierarki eller - typologi
Dagens program 1.Information Alle projekter er godkendt Sumkurve 2.Opsamling T-test 3.Variansanalyse (one-way) ANOVA 4.Intro til projekt 3 (Excels LOPSLAG.
For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens.
Stil og smag John Paulin Hansen WEB 1, ITU, marts 2000.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Vælg layout 1. Højre klik uden for dit slide 2. Vælg et passende layout fra “drop ned” menuen 3. Bemærk at der findes 4 forskellige farvetemaer du kan.
Universel tilgængelighed (reduceret antal slides) John Paulin Hansen IT-højskolen i København.
Universel tilgængelighed John Paulin Hansen IT-højskolen i København.
Disposition Metode: MUST og etnografi Case: det særegne ved skønlitterær skrivning Design: hvad og hvem understøtter CONCERT.
Electric power is electric particles moving through metal, semiconductor or graphite and special fluids (electrolysis). Some kind of gas are able to conduct.
Usability 24. marts Tilgængelighed 2. Dagens øvelse 3. Spørgsmål.
Mobil Usability , ITU. Spørgsmål jeg gerne vil høre: ”Det gik lidt hurtigt, kan du ikke gentage?” ”Kan du ikke snakke lidt langsommere?” ”Skruer.
Psykologi, Human Factors og HCI John Paulin Hansen ITC, Usability f2003.
Critical appraisal ” All scientific work is incomplete – whether it be observational or experimental. All scientific work is liable to be upset or modified.
Heuristisk Evaluering / Ekspertgennemgang
Forretning og Ledelse lektion 7 Kultur og Strategi.
Kvantitative metoder.
Økonometri 1: Dummy variable1 Økonometri 1 Dummy variable 24. marts 2003.
Usability ITU, forår 2008 Usability ITU Forår 2008 ’Teori 2’ 3. kursusgang, 14. februar 2008.
Interview service in Statistics Denmark Structure and Surveys.
DB analyse og modellering Jesper Tørresø DAB1 F Februar 2008.
DIEB12.1 Kursusgang 12 Feedback fra en usability-evaluering Oversigt: Sidste kursusgang Opgaver Feedback Are Usability Reports Any Good? Alternativer til.
Sted og dato (Indsæt --> Diasnummer) Dias 1 Navn på enhed (Indsæt --> Diasnummer) Davenport et al. (2000) Vs Adelman et. Al (2002) Possible states for.
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 4.
Eksperimentel metode.
Eksperimentel metode HUSK HOVEDTELEFONER!. Den eksperimentelle metode Måler effekten af systematiske ændringer i uafhængige variable på den afhængige.
Project Management Managing The Progress of Projects.
2 minutter om tid (og rum) Lisbeth Klastrup 7. kursusgang 23. oktober.
Fremtidens bruger - brugervenlighed i fremtiden John Paulin Hansen, (11)
 Jens Bennedsen 2002Objektorienteret systemudvikling GRASP mønstre Basale ansvarsplaceringsregler.
ANALYSE AF WEBADFÆRD - OAW OAW – LEKTIONSGANG 4. ANALYSE AF WEBADFÆRD - OAW SUMMARY, LECTURE 3 (Extended) Common Log File Format Host, Ident, Authuser,
Mikkel deMib Svendsen Duplicate Content & Multiple Site Issue Mikkel deMib Svendsen
Omsætning af en model til en RDB Jesper Tørresø DAB1 F Marts 2008.
KFUM-Spejderne i Danmark General assembly KFUM-Spejderne i Danmark Conditions time spent in the conference hall should be minimized everybody should.
CEAC Hvad er det ? Hvad kan vi få ud af det ? v/ Dan Foldager.
Database Some walk through lv/ Figures & some text from: © Pearson Education Limited 1995,
Ændr 2. linje i overskriften til AU Passata Light 6TH OF OCTOBER 2015 AARHUS UNIVERSITET AU MASTER THESIS INFORMATION MEETING SOFIE VEJE AND JACOB BONDE.
THE MENTORING JOURNEY.
SCALE-UP DENMARK Tue David Bak Direktør, Innovation & Vækst, Region Sjælland & Formand for Scale-Up Denmark Thank you to the Ambassador, Mrs Louise Jespersen.
Completing secondary education
Videnskabeligt projekt
DB analyse og modellering
Compositional Design Principles “SemiCiv”
Software Testing Software testing.
MaaS i Europe Rasmus Lindholm.
Hot work Planning: 01.Februar 2008 Outdoor: 01.Februar 2008
Resuscitation with an AED
AIDA Reinsurance Working Party Meeting
Innovation og succes skabes gennem mennesker
FEANTSA Policy Conference – May 31st 2019
Præsentationens transcript:

Eksperimentel metode John Paulin Hansen ITC, Usability F2004

Den eksperimentelle metode Måler effekten af systematiske ændringer i uafhængige variable på den afhængige variabel - mens alle andre variable holdes konstant

Variable i GazeTalk eksperimentet Afhængige: –Word per minute –Error rate –Key stroke per Character –Subjektive ratings på spørgeskema Uafhængige: –Antal ordforslag –Dvæle eller klik

5 trin i et eksperiment 1. Definer problem og hypotese 2. Opstil den eksperimentelle procedure 3. Udfør eksperimentet 4. Analyser data 5. Uddrag konklusioner

Eksperimentelle designs –Two-group design: Eksperimentel gruppe og kontrolgruppe –Multiple group designs: Evaluere flere niveauer af den uafhængige variabel –Factorial design: kombinerer flere niveauer af to (eller flere) forskellige uafhængige variable –Between-subjects:to forskellige forsøgsgrupper –Within-subjects: samme person oplever alle niveauer af den uafhængige variable –Mixed design: bruger between-subjects på en uafhængig variabel i et et factorielt design og with-in på en anden uafhængig variabel

Design 2x2x2

Design af Gazetalk eksperiment Otte ordforslag Et ordforslag Skriveform museklik N = 12 N = 11 Skriveform dvæletid N = 10 N = 12

Resultateksempel WPM Otte ordforslag Et ordforslag Skriveform museklikWpm = 8,2 SD = 1,1 Wpm = 7,2 SD = 2,0 Skriveform dvæletidWpm = 6,9 SD = 2,2 Wpm = 4,2 SD = 2,1

Mange slags afhængige variable Ofte flere i samme forsøg Typer: Opgavetid, antal rigtige, antal fejl, præcision, antal falske alarmer, subjektive skalavurderinger, hjerterytme, galvanisk hud respons, pupilreaktioner, reaktionstid på secondary task, stresshormoner i blod, ekspertvurderinger af præstationer m.fl.

Eksperimentel planlægning Udstyr Deltagere Kontrol af andre variable - eg. ved tilfældig fordeling af opgaver til subjekter fra en homogen gruppe eller fra en stor gruppe med normal diversitet Neutraliser rækkefølge-effekten

Eksperimentet udføres Lav et pilot-forsøg for at sikre, at der ikke sker uventede ting Gennemfør forsøget med nøjagtig samme betingelser (eller stop det og lav et nyt forsøg) Sørg for at tjekke kalibrering af måleudstyr undervejs Overhold alle etiske regler

Data analyse Deskriptiv statistik: gennemsnit og standardafvigelsen Statistiske analyser: –T-test for two-group design –Anova hvis der er mere end to grupper –Udregner sandsynlighed for, at den fundne forskelle er tilfældige (p<0.05) –Type I fejl og type II fejl

Beskrivende metoder Målinger i den virkelige verden –Fx. fra web log filer –Hastighedsmålinger i trafikken Udvikle taxonomi til at score observationer –Ofte videooptagelser der scores Opinionsmålinger og spørgeskema-undersøgelser –Fra selvadministrerede til strukturerede interviews Hændelsesanalyser –Ulykkesrapporter og indberetninger i databaser

Dataanalyse ved beskrivende metoder Gruppeforskelle - ANOVA Relationer mellem kontinuerlige variable (korrelationskoefficient (r)) Komplekse modeller - kendes fx. fra makroøkonomiske modeller –Modeller kan være konceptuelle eller det kan være matematiske ligninger, vægte i et netværk m.m. –Eksempel ”COMBIMAN” som er en matematisk model for den menneskelige fysiognomi –Navigatørmodel til skibssimulatorer

Målinger af variable Hvordan måler man den mentale arbejdsbelastning ? –Ikke bare tælle samtidige arbejdsopgaver, for nogen af dem kan være automatiseret –I stedet har man fx. brugt: Subjektive angivelser Præstationsmålinger Fysiologiske målinger (hjernebølgeaktivitet og hjerterymer) Secondary task metoden

Objektive versus subjektive målinger Objektive målinger som fx. præstationer, fysiologiske data er efter manges mening bedre end subjektive angivelser I HCI forskning kan computeren samle enorme mængder af objektive data - men hvad siger de? Ofte fundet af subjektive data er de bedste til at forudsige senere reaktioner eller adfærd Det er ofte nemmere at indsamle subjektive data

Kvalitetskriterier for human factors forskning (1) Konstruktionsvaliditet: Manipulerede man den variabel man ville og målte man den rigtige afhængige variabel (er forsøgspersonerne virkelig trætte i et eksperiment om sammenhæng mellem fejlhyppighed og træthed) Intern validitet: Er det KUN de kausale variable der har været i spil?

Kvalitetskriterier for human factors forskning Ekstern validitet: Kan de fundne resultater bruges udenfor den eksperimentelle situation - er præmisserne beskrevet så klart, at de umiddelbart kan generaliseres? Etisk korrekthed: Har forsøgspersonerne været skånet for fysisk og psykisk overlast, er deres anonymitet bevaret, er de frivillige og har de vidst hvad de gik ind til?

Gazetalk Commercial cameras Type-to-talk Synthetic speech Freeware and Open Source Danish, English and Japanese versions

Request Date: Tue, 06 Feb :41: Hi there I stay in South Africa and my father has had a brain stem stroke. He cannot move or speak. He can communicate with his eyes. We are currently using an alphabet chart, but it takes too long and he gets tired quickly. I'm looking for some type of EyeMouse. Something we can plug into a PC, Design like a virtual keyboard. Can you please advise me. I will appreciate any help. Thanks Nuno Lourenco

Reply Dear Nuno, I'm sorry to tell you but eye trackers that are accurate enough for your father to indicate at which letter your father is looking at are much too expensive and are not available for private use. If your father still can hear, you can ask him to look left or right or up or down under certain conditions. It may work as a yes or no. Lo Bour, PhD Department of Neurology/Clinical Neurophysiology, H2-222 Academic Medical Centre, University of Amsterdam

System requirements Fast Robust Mobile Affordable Changes with progress of diseases

Progress of ALS disease (amyotrophic lateral sclerosis) Loss of voice Reduced control of arms and legs Reduced control of fingers Reduced head movements Just eye movements

Problems with some existing systems –Difficult or impossible to calibrate - needs helper –Mostly for stationary, indoor use –Requires a rather complicated installation by computer experts –The price is prohibitive (more than $)

Standard cameras and PC Advantages: –High availability –Instant operation –Low cost –Steady increase in performance –System support Video cam Web cam

Means - End

Dwell time selection Continuous dwell activation Accumulated dwell activation Adaptive dwell activation

Forbedringsforslag

Simulations and Experiments

Typing speed, 12 Danish student subjects Input: –PC-mouse –Smart Nav head tracker –Quickglance eye tracker Design: –12 sentences in each block –by 3 devices (counterbalanced) –in two days Results: –Learning effect for head and gaze –Mouse is fastest –No difference between head and gaze input

Typing speed, 15 Japanese student subjects Input: –PC-mouse –Smart Nav head tracker –Quickglance eye tracker Design: –12 sentences (including Kanji characters) –by 3 devices (counterbalanced) –in two days Results: –Learning effect –Mouse is fastest –No difference between head and gaze input

Errors Significant most errors for gaze typing Danish subjects made much more errors than Japanese subjects Significant drop in errors for head and gaze typing from day one to day two

Comments from novice users of gaze dwell time typing: ”A bit difficult to get used to not dwelling at un-intended buttons..” ”Difficult to orient yourself without activating something” ”It can be hard to keep starring at the buttons you want”

Subjective ratings, Danish & Japanese subjects

Possible improvements (1) Effectiveness -> use under all conditions –Allow for frames of glasses, larger head movements etc. –Dynamic scaling of button sizes –Seamless re-calibration

Improvements (2) Efficiency -> towards 25 wpm –Improved full-word typing in daily communication by location and context sensitivity –Easy undo –Feedback (audio, shrinking effect etc.) (cf. the TAUCCHI-group)

Improvements (3) Satisfaction -> to motivate user –Introduce the system at early stage, if possible –From “yes/no” to the full keyboard –Personalization of voice –Leisure activities (gaming, browsing and chat)

DASHER Developed by David Mackay, Cambridge University, with Stephen Hawking ”in mind” 25 WPM after one hour 34 WPM when expert Requires a ”Drivers license” ”Fast hands-free writing by gaze direction” Nature 418:838 (August 2002)

How fast is fast enough? ”It should be clear that speed, in itself, should not be an object, but rather proficiency and ease of operation. On the other hand, when there is a lot to say, or when there is a need for extensive personal interchange, a minimum speed of wpm is really needed to keep the thought moving” William G. Pierpont(2001): ”The art & skill of Radio-Telegraphy”

15 minutters opgave: Forsøgsdesign 1. Bliver man dårligere til at stave almindeligt dansk, når man benytter automatisk stavekontrol? 2. Hjælper det på effektiviteten af en fly-evakuering, at besætningen instruerer om nødprocedurer før take off ? 3. Har advarsler på tobaksannoncer nogen effekt på rygere ? 4. Hvad er den ideelle placering af knap-paneler på en hjemmeside: for oven, til venstre eller andre steder ? 5. Hvordan afbilder man mest effektivt et web-steds struktur med en knap-struktur ? 6. Hvad har størst betydning for om brugere kan huske en hjemmeside de har besøgt