Brugergrænseflader til apparater BRGA Presentation 9: Sound & Speech.

Slides:



Advertisements
Lignende præsentationer
COMENIUS NAGOLD BRIEF PRESENTATION OF THE SCHOOLS FROM THE PROJECT COMENIUS.
Advertisements

SharePoint /36 2 General SettingsPermissions and ManagementCommunications Titel, description and navigation Versioning settings Advanced settings.
IT Projekt Portefølje Management: styringsmæssige og koordineringsmæssige problemer i en offentlig organisation.
Opfølgning på obligatorisk opgave 1
GSAK – helt fra start Hvad er GSAK ? Download og installation GSAK
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
IceQuery™ Nyt liv til dine Queries
Præsentation: Obligatorisk opgave 1
Formularer (Access, del 3)
VoiceXML og stemmestyrede interfaces VoiceXML – stemmestyrede interfaces (Voice Extensible Markup Language)
SMUT PAKKE 4 VIDEN OM MOTION.
E-bøger gennem PrioInfo - oversigt v/ Claes Olsson.
Giv medarbejderne adgang til centrale systemer – lige ind i Office Inspirationsseminar 31. oktober 2006.
Kursus om borger.dk og brugen af digital signatur
Beskyt & bevar kontrol med information CRM LOB ERP Find information, viden & øget indsigt i forretning Enklere samarbejde mellem mennesker Reducerede.
Introduktion til Access (Access, del 1)
Opfølgning på obligatorisk opgave 1
Agenda 1.Informationer 1.Excel i fb.m. projekt 2 2.Reserver tid til projekt 2 3.Øvelse: a / b = c 2.Opsamling fra sidst 3.Estimation (konfidensintervaller)
Niels Pein Regelopdatering Niels Pein Udpluk af nyhederne Definitioner Regler Decisions.
Brugergrænseflader til apparater BRGA Presentation 9: Sound & Speech.
For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”. Indføj ”Sted og dato” i feltet for dato og ”Enhedens.
Stil og smag John Paulin Hansen WEB 1, ITU, marts 2000.
Globaliseringsredegørelsen 24.mar. 14 Figurer fra Danmark tiltrækker for få udenlandske investeringer i Sådan ligger landet
Slide 1 of 11 © Ingeniørhøjskolen i Århus Presentation 14: Callbacks Objektorienteret Middleware (TIOOMI)
AJAX/Otto Knudsen 1 AJAX Motivation Definition. AJAX/Otto Knudsen 2 Motivation En typisk web-applikation er synkron klienten sender en forespørgsel og.
MSBuild & Team Build i C#/C++ solutions VSTS ERFA d. 25 November.
Rapporter (Access, del 5). RHS – Informationsteknologi – Udgangspunkt Vi har oprettet en database Vi har defineret en eller flere tabeller, og.
Præsentation af Aalborg Universitet 1 af 24 UWT seminar 2010 Jesper Ellerbæk Nielsen ”Combining C-band and X-band weather radars for accurate precipitation.
Electric power is electric particles moving through metal, semiconductor or graphite and special fluids (electrolysis). Some kind of gas are able to conduct.
Introduktion til Access (Access, del 1). RHS – Informationsteknologi – Fra design til udvikling Vi ved nu, hvordan vi finder et design for en database,
DATATYPER. For at tilpasse hvert felt i databasen til dets formål og dermed øge funktionalitet 1 bit er tilstrækkelig til at angive køn (0/1) men for.
Introduction of the Norwegian Language Made by Ole Kristian, Iselin, Martin and Adrian.
Mobil Usability , ITU. Spørgsmål jeg gerne vil høre: ”Det gik lidt hurtigt, kan du ikke gentage?” ”Kan du ikke snakke lidt langsommere?” ”Skruer.
Heuristisk Evaluering / Ekspertgennemgang
CORBA/e CORBA and Embedded Systems OOMI 27. November 2006.
Personal Leadership Bachelor of Leisure Management.
Fremstilling af Simple WEB steder [ITPL] Foråret 2004
Forretning og Ledelse – Lektion 7
Oprettelse af tabeller (Access, del 2)
Office kampagne Partnertræningsdag Gitte Casparij Marketing Manager, Small Business
PivotTable i MS Excel Se evt. teksten til opgave 18 kap Start MS Excel og åben filen exped.dbf som du finder på hjemmesiden sammen med denne vejledning.
Usability ITU, forår 2008 Usability ITU Forår 2008 ’Teori 2’ 3. kursusgang, 14. februar 2008.
Velkommen Vi starter kl Hvis du vil vide mere om Microsoft BI... Spørg en af os ved standen i foyéen Se kursustilbud og data sheet i din deltagermappe.
Virtualitet - i historie Fagdidaktik, Middelfart Eigil Møller
Kjeld Svidt  Institut for Byggeri og Anlæg  Aalborg Universitet IT i Byggeriet Semester 6, kursusgang Databaser (1) Kjeld Svidt
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 11.
DB analyse og modellering Jesper Tørresø DAB1 F Februar 2008.
HCI - Tale som in-/output Kan vi kommunikere med computere ved hjælp af tale? –Ex: billetbestilling, nummeroplysningen, computersupport, etc. Hvornår vil.
Sted og dato (Indsæt --> Diasnummer) Dias 1 Navn på enhed (Indsæt --> Diasnummer) Davenport et al. (2000) Vs Adelman et. Al (2002) Possible states for.
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 4.
DIEB10.1 Kursusgang 10 Oversigt: Sidste kursusgang Eksempler på løsning af opgaven Arkitektur for brugergrænsefladen og for systemet Dokumentation af designet.
Agenda Introduktion Interfacet –Interfacet –Metaforer (Peter) Emotional branding –Gobé The ten commandments –Thyssen (Vigdis) Æstetik og nydelse –Jordan.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
 Jens Bennedsen 2002Objektorienteret systemudvikling GRASP mønstre Basale ansvarsplaceringsregler.
ANALYSE AF WEBADFÆRD - OAW OAW – LEKTIONSGANG 4. ANALYSE AF WEBADFÆRD - OAW SUMMARY, LECTURE 3 (Extended) Common Log File Format Host, Ident, Authuser,
Learning Set 3 : Lesson 1 : Slide 1 Proteins Move Based on Size lactase tyrosinase.
Mikkel deMib Svendsen Duplicate Content & Multiple Site Issue Mikkel deMib Svendsen
CEAC Hvad er det ? Hvad kan vi få ud af det ? v/ Dan Foldager.
IT-dag den 6/8 Present.me. Present.me - intro Hvad er Present.me? Present.me er et præsentationsredskab Tre muligheder: PowerPoint+lyd PowerPoint+video.
Drug/Device Combination Products IFF erfagruppemøde
Completing secondary education
DB analyse og modellering
Software Testing Software testing.
Denitrification in the root zone
MaaS i Europe Rasmus Lindholm.
Simpel test-client (javascript) Session og Application data
Introduktion Presentation of the HARDI 6500 Controller.
Resuscitation with an AED
Smart Data Tool (SDT) In Sales
WiseFlow En introduktion i anvendelsen af Wiseflow
Præsentationens transcript:

Brugergrænseflader til apparater BRGA Presentation 9: Sound & Speech

Ingeniørhøjskolen i Århus Slide 2 af 26 Agenda Audiotory Interfaces Speech recognition & artificial speech Types of SUI Design challenges Multimodal UI’s Technologies

Ingeniørhøjskolen i Århus Slide 3 af 26 Hermes

Ingeniørhøjskolen i Århus Slide 4 af 26 Speech & Auditory Interfaces Usage –Sound is used extensively for feedback, both speech and sound effects along with other interaction devices –When users have vision/movement impairments, users with hands or eyes occupied with other tasks, or if cramped/harsh conditions makes other input devices inappropriate –Speech generation (artificial speech): used e.g. in GPS-based navigation systems (“turn right next”) –Speech recognition – in different configurations Pro’s & con’s, qualities & deficiencies –Speech is intuitive for all users –Speech recognition is only slowly gaining acceptance, and quality is still not acceptable for many applications –Takes up no space on device (appliances can be made very small) and does not require the use of hands nor eyes for operation, that is, no direct contact –Slow pace of speech output when compared to visual displays (we read faster than we listen) –Interference from noisy environments renders devices unusable –Unstable recognition across changing environments, users and time

Ingeniørhøjskolen i Århus Slide 5 af 26 Audiotory Interfaces Use a different sense than the visual Most often used for feedback -> multimodal Tactile feedback replacement Familiar sounds: –Auditory icons Abstract sounds: –Earcons 3D Sound support drivers & pilots

Ingeniørhøjskolen i Århus Slide 6 af 26 When is speech input appropriate?

Ingeniørhøjskolen i Århus Slide 7 af 26 When is speech output appropriate

Ingeniørhøjskolen i Århus Slide 8 af 26 Where might it be used?

Ingeniørhøjskolen i Århus Slide 9 af 26 Speech teknologi Vocabulary size (number of words) S p e a k i n g s t y l e Spontaneous speech Fluent speech Read speech Connected speech Isolated words Unrestricted t messaging Kræver større processor Pocket PC i dag Stor PC i dag

Ingeniørhøjskolen i Århus Slide 10 af 26 Enkelt bruger - lille ordforråd Ring til banken ! Talestyret opkald. Kendes fra fx Mobiltelefoner med indbygget talegenkendelse (mønstergenkendelse) Skal trænes af den enkelte bruger med det aktuelle ordforråd. Der benyttes DTW (simpel mønstergenkendelse)

Ingeniørhøjskolen i Århus Slide 11 af 26 Enkelt bruger - stort ordforråd Kære Anette Det var vel nok dejligt... Kære Anette Det var vel nok dejligt... Dikteringsprogrammer - foreløbigt kun til hovedsprogene. Systemet skal trænes med tale og helst også dokumenter (typiske formuleringer)

Ingeniørhøjskolen i Århus Slide 12 af 26 Mange brugere - stort ordforråd Det koster 4 kr og 50 ører i minuttet at ringe til Spanien.. Hvad koster det at ringe til Spanien Dialogsystemer med talegenkendelse. Skal kunne betjenes af alle -> ingen træning Kræver meget processorkraft Kræver avanceret dialogdesign

Ingeniørhøjskolen i Århus Slide 13 af 26 Udfordringer i VUI design Forbigående oplysninger: ”Hvad sagde du/den?” ”Recognition over Recall” – vi kan kun overskue 5-9 elementer Usynlighed: ”Hvad kan jeg sige nu?” Asymmetri: Hvem siger hvor meget? Lange lister er kedelige tidsrøvere Kalenderprogrammer bruger absolutte datoer – mennesker bruger tit relative Menuer gør funktionalitet synlig for brugeren i en GUI – ikke muligt i en VUI Talegenkendelsens kvalitet Talesyntesens kvalitet

Ingeniørhøjskolen i Århus Slide 14 af 26...i over-morgen På onsdag 14 dage... Sidst på ugen... Midten af november... I uge Eksempel: Angivelse af tid  Lidt over ti Kvart over tre – godt og vel Fem minutter over halv seks Sytten tredive Middag Efter- middag

Ingeniørhøjskolen i Århus Slide 15 af 26 Design af stemmestyring (1/3) Feedback og ventetid –Pauser til processering forvirrer brugeren –Tale er en langsom måde at videregive informationer –Behov for feedback på handlinger Bekræftelse af fremsøgte data ”Var det den?” Bekræftelse af handlinger der ændrer data ”Vil du gemme denne?” ”Vil du slette denne?”

Ingeniørhøjskolen i Århus Slide 16 af 26 Feedback og ventetid (eksempler) Brugeren skal kende nuværende tilstand –”Regner maskinen stadig, eller venter den på at jeg siger noget?” –”Hørte den mig overhovedet? Forstod den det?” Eksplicit feedback –”Vil du betale regningen til TeleDanmark Internet på 1647 kroner? Svar med ja eller nej” Implicit feedback –”For øjeblikket er vejret i Odense blæsende og koldt”

Ingeniørhøjskolen i Århus Slide 17 af 26 Design af stemmestyring (2/3) At spørge om det rigtige… –Afvejning mellem fleksibilitet og præcision –Få svarmuligheder => bedre genkendelse Eksplicitte spørgsmål begrænser brugeren Implicitte spørgsmål tillader fleksibelt input Afkortning af spørgsmål Trinvise spørgsmål kan øge hastigheden for eksperter og hjælpe begynderen...på den rigtige måde –Undgå ”min tur / din tur”-forvirring

Ingeniørhøjskolen i Århus Slide 18 af 26 At spørge om det rigtige… Eksplicit spørgsmål: –”Sig ja, nej eller afbryd” Implicit spørgsmål: –Bruger: ”Send mail til Kurt” –System: ”Mener du Kurt Thorsen eller Kurt Ravn?

Ingeniørhøjskolen i Århus Slide 19 af 26 Fejlhåndtering, eksempler Øget hjælp –”Hvilken dato?” bliver til ”Undskyld, gentag lige det. Gerne lidt tydeligere” bliver til ”Det forstod jeg ikke – prøv at sige datoen som dag-måned-år” Skift til eksplicitte spørgsmål –”Sagde du kassekredit? Svar ja eller nej” –Tillad brug af trykknapper ”Du kan svare ja ved at trykke på ”1”, nej ved at trykke på ”2”

Ingeniørhøjskolen i Århus Slide 20 af 26 Multimodal Interaction Devices Many appliances makes use of several interaction devices This helps overcome the inherent weaknesses in the different interactions devices – e.g. use a small screen for displaying prompts, sound for making the user aware, and allowin speech rec for data input As an example both the EuroFighter and the Joint Strike Fighter project relies on a multimodal user interface, including: –Traditional ”joystick” controls –Panel keyboard control –Magnetic Head Tracker –360° X-Ray Vision Helmet (virtual reality?) –360° HUD display –3D audio com & warning sound system –Speech recognition software

Ingeniørhøjskolen i Århus Slide 21 af 26 Multimodal Interaction Devices Cell phones – the Sony Ericsson P800 Data entry –Regular key pad classic cell phone data entry –Touch Screen write recognition & virtual QWERTY –Display for browsing, pictures, messages –Sound interface for notification –Simple voice command for placing calls

Ingeniørhøjskolen i Århus Slide 22 af 26 Hermes – multimodal robot Voice Controlled Multimodal Almost doubling efficiency of surgeons Trained for individual voices Will only accept commands from selected individual Solves problem

Ingeniørhøjskolen i Århus Slide 23 af 26 User studies Natural Dialog Studies Wizard-of-Oz Studies ”Normal” Usability Studies

Ingeniørhøjskolen i Århus Slide 24 af 26 Technologies available Custom-made recognizers and TTS –For embedded devices VoiceXML / SALT –For use over the Internet –PC, Windows CE (including Pocket PC) –Microsoft Speech Server Microsoft Speech API 5.1 (COM component) –For use with Windows PC’s –Enables C# programming –No Pocket PC IBM ViaVoice Others …

Ingeniørhøjskolen i Århus Slide 25 af 26 VoiceXML vs (X)HTML Vælg mellem Nyheder, Vejret eller Sport. [ nyheder vejret sport ] Vælg sektion Nyheder Vejret Sport

Ingeniørhøjskolen i Århus Slide 26 af 26 Links og litteratur developers.motorola.com/developers/voicexml/ (blot et eksempel på en voicegateway-udbyder) ”How to Build a Speech Recognition Application” Bruce Balentine & David P. Morgan