VoiceXML og stemmestyrede interfaces VoiceXML – stemmestyrede interfaces (Voice Extensible Markup Language)

Slides:



Advertisements
Lignende præsentationer
KONFLIKTHÅNDTERING Velkommen! Dias.
Advertisements

Hvem er vi? Martin Dahl Karin Dam Nielsen
Vi er overbevist om at livet vil være perfekt når vi bliver gift og får et barn......og et til.... Så bliver vi frustrerede over at vores børn ikke er.
Teknik event i det mørke Jylland IV, 16. Januar 2010GPSmap 60CSx vs. Oregon 550T 1 GPSmap 60SCx vs. Oregon 550T  Baggrunden for dette indlæg  Skærmen.
Hvordan bruger jeg MinInstitution?
Ved egen kraft Marte Meo En udviklingsstøttende metode
©Jenny Bohr – Til underviserne Her er valgt at vise filmen ”et liv i kaos”. Hvis kursisterne er unge, kan man vælge en anden film eks. ”det.
Forsiden 1.Denne knap bruges når du vil taste dagens resultater ind. 2.Denne knap skal kun bruges hvis du allerede har gemt data og du finder ud af at.
Klik på Aktivér redigering på meddelelseslinjen.
SEO (Search Engine Optimization) - Hvordan bliver du mere synlig på nettet?
•Et ord der bruges for at afslutte en samtale, når de har ret og du skal klappe kajen.
Læringsmiljø på hhx; kvaliteter og udfordringer Temaoplæg 2: IKT i undervisningen på hhx DEA, 13. Oktober 2010 Ph.d.-stipendiat, Arnt Louw Vestergaard.
Uddannelsesdag for kursusledere og efteruddannelsesvejledere Fra viden på kursus til handling i praksis Møde om God læring.
Udlægning af en ny cache
Samarbejde med eller uden Service Level Agreement (SLA)
Konference d. 14. april. Program • Hej • Mine erfaringer • For / imod • Prøve • Frederiks historie • Kristians historie • Kristian demo • Henrik demo.
TEST 1 modul 1 20 spørgsmål. Du skal klikke med musen på det rigtige svar, så kommer du automatisk til næste spørgsmål Klik for start.
Præsentationen starter automatisk. Som du synes. Slå højttalerne til.
Klik på Aktivér redigering i meddelelseslinjen, Hvis videoerne i kurset ikke afspilles, skal du måske hente QuickTime eller blot skifte til PowerPoint.
– Sådan virker det! Dit elektroniske postsystem Ved Arne Crown Rasmussen
IceQuery™ Nyt liv til dine Queries
Præsentation: Obligatorisk opgave 1
Innovation og iværksætteri
Formularer (Access, del 3)
Opstart i forretningen • Hvad var det smarteste du så? • Tjene eller spare penge! • 2 måder at starte på: • Lille eller stor forretning • Min. et test.
Alder Navn Dato SSQ12 SSQ12 Instruktioner Jeg bruger ét høreapparat (venstre øre) Jeg bruger ét høreapparat (højre øre) Jeg bruger to høreapparater (begge.
Årsaftale projekt Tidslinie © due & partners
Skriv titel Synlig læring med it Agerbæk Skole og Starup Skole 2013
Pinpoint.
Fortællinger fra kanten
Hvad betyder ventetid for det enkelte menneske?
1 Velkommen til brugerinstruktion, It-Universitet.
©Jenny Bohr – Til underviserne Voksne med ADHD har ofte mange negative erfaringer med sig. Mange har fået megen skæld ud som børn, og de.
Giv medarbejderne adgang til centrale systemer – lige ind i Office Inspirationsseminar 31. oktober 2006.
Søgning - et værktøj til videndeling Inspirationsseminar 31. oktober 2006.
FORTROLIGT. Må kun distribueres til partnere med aftale om hemmeligholdelse. Microsoft giver ingen garantier, hverken udtrykkeligt eller stiltiende. ©
Mød Microsoft – for udviklere & arkitekter Visual Studio, Express og Team System Niels Hilmar Madsen Microsoft
DK-CLARIN Workspace Struktur - Arbejdsbænk / Workbench Værktøj Ressource Ny ressourceEgen mappe 1DKClarin (KMIV)
XML1 4.7 XML and Its Data Model. XML2 Introduktion til XML, 178 XML = eXtensible Markup Language Markup language –sprog, hvor data "pakkes ind" i tags.
GP5, Martin Lillholm 1 Grundlæggende Programmering (GP) Efterår 2005 Forelæsning 5 Slides ligger på nettet. Du er velkommen til at printe dem nu. Vi begynder.
Opfølgning på obligatorisk opgave 1 ONK1. Ingeniørhøjskolen i Århus Slide 2 Overordnet Flere gode opgaver De samme fejl går igen.. Alle der har afleveret.
18 – Java Server Faces. 2 NOEA2009Java-kursus – JSF 2 Web-applikationer - 1 Brugere interagerer med en Web-browser Browseren sender forespørgsler til.
Præsentation 28: Eksamen Objektorienteret Middleware.
1 Webdesign - De første trin Grundliggende begreber Internettet (1969-): En fællesbetegnelse for netværk eller tjenester der benytter samme.
Øvelsesgang 1 - DWDK Rikke Poulsen. Timernes indhold supplement til læsningen og forelæsningen Jeres behov? Gennemgang af opgaverne? Andre emner, i vil.
Brugergrænseflader til apparater BRGA Presentation 9: Sound & Speech.
1 HMAK XMLRelationel model og XMLNOEA / PQC 2005 SQLServer og XML Hent data via URL Generering af xml –Raw –Auto –Explicit Hent data via template Evt.
MMP Model og Metode til Programudvikling – MMP 1 Kursusindhold: Modellering af postkontor Objekt Orienteret Programudvikling - OO* Unified Modelling.
Stig Irming-Pedersen ASP.NET MVC Partner Copenhagen Software.
Opfølgning på obligatorisk opgave 1 ONK1. Ingeniørhøjskolen i Århus Slide 2 af 14 Overordnet Generelt rigtigt fine opgaver –Mange fyldt med gode overvejelser.
AJAX/Otto Knudsen 1 AJAX Motivation Definition. AJAX/Otto Knudsen 2 Motivation En typisk web-applikation er synkron klienten sender en forespørgsel og.
Udregning af UseCasePoints UCP = UUCP*TCF*EF UseCasePoint = Ujusteret Use Case Point * Tekniske Komplexitets Faktor * Miljø Mæssige Faktor.
OPSTART VI STARTER OM LIDT! Der bliver ikke optjent nogen kompensation hos ACN, med mindre der er formidlet kunder. Ingen uafhængig ACN-repræsentant er.
OPSTART VI STARTER OM LIDT! Der bliver ikke optjent nogen kompensation hos ACN, med mindre der er formidlet kunder. Ingen uafhængig ACN-repræsentant er.
OPSTART VI STARTER OM LIDT! Der bliver ikke optjent nogen kompensation hos ACN, med mindre der er formidlet kunder. Ingen uafhængig ACN-repræsentant er.
Brugergrænseflader til apparater BRGA Presentation 9: Sound & Speech.
Introduktion til Access (Access, del 1). RHS – Informationsteknologi – Fra design til udvikling Vi ved nu, hvordan vi finder et design for en database,
Interaktionsformer En begrebsmæssig model kan understøttes med forskellige interaktionsformer Interaktionsformen fastlægger centrale egenskaber: Hvordan.
DIEB4.1 Kursusgang 4 Oversigt: Sidste kursusgang Opgaver Aktivitet 2: Generer design (fortsat) Design af interaktionselementer.
Mobil Usability , ITU. Spørgsmål jeg gerne vil høre: ”Det gik lidt hurtigt, kan du ikke gentage?” ”Kan du ikke snakke lidt langsommere?” ”Skruer.
Intro Siden sidst: evaluering på opgaver og virtuel kursus.
Fremstilling af Simple WEB steder [ITPL] Foråret 2004
HCI - Tale som in-/output Kan vi kommunikere med computere ved hjælp af tale? –Ex: billetbestilling, nummeroplysningen, computersupport, etc. Hvornår vil.
Udvikling af mobilsites Einar Gislason / FTF. Mobilsites Mobilvenlige sites.
Intro Siden sidst: evaluering på opgaver og virtuel kursus.
Kommunikation Hvad er det og hvordan udvikler vi bedst muligt sproget sammen med vores børn? Hej jeg hedder Mette og er dagtilbuddets sprogvejleder, jeg.
Formularer (Access, del 3). RHS – Informationsteknologi – Udgangspunkt Vi har oprettet en database Vi har defineret en eller flere tabeller Vi.
Call Center, adm kursus, indledning Indledning (registrering af kursister & præsentation) 10 min. Hjælpeværktøjer 5 min. System overblik 30 min. Administrator.
Formular designer – Basis Efterår 2016 Tilst
1.08 Test.
Præsentationens transcript:

VoiceXML og stemmestyrede interfaces VoiceXML – stemmestyrede interfaces (Voice Extensible Markup Language)

VoiceXML og stemmestyrede interfaces Stemmestyring – pro et contra Hvorfor: Det er intuitivt, ambient og ”nomadisk” og alle kan tale Det kræver ikke investering i ny teknologi for brugeren Fremtidens – især telefoni-applikationer – vil kræve andre interaktionsformer Teknologier bliver mindre og mindre Hvorfor ikke: Det kan være hunde- svært at lave (naturligt sprog er komplekst) Stemmen er ikke den mest diskrete interaktionsform Egner sig ikke til alle typer services SAS bizzline

VoiceXML og stemmestyrede interfaces Spektret af stemmestyring Ring op! Brev - Hej mormor og morfar – jeg fik min første tand i dag... Mange stemmer – få udtryk Få stemmer – rigtig mange udtryk Voice XML

VoiceXML og stemmestyrede interfaces Hvor vil det blive brugt?

VoiceXML og stemmestyrede interfaces Stemmestyring IVR (interactive voice response): Målet er næsten naturlig tale –C: Velkommen til MegaBank, hvad kan jeg gøre for dig? –B: Øh, jeg vil gerne vide hvor mange penge jeg har på min konto. –C: Du har både en kassekredit og en lønkonto – hvilken af dem mener du? –B: Nå ja, det har jeg da også. Øh, kassekreditten –C:

VoiceXML og stemmestyrede interfaces Udfordringer i VUI design Forbigående oplysninger: ”Hvad sagde du/den?” Usynlighed: ”Hvad kan jeg sige nu?” Asymmetri: Hvem siger hvor meget? Talegenkendelsens kvalitet Talesyntesens kvalitet Lange lister er kedelige tidsrøvere GUI navne (f.eks. på knapper) er ikke talesprog Kalenderprogrammer bruger absolutte datoer – mennesker bruger tit relative Menuer gør funktionalitet synlig for brugeren i en GUI – ikke muligt i en VUI

VoiceXML og stemmestyrede interfaces...i over-morgen På onsdag 14 dage... Sidst på ugen... Midten af november... I uge Eksempel: Angivelse af tid  Lidt over ti Kvart over tre – godt og vel Fem minutter over halv seks Sytten tredive Middag Efter- middag

VoiceXML og stemmestyrede interfaces Design af stemmestyring

VoiceXML og stemmestyrede interfaces Design af stemmestyring (1/3) Feedback og ventetid –Pauser til processering forvirrer brugeren –Tale er en langsom måde at videregive informationer –Behov for feedback på handlinger Bekræftelse af fremsøgte data ”Var det den?” Bekræftelse af handlinger der ændrer data ”Vil du gemme denne?” ”Vil du slette denne?” SJ Røstsvar

VoiceXML og stemmestyrede interfaces Feedback og ventetid (eksempler) Brugeren skal kende nuværende tilstand –”Regner maskinen stadig, eller venter den på at jeg siger noget?” –”Hørte den mig overhovedet? Forstod den det?” Eksplicit feedback –”Vil du betale regningen til TeleDanmark Internet på 1647 kroner? Svar med ja eller nej” Implicit feedback –”For øjeblikket er vejret i Odense blæsende og koldt” SAS

VoiceXML og stemmestyrede interfaces Design af stemmestyring (2/3) At spørge om det rigtige… –Afvejning mellem fleksibilitet og præcision –Få svarmuligheder => bedre genkendelse Eksplicitte spørgsmål begrænser brugeren Implicitte spørgsmål tillader fleksibelt input Afkortning af spørgsmål Trinvise spørgsmål kan øge hastigheden for eksperter og hjælpe begynderen...på den rigtige måde –Undgå ”min tur / din tur”-forvirring SAS

VoiceXML og stemmestyrede interfaces At spørge om det rigtige… Eksplicit spørgsmål: –”Sig ja, nej eller afbryd” Implicit spørgsmål: –Bruger: ”Send mail til Kurt” –System: ”Mener du Kurt Thorsen eller Kurt Ravn?

VoiceXML og stemmestyrede interfaces Fejlhåndtering, eksempler Øget hjælp –”Hvilken dato?” bliver til ”Undskyld, gentag lige det. Gerne lidt tydeligere” bliver til ”Det forstod jeg ikke – prøv at sige datoen som dag-måned-år” Skift til eksplicitte spørgsmål –”Sagde du kassekredit? Svar ja eller nej” –Tillad brug af trykknapper ”Du kan svare ja ved at trykke på ”1”, nej ved at trykke på ”2”

VoiceXML og stemmestyrede interfaces Brugerens rolle ved VUI design Observation af dialoger –Lad brugerne tale sammen mens en bestemt opgave løses, og udtræk dialogens ”regler” (svarer til tænke-højt-metoden) ”Manden i maskinen” –Lad en udvikler ”lege” stemmestyring Og som sædvanligt –Kan brugerne rent faktisk løse deres opgaver gennem brug af applikationen? Nannas pizzabiks

VoiceXML og stemmestyrede interfaces VoiceXML

VoiceXML og stemmestyrede interfaces Hvad er VoiceXML? En anvendelse af XML En sammenblanding af flere forskellige tale og telefoni relaterede teknologier. –Automated Speech Recognition (ASR) –Text-to-Speech Synthesis (TTS) –DTMF (Dual Tone Multi Frequency) –Interactive Voice Response (IVR)

VoiceXML og stemmestyrede interfaces The Big Picture

VoiceXML og stemmestyrede interfaces The Bigger Picture

VoiceXML og stemmestyrede interfaces Arkitektur Telefoni platform Servere Tale- genkendelse Tale- verifikation Tale-syntese Prompts Grammatiker Call Flow Session manager, ubruger profiler etc. Backend integration Business logik Publishing engine Enterprise applikationer Databaser Messaging Hardware Tale Præsentation Middleware Data

VoiceXML og stemmestyrede interfaces VoiceXML vs (X)HTML Vælg mellem Nyheder, Vejret eller Sport. [ nyheder vejret sport ] Vælg sektion Nyheder Vejret Sport

VoiceXML og stemmestyrede interfaces Dialoger 1/2 Et VoiceXML dokument er sammensat af dialoger To top-level dialog elementer –Forms: –Menus: Andre top-level elementer Metadata som kendt fra HTML Bruges til erklæring af variable ECMAScript (Client side JavaScripting) Lytter efter events (f.eks. Help) Fælles reference for alle dialoger i dette scope

VoiceXML og stemmestyrede interfaces Dialoger 2/2 Directed –Dialogen følger den orden, som informationerne (form elementerne) optræder i –C: ”Vil du have adgang til din kassekredit eller budgetkonto?” –B: ”Kassekredit” –C. ”Vil du hæve eller overføre penge?” –B: ”Hæve” Mixed Initiative –Dialogen har flere indfald og udfald –C: ”Velkommen til Mega Bank. Hvad kan vi hjælpe med?” –B: ”Jeg vil gerne overføre 1000 kroner fra min kassekredit til min budgetkonto” –C: ”Tak. Er det korrekt opfattet, at du vil overføre 1000 kroner fra konto XXXX-XXXX til budgetkonto XXXX-XXXX?” –B: ”Ja”

VoiceXML og stemmestyrede interfaces Mixed Initiative Dialog <!DOCTYPE vxml PUBLIC '-//Voxpilot/DTD VoiceXML 1.0//EN' ' Velkommen til Nannas pizza biks. Må jeg tage imod din bestilling?..... Se hele eksemplet Se grammatikken Nannas pizzabiks

VoiceXML og stemmestyrede interfaces Form Items (1/3) Field Items: Input fra bruger indsamles og videreføres i variable (field item variables) Input fra bruger via tale (ASR) eller DTMF, specificeret via en grammatik Optager lyd indtalt af bruger Overføre kald til anden telefonlinie Bruges til at kalde programmer (Java, Corba, andet) svar returneres som et ECMAScript objekt Kald til anden dialog eller dokument, svar som ECMAScript object

VoiceXML og stemmestyrede interfaces Form Items (2/3) Control Items: Blok instruktioner til gruppering Indhold udføres/oplæses, bruges til at gruppere handlinger Bruges til mixed-initiative dialoger

VoiceXML og stemmestyrede interfaces Form Items (3/3) Events: Hvis input ikke matcher grammatik, kan følgende events benyttes. Kan bruges til at specificere hjælp til brugeren. Denne del udføres hvis intet input registreres Udføres hvis input ikke matcher grammatik Hvis brugeren har svaret forkert på en gentagne gange, kan bruges

VoiceXML og stemmestyrede interfaces VoiceXML – pro et contra Pro Det er en standard Generaliseret Velkendte og velafprøvede teknologier og teknikker Det virker! Contra Kræver adgang til gateway Understøttelsen af andre sprog end engelsk er ringe Microsofts opbakning er måske ikke helhjertet

VoiceXML og stemmestyrede interfaces VoiceXML – og de andre drenge i klassen Diverse proprietære produkter – fx Phillips’ Speechmania CCXML – Call Control eXtensible Markup Language SALT - Speech Application Language Tags W3C’s Voice Browser initiativ – modulariseret XHTML

VoiceXML og stemmestyrede interfaces Links og litteratur developers.motorola.com/developers/voicexml/ (blot et eksempel på en voicegateway-udbyder) ”How to Build a Speech Recognition Application” Bruce Balentine & David P. Morgan