SpeechLogic & NISLab Nordtalk 2002 2002-12-05 LD/HD Measuring transaction success in spoken dialogue information systems Hans Dybkjær SpeechLogic™, Prolog.

Slides:



Advertisements
Lignende præsentationer
Crowdsourcing in Danish Archives Asbjørn Hellum, Denmark.
Advertisements

VIS HJÆLPELINJER SOM ER EN HJÆLP VED PLACERING AF LOGO: 1.Højreklik på den aktuelle side og vælg ’gitter og hjælpelinjer’ 2. Sæt kryds ved ’Vis’ tegnehjælpelinjer.
Indsæt nyt billede: Format: B 254 x 190,5 mm Efter indsættelse, højreklik på billedet og placér det bagerst. Delete det gamle foto Legal aid in Denmark.
High Growth Initiatives in Denmark
Teknik og Miljø - Planlægning og Byggeri Aarhus Kommune •Flemming Meyer •Master of Law, Special Consultant •Municipality of Aarhus •Department of employment.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
VIS HJÆLPELINJER SOM ER EN HJÆLP VED PLACERING AF LOGO: 1.Højreklik på den aktuelle side og vælg ’gitter og hjælpelinjer’ 2. Sæt kryds ved ’Vis’ tegnehjælpelinjer.
Indsæt nyt billede: Format: B 254 x 190,5 mm Efter indsættelse, højreklik på billedet og placér det bagerst. Delete det gamle foto New production system.
Vejledning om videregående uddannelser Studievalg.
Læreruddannelsen i Århus Nordic Geogebra Network Copenhagen 21 September 2013.
Dagens program  Emne: Tim Berners-Lees WWW koncept og deraf følgende innovationer Forbered hver for sig Præsenter og diskutér i grupper Fremlæggelse med.
HA-Intro 2013 Præsentation af 24-timers case Gruppenr.: Holdnr.:
Head Project Management-gruppe. Stakeholder contracting & Gode rapporteringsformer.
Select one of the 3 title pages and delete the others. Please do not create new title pages by using the layouts Title 1 – 3 as these layouts do not contain.
Langmarkskolen 6a. Flag  The name of the Danish flag is :  Dannebrog  The legend says at the Danish flag fell down from heaven.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
The Danish Lesson Center for Second Language Studies August 23, 2011 VMS.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Forside Titel Navn, sted eller begivenhed, dato. CHALLENGES FOR THE BANKING SECTOR - IN THE AFTERMATH OF THE CRISIS Louise C. Mogensen Deputy Chief Executive.
Tekst starter uden punktopstilling For at få punkt- opstilling på teksten, brug forøg indrykning For at få venstre- stillet tekst uden punktopstilling,
Unit 1 English Summative Assessment, Poem
SOME eller ANY Joan Neesgaard Continue Tryk på F5-tasten for at starte! og derefter Continue…
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Modul 1 (B) Rød løber Tid: 30 minutter. Spilleregler for dagen.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Arne Winther Et værdifuldt samarbejde mellem hospital og produktudvikler.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Indsæt nyt billede: Format: B 254 x 190,5 mm Efter indsættelse, højreklik på billedet og placér det bagerst. Delete det gamle foto Model-Driven Development.
View Procedures Trigger og Function Jesper Tørresø DAB1 E07 1. november 2007.
Portfolio. Portfolio – what? Portfolio is used in more ways –Product or presentation –Process –Learning –Evaluation Often we distinguish between a learning.
Algoritmer og Datastrukturer 1 Greylisting Gerth Stølting Brodal.
Database Normalization without Mathmatics
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
PUMA kursus - ekstern finansiering 2011 Slide 1 For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Vis” > ”Sidehoved / Sidefod”.
Microsoft Solutions for Management Peter Colsted Direktør Enterprise & Partner Group Microsoft Danmark.
Kulturstudier M, KA Art Worlds Hvem skaber kunsten?
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Litteratursiden / forfattere / anmeldelser / analyser / lister / temaer / læseklubber / video / brugere Digital communication of performance literature.
CUSTOMER JOURNEYS 12/9.
1 Welcome! The search process:  How to handle the search process (strategies)  Transform your topic into search terms  Search techniques  how to use.
Overskrift 40/42 pkt, Maks 2 linjer Underoverskrift, 14/16 pkt For at vise hjælpelinjer: 1.Højreklik på slidet og vælg “Gitter og hjælpelinjer” 2.Kryds.
Magistrenes Arbejdsløshedskasse side 1 Welcome to MA Odense.
Programering af mobile enheder Windows Phone Storage.
Vækst i events og festivaler Introduktion. Hvordan skaber man vækst i events?
Linking international students and Danish businesses.
Agenda 1.Informationer 1.Excel i fb.m. projekt 2 2.Reserver tid til projekt 2 3.Øvelse: a / b = c 2.Opsamling fra sidst 3.Estimation (konfidensintervaller)
LÆR FOR LIVET NORDIC FOSTER CARE ASSOCIATION Rødovre 6. september 2014.
Basics of pain research Abhishek Kumar and Lilja K. Dagsdóttir (PhD Scholars) Section of Clinical Oral Physiology Department of Dentistry, Aarhus University,
KLAR TIL NYE MULIGHEDER
Nyt tværfagligt innovations tilvalgskursus på DTU Diplom Vil du bruge din faglighed i tværdisciplinært samarbejde med ingeniørstuderende fra andre retninger?
Reliable Architecture Ved Henrik Bærbak Christensen Reflective Architectures Emne: reflective architecture overview 11 december 2009.
Stil og smag John Paulin Hansen WEB 1, ITU, marts 2000.
Erfaringer og dialog omkring transforms AFP/PDF/AFP AFP Brugergruppemøde Maj 2012 Jørgen Ulrich.
Tekstslide i punktform Rubrik, helst 1 linje Brug ”Forøg/Formindsk indryk” for at få de forskellige niveauer frem Danish Standards  Signe Annette Boegh.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 11.
Interview service in Statistics Denmark Structure and Surveys.
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 4.
Compositional Design Principles “SemiCiv”
Software Testing Software testing.
MaaS i Europe Rasmus Lindholm.
AIDA Reinsurance Working Party Meeting
Teacher Tips for Success
The Effects of Depressants on the Pulse Rate of Lumbriculus Variegatus
To: The Class of 2020 From: Your CAP Advisor
Farming Grain in Alberta
Structure and Organization in Interpretation of Literature Essays
CS 3800 Switch/Router Lab Project Introduction
The Nested Splat! Series
Scientific Method – Steps 1-2
Præsentationens transcript:

SpeechLogic & NISLab Nordtalk LD/HD Measuring transaction success in spoken dialogue information systems Hans Dybkjær SpeechLogic™, Prolog Development Center A/S & Laila Dybkjær NISLab, University of Southern Denmark

SpeechLogic & NISLab Nordtalk LD/HD Assessing results? •Subjective listening –Fine and important –Not suitable for contracts –Not suited for tracing progress –Very dependent on mood of caller •Transcript walkthroughs –Fine, provides many observations –Not suitable for contracts –Not suited for tracing progress •Transaction coding –Suitable for contracts –Suitable for tracing progress? •Huge work...

SpeechLogic & NISLab Nordtalk LD/HD Project and partners •Holiday Account (“FerieKonto”) spoken dialogue service via the telephone •September 2001 – December 2002 •Supported by the Danish government •Three Danish partners: –NISLab, SDU –Prolog Development Center A/S (PDC) –ATP-huset (hosts FerieKonto and other funds) •Employers pay 700 M kr. to FerieKonto per year •About selected “general information” in old touch-tone system per year •Philips Speech Processing sub-contractor to PDC

SpeechLogic & NISLab Nordtalk LD/HD Facts on FAQ •Phase 1 called ”Vejled” in operation since September •Phase 2, FAQ, in operation medio December 2002 •Dialogue model –About 40 A4-pages –80 semantic concepts in input –100+ different information stories in output –About 800 (full) words in vocabulary –About 2500 grammar lines •Context free with synthesized attributes –450 pre-recorded phrases, many long

SpeechLogic & NISLab Nordtalk LD/HD Characteristics •System takes initiative and guides user –User may take initiative and control system •Barge-in, i.e. the user may interrupt the system –But we don’t know where, i.e. for long output we don’t know how much of logged output they have heard •Whatever the user says is recognised as something withing system vocabulary and grammar •No sound output logged, only user input

SpeechLogic & NISLab Nordtalk LD/HD Transactions •No clear definition of transaction •One dialogue may be one transaction (e.g. ticket reservation or train information) •One dialogue may contain several different transactions (e.g. frequently asked questions) •A simple way of looking at transactions: –Start –End (success, failure) •Relate these to dialogue acts

SpeechLogic & NISLab Nordtalk LD/HD Examples •Success: U: What is your fax number S: Fax number... •Failure: U:What is your fax number S: address... •Wrong = unwanted reply: S: Do you want our address? U: No. S: Our address is... (user gets unwanted information – not a transaction) •Wrong = erroneous information: S: Fax number (actually PDC’s fax is ) •(’Wrong’ is outside the transaction scheme)

SpeechLogic & NISLab Nordtalk LD/HD Dialogue acts ActExample Offer/questionShould I repeat the address? Information FeedbackIf you are an employee… AcceptYes RejectNo thanks SelectionEmployee OtherWho is most beautiful in this country?

SpeechLogic & NISLab Nordtalk LD/HD Resulting tag set TagExplanationType acceptUser accepts system offer repairCorrections | otherUnclear or null offerSystem offers information to user rejectUser rejects offer selectUser selects from offer list checkSystem makes explicit feedback discardDiscard calln/a failTransaction ends in failure- startNew task initiated successTransaction ends in success- wrongSystem responds with wrong information or topic...

SpeechLogic & NISLab Nordtalk LD/HD An example dialogue •S 0.1: - Velkommen til FerieKontos talebaserede vejledningssystem. - Her kan du få standardoplysninger om udbetaling af feriepenge. - Du kan altid bede om hjælp eller gentagelse. •S 0.2: - Sig om du - er lønmodtager eller arbejdsløs i Danmark - er frameldt folkeregistret og bor i udlandet - eller har forladt arbejdsmarkedet på grund af alder eller helbred. - PAUSE5000 •U 0.1 jeg er lønmodtager •S Hvis du er lønmodtager i Danmark eller arbejdsløs og har et FerieKonto-bevis •S skal du udfylde det og sende det til os. - Udover dig selv skal din arbejdsgiver eller din a-kasse eller socialforvaltningen skrive under. - PAUSE200 •S Hvis FerieKonto-beviset er korrekt udfyldt når vi modtager det, overfører vi feriepengene til din konto. - Ekspeditionstiden er cirka fem arbejdsdage. - Du kan dog tidligst få dine feriepenge en måned før din første feriedag. - PAUSE1000 (Opening) (Offer) (Select) (Feedback) (Information) Start Success (Information)

SpeechLogic & NISLab Nordtalk LD/HD •S Vil du høre informationen igen? - PAUSE5000 •U 1.1 nej tak •S Vil du høre FerieKontos adresse? - PAUSE5000 •U 2.1 nej tak •S 3.1- Vil du tilbage til starten af den generelle vejledning? - PAUSE5000 •Event 1 nothing recorded •S Undskyld. - Jeg hørte ikke hvad du sagde. - Sig 'ja' for at starte forfra, 'farvel' for at forlade systemet. - PAUSE5000 •U 4.1 nej tak •S Undskyld. - Systemet kan give information om udbetaling hvis du er lønmodtager eller arbejdsløs, er frameldt folkeregistret eller har forladt arbejdsmarkedet på grund af alder eller helbred. Du kan også bede om FerieKontos adresse. - Sig en af disse muligheder hvis du vil fortsætte, eller sig 'farvel' for at slutte. - PAUSE5000 •Event 2 nothing recorded •S Farvel og tak. •Event 3 hangupOffer Reject Offer Reject Offer (Other) Repair Reject Repair (Other) (Closing) (Other) (End)

SpeechLogic & NISLab Nordtalk LD/HD Another example dialogue •S PAUSE Velkommen til FerieKontos automatiske vejledning. - Du kan lade systemet foreslå emner eller du kan forsøge med dine egne ord. - Du vælger emner ved at tale til systemet. - Vælg mellem emnerne: - PAUSE200 - 'lønmodtager'. - PAUSE200 - 'På orlov'. - PAUSE200 - 'bor i udlandet'. - PAUSE200 - Eller 'forladt arbejdsmarkedet' på grund af 'alder' eller 'helbred'. - PAUSE500 - Sig et emne, sig 'gentag' eller bed om 'flere muligheder'? •U 0.1 jeg er studerende •S Spurgte du om - Hovedmenu •U 1.1studerende •S Hvis du er studerende og modtager SU, kan du godt få dine feriepenge udbetalt selv om du ikke holder fri fra studierne. - Men hvis du har arbejde ved siden af studierne, skal du holde fri fra dit arbejde for at få feriepengene udbetalt. •S Hvis du har arbejde er det din arbejdsgiver, der skal underskrive dit FerieKonto-bevis, ellers er det socialforvaltningen i din kommune. •S PAUSE500(Opening) Start Success Offer Check Repair (Information) (Request) (Information)

SpeechLogic & NISLab Nordtalk LD/HD Another, continued •S Er der andet du gerne vil spørge om? •U 2.1 skal jeg skrive lørdage på •S Fra ferieåret 2002, der starter 1. maj, er ferieugen ændret til 5 feriedage, og lørdage skal således ikke længere tælles med i ferien. •S Vil du vide noget om 'ferieåret'? •U 3.1 nej farvel •S Farvel og tak for dit opkald. •Event 1 nothing recorded •Event 2 disconnectOffer Start Success (Request) (Information) Offer (Reject + request) (Feedback) (Other) (Other) Success Start

SpeechLogic & NISLab Nordtalk LD/HD Transaction annotated data •Dataset: –Vejled: A few thousand calls –About 500 FAQ test calls •Test: 225 calls, three batches, March-May 2002 –Batch 1 primarily developers –Batch 2, 3 “invited” test persons •Operation: 217 calls, one week, September 2002 –real customers with real problems

SpeechLogic & NISLab Nordtalk LD/HD Annotation •Transcribed using Philips Transcription Station –Then transformed to XML and web •Markup was done using an annotation tool developed by PDC –interface is a browser window –annotation files stored in XML •All dialogues annotated by same, experienced coder, using the same coding scheme throughout

SpeechLogic & NISLab Nordtalk LD/HD Results table TagTest1Test2Test3TotalSetA accept discard fail offer other reject repair start success wrong Calls with fail Total no. of calls Transaction success percent Smooth call percent

SpeechLogic & NISLab Nordtalk LD/HD Results comments •Higher transactions success in test dialogues •Primary causes of failure in test sets are: –Dialogue model –Language model •Causes corrected before operation •Difference in user groups •Test users follow the dialogue, they only have artificial problems •Primary causes of failure in operational calls are: –Real customers ask for information not covered –Typical questions to be covered by FAQ •Problem with callers hanging up without saying anything in the dialogue.

SpeechLogic & NISLab Nordtalk LD/HD Smooth dialogues •More precise overview of problems and their causes and seriousness –Same topic may have fail and success in same call –Few or many repairs –distinction between unwanted and erroneous information –erroneous information is unacceptable (tomorrow is Friday, phone ) –other information than asked for may be more or less serious (fax instead of phone, fax instead of ) –misunderstanding a yes for a no is usually not so serious (repairable) but can be a nuisance –Misrecognitions –Information blocks may contain more than asked for