Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Europæiske taleprojekter i Danmark

Lignende præsentationer


Præsentationer af emnet: "Europæiske taleprojekter i Danmark"— Præsentationens transcript:

1 Europæiske taleprojekter i Danmark

2 Oversigt Udviklingen inden for talesystemer i de sidste ca. 15 år
To projekter hos NISLab Speecon (tale til fremtidens forbrugsgoder) NICE (tale i computerspil)

3 Kort om udviklingen 1989: Første kommercielle talesystem i USA (modtager betaler) 1992: Kunder kan ringe og bestille ”modtager betaler” samtaler (word spotting og barge-in) 1994: Philips toginformation i Tyskland (prototype) Fra midt i 90’erne: Europæisk marked for talesystemer opbygges, fx toginformation Der forskes bl.a. i barge-in, genkendelse af store ordforråd, støjfyldte omgivelser, fleksibel dialoghåndtering, sproggenerering, porterbarhed Nyeste trends: tale for bærbare enheder, enheder i omgivelserne, multimodale systemer, fra opgaveorientering til domæneorientering

4 Opgaveområder Information (fly, tog, færger, hotel, vejr, gule sider, børskurser, restauranter, biografer, …) Reservation Omstillingsbord Telefonservice (oplysning, afbestilling, nummeruorden…) Reparation Banktransaktioner El-/gas-/vandafmåling s Bil-applikationer Burgerbestilling UPS leveringsstatus FAQ ... Ikke opgave-orienterede applikationer

5 Der er stadig optaget. De vil blive betjent i rækkefølge.

6 Hvorfor tale plus ... Fastholde indhold, fx lange lister
Gengive billeder og kort Vise hvordan man samler fx et reolsystem Være diskret i det offentlige Kunne trænge igennem hvor der er meget støj Udtrykke følelser fx i spil med samtale

7

8 Speecon (1) Speech-driven Interfaces for Consumer Devices
Sigter mod indsamling af data til træning af talegenkendere Fremme udviklingen af talestyrede forbrugsgoder, fx fjernsyn, video-/dvdoptager, mobiltelefoner, håndholdte, bilnavigationsudstyr, mikrobølgeovne, og brødristere Derfor meget opmærksomhed på omgivelser for dataoptagelser

9 Speecon (2) EU-projekt startet i februar 2000 www.speecon.com
Partnerne: industri, mange kendte: Siemens (koordinator), Scansoft, Ericsson, IBM, Nokia, DaimlerChrysler, Sony, Panasonic, Microsoft, m.fl. Der indsamles sprogdata for 24 sprog, heriblandt mange europæiske sprog Data vil blive gjort tilgængelige via ELRA (European Language Resources Association)

10 NISLabs rolle i Speecon
NISLab underleverandør til Scansoft, Belgien NISLab startede i efteråret 2002 Sidste optagelser i maj 2003 Evaluering hos SPEX netop afsluttet SPEX: Speech Processing EXpertise centre, 600 timers dansk tale (lyd og transskription)

11 Retningslinjer for fordeling
København, Sjælland, Fyn, Sønderjylland, Nord- og Vestjylland, Østjylland (men ikke Bornholm) Ca. samme antal personer per region Ca. lige fordeling på køn Børn: 8-11, 12-15 Voksne: 16-30, 31-45, 46+ Kontormiljø, børneværelse, stue, bil, offentligt indendørsmiljø, udendørs

12 Opsætning To faste mikrofoner (foran mund, knaphul)
Derudover medium distance og lang distance eller to medium distance afhængigt a miljø Decibelmåler til måling af støjniveau (faste intervaller per miljø) Begrænset antal optagelser per rum og i bestemt position

13 Eksempler (1) Talrækker: en fire nul ni fem tre seks to syv otte et
Datoer: onsdag den fireogtyvende februar to tusind et Tidsangivelser: i dag, i morgen, i overmorgen Telefonnumre: Udtryk: snabel-a, at, stjerne Bogstaver: Ü Ü Ø Å X Å Ü M Ting der skal staves: A B E L V E J

14 Eksempler (2) Internet ordforråd: http://orangedk.com, www.dsn.dk
Spørgsmål der skal besvares med enkeltord: Hvilken by arbejder du i? Sætninger der skal læses op: Lidt røre i forlagsverdenen er der dog. Helen har også tilsyneladende næsten det hele. Spørgsmål til spontan tale: Invitér en ven til din fødselsdag på hans telefonsvarer. Bed din bank om at oplyse saldoen på din konto, lav derefter enoverførsel til en anden konto, og bed til sidst om børsinformation.

15

16

17

18

19 NICE Natural Interactive Communication for Edutainment
Udvikle prototype der tillader underholdende, lærerig, multimodal konversation med H. C. Andersen og nogle af hans figurer Målgruppe: børn og unge EU-projekt,

20 Partnere og ansvarsområde(r)
NISLab (koordinator): Sprogforståelse (engelsk), karaktermodellering og svargenerering (engelsk) for HCA; fokus på konversation LIMSI-CNRS: Gestusgenkendelse, gestusforståelse, inputfusion Liquid Media: Animation, integration Scansoft: Talegenkendelse; SpeechPearl trænet på data fra målgruppen Telia-Sonera: Sprogforståelse (svensk), karaktermodellering og svargenerering (svensk) for eventyrfigurer; fokus på spil

21 Arkitektur

22 Plan To prototyper Første prototype færdig med udgangen af 2003
Januar-februar 2004: brugertest og analyse af testdata med henblik på udvikling af anden prototype Anden prototype færdig i starten af 2005 To sprog: svensk og engelsk HCA taler engelsk, eventyrfigurerne taler svensk Tiltænkt opsætning: Primært museer og udstillinger

23

24 Eventyrverdenen I anden prototype kan brugeren gå gennem dobbeltdøren hos HCA ind i eventyrverdenen Figurerne har mål som brugeren skal hjælpe dem med at nå Klodshans Tommelise Andre figurer

25 HCA-modellering Seks domæner: Arbejde (eventyr), liv, fysiske tilstedeværelse, brugeren, dørmand, meta Fysisk modellering af rum og person i rimelig overensstemmelse med virkeligheden 55 år, åben, sensitiv, lytter og fortæller gerne HCA er tilbage men endnu ikke helt den han var engang. Han ved ikke alt det han måske burde, men her kan brugeren hjælpe Har sin egen dagsorden som han følger i dialogen

26 CM-arkitektur

27 Input fra data Træning af genkender
Ideer til dialogmodellering og indhold Wizard of Oz i HCA museum juli 2003 498 dialoger, 30 timer 240 dialoger med brugere mellem 10 og 18 år 49 dialoger med børn under 10 år Omtrent lige fordeling på køn Målgruppen 30% længere samtaler end voksne Målgruppen bruger i gennemsnit 32 ture Yndlingsemner: eventyr, lege/spil, opfindelser

28

29 Brugertest 18 brugere 10-14, 15-18 år
Ligelig fordeling af piger og drenge og på alderskategorier Indtryk: lærte noget om HCA og hans familie, kunne lide at pege på ting og få historie, sjovt at tale og få svar savnede til tider at kunne gøre lidt mere (både pege og dialog)


Download ppt "Europæiske taleprojekter i Danmark"

Lignende præsentationer


Annoncer fra Google