Evaluering af SMT (statistisk maskinoversættelse) brugt på patenttekster. Erfaringer med systemudviklingen SDMT-SMV-projektet Lene Offersgaard, Bente Maegaard.

Slides:



Advertisements
Lignende præsentationer
Anskaffelse af ny teknologi
Advertisements

Forskning, formidling og andre færdigheder
IT Projekt Portefølje Management: styringsmæssige og koordineringsmæssige problemer i en offentlig organisation.
Den 16.august 2010 Regionsgården
Kultur på arbejde: Kulturforståelse og merkantil kultur
Taskbaseret sprogundervisning
Gode råd og eksempler på faldgruber
Få succes med dine ansøgninger om eksterne midler 12. maj 2011
WP 5.2 Kortlægning af eksisterende resurcer/collections
Krænkelse og håndhævelse. 2© Plougmann & Vingtoft Skruekravet 1. An elongated fastening means adapted to be inserted into an object and comprising an.
IM-Strategi.
Peter Ege Symposium Rigshospitalet 5. oktober 2011 Mads Uffe Pedersen professor Center for Rusmiddelforskning Aarhus Universitet Hvad kan den sociale misbrugsbehandling.
7. Nationale Kongres Foreningen for palliativ indsats 21. Juni 2013
Formularer (Access, del 3)
Dias 1 Lene Offersgaard, Bente Maegaard Center for Sprogteknologi, Københavns Universitet Udvikling og evaluering af SMT-SMV.
Date :31 1.
Dias 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet WP 5.2 Kortlægning af eksisterende resurcer/collections.
Digitalisering i Praktiken Workshops den 9. februar 2007
De skriftlige eksamensopgaver i engelsk
Co-funded by the 7th Framework Programme of the European Commission through the contract T4ME, grant agreement no.: Præsentation af METASHARE –
Introduktion til indholdsfortegnelser j Tryk derefter på F5, eller klik på Slideshow > Fra begyndelsen for at starte kurset. Klik på Aktivér redigering.
NOEA/Aalborg Universitet
Dette program kan lave et portræt af dit ansigt, baseret på de information du giver... Tryk her.
NP struktur - Eller hvordan engelsk er nominelt, mens dansk er verbalt.
1 Velkommen! Informationssøgningsprocessen:  Hvordan kan I gribe det an (strategier)  Omdanne jeres emne til søgeord  Søgeteknik  Bruge søgeordene.
1. Ordreside: Køretøjerside: Brugereside: Timesedlerside: Beskederside: Oversigtskortside: Themeside: 19.
SDMT-SMV Workshop 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet
Grontmij Grontmij Status på udvikling af ny JordWeb ENVINA JORD 25. September 2013 Copyright © 2013 Grontmij A/S | CVR Musikhuskvarteret - Aalborg.
Sundhedsprofessionelles forståelser af patientinddragelse
25. sep Dias 1 Center for Sprogteknologi Lene Offersgaard, Claus Povlsen Center for Sprogteknologi SDMT-SMV2 workshop 25. september 2007 Inter-set.
25. september 2007 Dias 1 Center for Sprogteknologi Evalueringsmetoder i MT Bente Maegaard og Lene Offersgaard Center for Sprogteknologi.
Introkursus Køn og ligestilling i udviklingsarbejdet OPFRISKNING AF BEGREBER FRA DAG 1 August 2011.
Introkursus Køn og ligestilling i udviklingsarbejdet METODE
Artikel præsentation Kenneth Pedersen DESIGN SCIENCE IN INFORMATION SYSTEMS RESEARCH Hevner, A. R., March, S. T., Jinsoo, P. and Ram, S. (2004)
Tietgen Skolen Kvalitet og kvalitetssikring Review Test.
Dias 1 Lene Offersgaard, Bente Maegaard Center for Sprogteknologi, Københavns Universitet Udvikling og evaluering af SMT-SMV.
Learning Objectives 5 Steps of a Significance Test Assumptions
Dansk kvalitetsmodel på det sociale område.
Barrierer i og for forbedringsprojekter Udenom, indenom, henover eller igennem barriererne Hvilken vej vil du? 12. oktober C2E netværk.
Learning Objectives 5 Steps of a Significance Test Assumptions
25. september 2007 Dias 1 Center for Sprogteknologi Evalueringsmetoder i MT Bente Maegaard og Lene Offersgaard Center for Sprogteknologi.
Simulationsmodeller til vurdering af effekten af risikofaktorintervention Januar 2007 | Henrik Brønnum-HansenSide 1 CEEH ”kick-off”, januar 2007 Simulationsmodeller.
Commentor A/S – Hørkær 24 – 2730 Herlev - (+45) Tel : (+45) Fax : (+45) – Praktisk Brug af Work Items Thomas.
Folksonomier: når brugerne samarbejder Eller Folksonomier: Når samarbejde mellem brugere er indlejret i informationssystemerne.
XML og Skemaer Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
Rapporter (Access, del 5). RHS – Informationsteknologi – Udgangspunkt Vi har oprettet en database Vi har defineret en eller flere tabeller, og.
Objekter og klasser Rasmus D. Lehrmann DM
Dias 1 Lene Offersgaard, Bente Maegaard Center for Sprogteknologi, Københavns Universitet Udvikling og evaluering af SMT-SMV.
Evaluering af MT SDMT-SMV2 Workshop 2 Bente Maegaard, Lene Offersgaard Center for Sprogteknologi, Københavns Universitet
DIEB4.1 Kursusgang 4 Oversigt: Sidste kursusgang Opgaver Aktivitet 2: Generer design (fortsat) Design af interaktionselementer.
Oplæg til 3. møde i udvalget vedr. professionsspor Formål og læringsmål.
Udvikling af immunforsvaret
Introduktion til KVIK Modellen Tovholderens rolle og opgaver
Fremstilling af Simple WEB steder [ITPL] Foråret 2004
Usability ITU, forår 2008 Usability ITU Forår 2008 ’Teori 2’ 3. kursusgang, 14. februar 2008.
Literary Theory and Methodology Jens Kirk Session One: Introduction.
2 minutter om tid (og rum) Lisbeth Klastrup 7. kursusgang 23. oktober.
On the Essential Contexts of Artefacts or on the Proposition that ”Design Is Making Sense (of Things)” Af Klaus Krippendorff 1989.
23. juni 2015 Det Semantiske Web Mads Carlsen. 23. juni 2015 Problemer med det nuværende Internet Ingen semantiske specifikationer. Søgning giver mange.
Definition Kriterier Design og evaluering
Skift Typografi Marker tekst og klik TAB for at hoppe til næste typografi Klik SHIFT + TAB for at hoppe tilbage i typografierne 1. OVERSKRIFT 2. UNDEROVERSKRIFT.
Århus Maskinmesterskole Engelsk/1. Semester Form & skabelon
Projekt PaRIS Projektgruppemøde d.14.januar 2009 Præsentation af: definition af innovation de foreløbige data fra de kvalitative data Projektleder Mette.
Jan Simonsen - Partner, European Patent Attorney Krav og beskrivelse; hvordan og hvorfor? Undervisning hos DAIPA 6/4-16.
Ledende oversygeplejerske Arne Brehm Høj Afdeling for Operation og Anæstesiologi Sydvestjysk Sygehus.
Modul 3.1 – Hvorfor og hvordan dokumenterer vi?
Aftale format – Use cases
Modul 3.1 – Hvorfor og hvordan dokumenterer vi?
Kvalitative metoder, forår kursusgang
Implementering og dokumentation
Præsentationens transcript:

Evaluering af SMT (statistisk maskinoversættelse) brugt på patenttekster. Erfaringer med systemudviklingen SDMT-SMV-projektet Lene Offersgaard, Bente Maegaard Center for Sprogteknologi, Københavns Universitet

SDMT-SMV, januar Evaluering af maskinoversættelse (MT) – nogle vigtige forudsætninger Man kan ikke evaluere MT (eller noget andet) uden at definere den ramme det skal bruges i. Rammen defineres af faktorer som disse: Hvor skal MT bruges? (organisatorisk) fx i en virksomhed - af direktøren, af informationsafdelingen, af oversættelsesafdelingen - eller til private formål, til forskning, … Formålet med den oversatte tekst fx oversætte referater hurtigt til internt brug, oversætte manualer til eksternt brug, oversætte salgsmateriale,… Teksttype, domæne Nogle teksttyper og domæner egner sig bedre end andre De ressourcer der er til stede Både sprogressourcer og mennesker Tidsfrister og andre krav fx om hvor hurtigt oversættelsen skal være klar

SDMT-SMV, januar To hovedsynspunkter på evaluering Det er ikke blot rammen der bestemmer kriterierne for hvad man er interesseret i ved evalueringen Udvikleren/lingvisten Brugeren Udvikleren/lingvisten taler om hvor mange leksikalske fejl, hvor mange grammatiske fejl, af hvilken type mv. Formål: forbedre systemet Brugeren er interesseret i, om det kan bruges, hvad det koster, hvad det koster at efterredigere, om det kan hjælpe til at levere varen til tiden mv. Formål: få forretningen til at løbe rundt

SDMT-SMV, januar Metoder til evaluering Formål: objektiv evaluering Brugerevaluering På en skala fra 1 til 4 Intelligibility (er teksten forståelig?) Fidelity (har den samme betydning?) Fluency (er den grammatisk?) Måle efterredigeringstiden Automatisk evaluering Automatisk evaluering er billigere og hurtigere Kan automatiske metoder anvendes? Vi har anvendt BLEU som anvendes meget i forskningsverdenen I BLEU måles afstanden mellem MT-outputtet og det efterredigerede resultat

SDMT-SMV, januar Teksttypen patenttekster Oversættelse fra engelsk til dansk Oversættelsen for patenter skal tjeklæses – juridisk gyldighed! Tre forskellige tekstdele Beskrivelse ” Forbindelserne er ifølge opfindelsen nyttige til behandling af tilstande eller lidelser eller sygdomme, der involverer det cholinerge system af det centrale eller periferære nervesystem, smerter, inflammatoriske sygdomme, sygdomme forårsaget af sammentrækning af glat muskulatur og som assistance ved ophør af kemiske stofmisbrug.” Eksempler ” Reaktanterne blev opnået ifølge fremgangsmåde C ud fra 3-brom-5- methoxypyridin og 1- tert-butoxycarbonyl-(1,5-diazacyclooctan).” Krav ”Homopiperazinderivat ifølge krav 1, hvori R 1 betegner 3-nitrophenyl, 3- aminophenyl, 3-methoxyphenyl eller 3-hydroxyphenyl.”

SDMT-SMV, januar Vi har koncentreret os om den statistiske oversætterkerne Træning af denne kræver parallelle tekster indenfor det ønskede domæne Forbehandling og efterbehandling kan automatiseres meget mere Layout: hævet/sænket skrift, figurer mm. Formler: ”NO2” ”(PEG-IL-2)” “- CH2CH2N(R15)CH2CH2-“ “ET-743” Referencer: ”U.S. Patent 4,837,204” ”WO 93/23361” ”EP ” “Application No. 60/138” ”21A-21C” Workflow for at oversætte patentteksterne Forbehandling Engelsk Patent- dokument Statistisk oversætter Efterbehandling Statistiske ressourcer: ”phrasetable” ”sprogmodel” Dansk Patent- dokument Tekst- revision

SDMT-SMV, januar Resultater fra tre typer af evaluering Oversættere har vurderet oversættelseskvaliteten sætning for sætning og givet karakter til hver sætning Automatisk evaluering af forskel mellem MT-outputtet og det efterredigerede resultat Efterredigeringstiden: hvor dyrt er det at gøre teksten færdig?

SDMT-SMV, januar Oversætternes evaluering Kriterier: Intelligibility: er teksten forståelig? Fidelity: har den samme betydning? Fluency: er den grammatisk? Skalaen er 1-4 Flere oversættere i hvert firma har deltaget i evalueringen Det går bedst for eksempler og kravene TeksttypeAntal sætn.IntelligibilityFidelityFluency Beskrivelse4643,003,193,55 Eksempler5403,433,453,46 Krav1243,263,393,45 Gennemsnit3,233,343,49

SDMT-SMV, januar BLEU: A method for automatic evaluation of Machine Translation, Papineni et al., 2001 Metoden bygger på at man måler overensstemmelsen mellem det MT- oversatte og referenceoversættelser vurderet på ordniveau. Her måles for hvor stor forskel der er mellem MT-outputtet og det efterredigerede resultat, skalaen er 0-1 Kan bruges til at se hvor der er størst behov for at ændre ord. Giver ikke noget billede af hvilke ændringer der skal udføres. Kan bruges af udvikleren til at udpege problemsætninger Automatisk evaluering vha. BLEU BLEU(MT – efterred.)Lingtech-tekstP&V-tekst Beskrivelse0,65 Eksempler0,760,71 Krav0,610,79

SDMT-SMV, januar Hvor lang tid skal man bruge på at rette teksten? Hurtigst at efterredigere eksempler og krav Tallene her dækker ikke blot fejlrettelser men også korrektion af formatet Sprogrevisoren kan opøve sit blik for fejltyperne Efterredigeringstid TeksttypeAntal sætn.Efterred.tid/sætning (min) Beskrivelse2461,6 Eksempler4200,6 Krav621,2 Gennemsnit1,0

SDMT-SMV, januar Eksempler på oversættelser og demo SMV Engelsk: Heteroaryl diazacycloalkanes, their preparation and use The present invention relates to novel heteroaryl diazacycloalkane derivatives which are cholinergic ligands at nicotinic ACh receptors. Automatisk oversættelse: Heteroaryl diazacycloalkanes, deres fremstilling og anvendelse Den foreliggende opfindelse angår hidtil ukendte heteroaryl diazacycloalkane derivater, der er cholinerge ligander ved nikotine ACh receptorer. Efterredigeret tekst: Heteroaryldiazacycloalkanes, deres fremstilling og anvendelse Den foreliggende opfindelse angår hidtil ukendte heteroaryldiazacycloalkanderivater, som er cholinerge ligander ved nicotin-ACh-receptorer.

SDMT-SMV, januar Eksempler på oversættelser og demo Engelsk: The compounds of the invention are useful for the treatment of conditions or disorders or diseases involving the cholinergic system of the central or peripheral nervous system, pain, inflammatory diseases, diseases caused by smooth muscle contractions and as assistance in the cessation of chemical substance abuse. Automatisk oversættelse: Forbindelserne ifølge opfindelsen er nyttige til behandling af tilstande eller lidelser eller sygdomme, der involverer den cholinerge system af det centrale eller periferære nervesystem, smerte, inflammatoriske sygdomme, sygdomme forårsaget af glatte muskler sammentrækninger og som assistance i ophør af kemiske stofmisbrug. Efterredigeret tekst: Forbindelserne ifølge opfindelsen er nyttige til behandling af tilstande eller lidelser eller sygdomme, der involverer det cholinerge system af det centrale eller perifere nervesystem, smerter, inflammatoriske sygdomme, sygdomme forårsaget af sammentrækning af glat muskulatur og som assistance ved ophør af kemiske stofmisbrug.

SDMT-SMV, januar Eksempler på oversættelser og demo Engelsk: Indeed several CNS disorders can be attributed to a cholinergic deficiency, a dopaminergic deficiency, an adrenergic deficiency or a serotonergic deficiency. A reduction in the number of nicotinic ACh receptors is also observed with the progression of Alzheimer&jis disease. Automatisk oversættelse: Faktisk adskillige CNS-lidelser kan være tilskrives en cholinerge mangel, en dopaminerge mangel, en adrenerge mangel eller en serotonerge østrogenmangel. En reduktion i antallet af nikotine ACh receptorer er også observeret med fremadskridenen af Alzheimer&jis sygdom. Efterredigeret tekst: Faktisk kan adskillige CNS-lidelser tilskrives en cholinerge mangel, en dopaminerge mangel, en adrenerg mangel eller en serotonerg østrogenmangel. En reduktion i antallet af nicotin-ACh-receptorer er også observeret med fremadskridenen af Alzheimers sygdom.

SDMT-SMV, januar Eksempler på oversættelser og demo Engelsk: Alzheimer&jis disease is characterised by a profound loss of memory and cognitive functions caused by a severe depletion of cholinergic neurons, i.e. neurons that release acetylcholine. Automatisk oversættelse: Alzheimer&jis sygdom er kendetegnet ved en omfattende tab af hukommelse og kognitive funktioner, der er forårsaget af en alvorlig depletering af cholinerge neuroner, dvs. neuroner, at frigivelse acetylcholin. Efterredigeret tekst: Alzheimers sygdom er kendetegnet ved et omfattende tab af hukommelses- og kognitive funktioner, der er forårsaget af en alvorlig depletering af cholinerge neuroner, dvs. neuroner, der frigiver acetylcholin.

SDMT-SMV, januar Erfaringer fra udviklingen -1 SMV-projektet har givet en ny mulighed for direkte samarbejde mellem forskere og virksomheder: virkelige data oversætternes evaluering og efterredigering Vi kombinerede tekstmaterialet fra begge patentfirmaer for at opnå meget tekst giver uønsket variation i oversættelserne Fokus har været på kernen i oversættelsesprocessen Ønsker til kernen: Forbedring af output f.eks. færre kongruensfejl vha. brug af lingvistisk viden

SDMT-SMV, januar Erfaringer fra udviklingen -2 Integration i virksomhedens workflow kræver: Parallelle tekster af god kvalitet til opbygning af de statistiske ressourcer, helst flere mill. ord Hjælpeværktøj uden om kernen til: håndtering af ”Faste vendinger” markering af ord der ikke ønskes oversat Formler og henvisninger, især i patenttekster!! Forbehandling Engelsk Patent- dokument Statistisk oversætter Efterbehandling Statistiske ressourcer: ”phrasetable” ”sprogmodel” Dansk Patent- dokument Tekst- revision

SDMT-SMV, januar Opsummering - Patenttekster En statistisk oversættelseskerne er patentfirmaets eget aktiv bygget på firmaets egne tekstressourcer og afspejler dermed firmaets sprogpolitik er ikke omkostningstung i oprettelse kan oprettes for nye domæner og nye sprogkombinationer