Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Automatisk oversættelse af

Lignende præsentationer


Præsentationer af emnet: "Automatisk oversættelse af"— Præsentationens transcript:

1 Automatisk oversættelse af www.sdu.dk
Eckhard Bick

2 Baggrund Målsætning om at gøre universitetets website flersproget
Internationale studerende uden danskkundskaber Internationale forskningsmiljøer / synliggørelse Manglende implementering: mange (de fleste?) dybere links findes p.t. kun på dansk selv højtliggende sider kan afvige stærk på indholdssiden mellem den engelske og danske version aktualiseringsproblemer Ressourceproblemer: Oversættelse er tidskrævende, dyr og har et aktualiseringsproblem

3 studiefag i Sønderborg ... sdu -> byerne -> Sønderborg
Dansk (232 ord): Fokusområder Ved Syddansk Universitet i Sønderborg: Ingeniør Erhvervsstudier Samarbejde over grænser  Engelsk (59 ord): Areas of study in Sønderborg: engineering science social sciences language studies

4 hullerne sdu -> byerne -> odense -> til studerende

5 Same page in English ...

6 and it's not the only one ....

7 Løsningsforslag Maskinel oversættelse på flere niveauer
a) som sitecore-integreret støtte til VIPere og TAPere der skriver eller aktualiserer tekst på SDU's website b) som fuldautomatisk on-the-fly-løsning der tillader brugeren også at læse sider på engelsk der kun findes på dansk Brug af GramTrans, et regelbaseret maskinover- sættelsessystem (MT system) Constraint Grammar-teknologi, som den også ligger til grund for VISL-undervisningsprogrammerne ved ISK kommercielt system ( tilpasset til SDU's behov i samarbejde med GrammarSoft ApS og Kaldera Språkteknologi AS

8 Specifikke tilpasninger
integration af SDU-termbank for navneoversættelse interaktivt editeringssystem for oversættelserne TM (translation memory) for uændrede dele af en opdateret side websitet som tekstkorpus: ekstraktion af statistisk signifikante termkandidater ekstraktion af ord med kun en heuristisk eller kompositumsoversættelse løbende tilpasning af MT-systemet ud fra redigerede sider tilpasning af morfologisk og syntaktisk analyse til site-typiske konstruktioner

9 (Sitecore-genereret)
Interaktivt Editeringsinterface remote UI Dansk tekst Accept Redigering Erstatning DanGram SDU-website (Sitecore-genereret) Dan2eng Sitecore Database remote UI English text GUI

10 Engelsk turistvejr DanGram Dan2eng Dansk tekst Tale English text
SMS WAP GUI Tale 2 Tekst remote UI Dansk tekst Tale Dokument- integration (fx privat/firma- hjemmeside) DanGram Dan2eng Informations- bearbejdning (fx DMI, QA) Text 2 Speech remote UI English text Speech GUI SMS

11 DanGram Dan2eng Fixed expressions 7.000 Valency potential Grammatical
Translation lexicon 81.000 Names Core lexicon Composita Semantic prototypes inflexion lex. inflexion rules Word-Analyzer Lexical Transfer lexical movement rules PoS-disambiguator Composita & Heuristics Contextual CG rules (6.000) inflexion rules (en) syntactic function tags Morph. Generator transfer CG attaching CG Syntactic Transfer Dependency trees attachment rules (200) movement rules (70)

12 a live demo version of


Download ppt "Automatisk oversættelse af"

Lignende præsentationer


Annoncer fra Google