WP 5.2 Kortlægning af eksisterende resurcer/collections

Slides:



Advertisements
Lignende præsentationer
SharePoint /36 2 General SettingsPermissions and ManagementCommunications Titel, description and navigation Versioning settings Advanced settings.
Advertisements

Klik på Aktivér redigering på meddelelseslinjen.
TEST 2 modul 1 20 spørgsmål. Du skal klikke med musen på det rigtige svar, så kommer du automatisk til næste spørgsmål Klik for start.
Web 2.0 Teoretisk viden.
Portalintegrationsprojektet Føderationstilslutning ERFA møde 9. januar 2008.
Dias 1 Stormøde 7. okt DK-CLARIN WP5 Lene Offersgaard, Bart Jongejan WP5 Metadata, ressourcetyper, og værktøjer DK-CLARIN stormøde 7. okt
Det nye BBR – hvilke web-services er til rådighed
Indsæt nyt billede: Format: B 254 x 190,5 mm Efter indsættelse, højreklik på billedet og placér det bagerst. Delete det gamle foto Kortforsyningen Nyt.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Test af ISM i Hjørring Kommune
– Sådan virker det! Dit elektroniske postsystem Ved Arne Crown Rasmussen
Forslag til skole sikring
‘Et kig ind i fremtiden: Mobile og pervasive systemer’ (Pervasive Healthcare i Holstebro) Simon Bo Larsen Ole Langvad Wessby Alexandra Instituttet Sekoia.
1 Belastningsprøve Fredag 16. september Agenda Kl. 08:00Velkomst v. Allan Harding Status på Imerco projekt, v. Allan Harding Oplæg til belastningsprøve,
Dias 1 Lene Offersgaard, Bente Maegaard Center for Sprogteknologi, Københavns Universitet Udvikling og evaluering af SMT-SMV.
Krav og usecases Larman kap. 5 og 6 (del1) Larman kap del1
Dias 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet WP 5.2 Kortlægning af eksisterende resurcer/collections.
KOD I FERIEN 2012: INSPIRE PROJEKTET. HVEM ER JEG? Mossa Merhi • Studerende på Københavns Universitet • Studie: Naturvidenskab og IT • Fokus: Fysik og.
Strategi Interoperabilitet Web service – nye standarder danZIG-mødet Leif Andresen Biblioteksstyrelsen.
Evaluering af SMT (statistisk maskinoversættelse) brugt på patenttekster. Erfaringer med systemudviklingen SDMT-SMV-projektet Lene Offersgaard, Bente Maegaard.
Co-funded by the 7th Framework Programme of the European Commission through the contract T4ME, grant agreement no.: Præsentation af METASHARE –
SDMT-SMV Workshop 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet
Krav til funktionalitet i fremtidens flådestyringssystem
1 It-Universitet velkommen til Easy Historien om en succes!
Aktiv brug af Søften Portalen
Implementering af brandingstrategi på nettet
MICHAEL ANDREAS HANSEN COMMERCIAL DIRECTOR & PARTNER
Giv medarbejderne adgang til centrale systemer – lige ind i Office Inspirationsseminar 31. oktober 2006.
Søgning - et værktøj til videndeling Inspirationsseminar 31. oktober 2006.
Masterpages/Otto Knudsen 1 Master Pages Master Pages i ASP.NET 2.0.
Introduktion til Access (Access, del 1)
Opslagsfelter (Access, del 6). RHS – Informationsteknologi 2 Udgangspunkt Vi er ofte i den situation, at valg af en type for et felt ikke begrænser vores.
Søg på kundes navn. Klik evt. på inaktive eller filialer Vælg når søgeresultaterne fremkommer, et af resultaterne ved at sætte et kryds i boksen, og tryk.
DK-CLARIN Workspace Struktur - Arbejdsbænk / Workbench Værktøj Ressource Ny ressourceEgen mappe 1DKClarin (KMIV)
Dias 1 Lene Offersgaard, Bente Maegaard Center for Sprogteknologi, Københavns Universitet Udvikling og evaluering af SMT-SMV.
1 Projektforslag på modul 2 ved Keld Helsgaun. 2 Fagligt indhold Projekt- og kursusarbejdet skal give de studerende indsigt i følgende emnekredse: Gå.
Ordnet og tesaurusser Patrizia Paggio Center for Sprogteknologi Københavns Universitet
18 – Java Server Faces. 2 NOEA2009Java-kursus – JSF 2 Web-applikationer - 1 Brugere interagerer med en Web-browser Browseren sender forespørgsler til.
Velkommen til Export Steps Agenda Velkomst og præsentation af Export Steps – networking med indhold v/ Ole Chr. Lindholm, SMV-teamleder,
Indhold 1.Hvad er MATRIX Mobil 2.Menu Valg 3.Installation 4.Adgang.
25. september 2007 Dias 1 Center for Sprogteknologi Evalueringsmetoder i MT Bente Maegaard og Lene Offersgaard Center for Sprogteknologi.
Dias 1 Center for Sprogteknologi, Københavns Universitet Workshop WP5 18. maj 2009 Resurser, værktøjer, typer og formater, oversigt over.
Det ”offentliges” vision for brug af geodata. Tommy Mostrup.
Det semantiske web Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
FOVITS: Informationshåndtering på nettet - sprogteknologiske løsninger 9933 RDF I XML og RDFS Costanza Navarretta Center for Sprogteknologi, Københavns.
XML og Skemaer Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
Agenda Agenda Introduktion Målgruppe WPS Gennemgang af Application
Introduktion til Lync Windows Store-appen
Grunde til at jeg elsker dig
Tilføj hjælpelinjer: 1.Højreklik et sted i det grå område rundt om dette dias 2.Vælg "Gitter og hjælpelinjer" 3.Vælg "Vis hjælpelinjer på skærm" Oplæg.
Brugergrænseflade Afprøvning af program. Sådan bruger du programmet Programmet er bare en demo og er ikke funktionsdygtigt. Dog kan du trykke på de forskellige.
Opslagsfelter (Access, del 6). RHS – Informationsteknologi – Udgangspunkt Vi er ofte i den situation, at valg af en type for et felt ikke begrænser.
Introduktion til Access (Access, del 1). RHS – Informationsteknologi – Fra design til udvikling Vi ved nu, hvordan vi finder et design for en database,
Dias 1 Lene Offersgaard, Bente Maegaard Center for Sprogteknologi, Københavns Universitet Udvikling og evaluering af SMT-SMV.
Evaluering af MT SDMT-SMV2 Workshop 2 Bente Maegaard, Lene Offersgaard Center for Sprogteknologi, Københavns Universitet
Fremstilling af Simple WEB steder [ITPL] Foråret 2004
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 8.
Intro Evaluering De sidste to gange?. HTTP, cookies og sessions Forelæsning nr 10 Tilbage til trafikken mellem server – client Sende HTTP-request og respons.
KB-cases: HUM og NAT Data management i praksis kick-off 27/ Anders Conrad.
Masterpages/Otto Knudsen 1 Temaer (Themes) Stylesheets til ASP.NET web-applikationer.
DOMS IT-stormøde 16 november 2009 Kåre Fiedler Christiansen.
Omsætning af en model til en RDB Jesper Tørresø DAB1 F Marts 2008.
Call Center, adm kursus, indledning Indledning (registrering af kursister & præsentation) 10 min. Hjælpeværktøjer 5 min. System overblik 30 min. Administrator.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
1.09 Dokumentation.
Digital humaniora på KB
Dokumentation.
DIGHUMLAB Forskning i tema1 – Sproglige materialer
Præsentationens transcript:

WP 5.2 Kortlægning af eksisterende resurcer/collections Lene Offersgaard Center for Sprogteknologi, Københavns Universitet loff@cst.dk

Første indsamling af information om resurser/collections Center for Sprogteknologi Første indsamling af information om resurser/collections Indledende runde af informationindsamling Fokus på DK-CLARIN-partnere Forsøg på typeinddeling Eksisterende resurcer Basisoplysninger og kontaktpersoner Tak for alle bidrag fra alle partnere Opsummering af Typer og fordeling i forhold til typer Copyright Metadata Målgrupper og brugertyper Næste skridt

Opdeling i typer Skrevet sprog 5.Tale/Audio 6.Multimodale 4.Billeder(obj) Multimodal u. transskrip. u. anno. Billeddatabaser Audio u. transskrip. 1.Monolingvale tekstsamlinger Audio m. transskrip. Multimodal m. transskrip. u/m anno. 2.Multlingvale tekstsamlinger 3.Ord-collections 7. Andet

Fordeling i forhold til typer Center for Sprogteknologi Fordeling i forhold til typer Antal Type Beskrivelse 5 1a Monolingvale tekstsamlinger/korpusser: tekster, tekster med håndskrifter/originaler(digitaliseringer), tekster med noter, med/uden annoteringer 4 1b Monolingvale tekstsamlinger/korpusser: tekstsamlinger, som er tilgængeliggjort vha. et særligt interface, eller med særlige værktøjer tilknyttet f.eks. ADL eller korpus2000 2 2a Multilingvale tekstsamlinger/korpusser: Parallelle tekster på to eller flere sprog. tekster med håndskrifter/originaler(digitaliseringer), tekster med noter, med/uden annoteringer 3 2b Multilingvale tekstsamlinger/korpusser: tekstsamlinger, som er tilgængeliggjort vha. et særligt interface, eller med særlige værktøjer tilknyttet 6 Ord-collections, fx ordbøger el. leksikalske ordsamlinger med lingvistisk annotation 20 1,2,3 Total skrevet tekst 4

Fordeling i forhold til typer Center for Sprogteknologi Fordeling i forhold til typer Antal Type Beskrivelse 1 4 Billed-collections, fx databaser med billeder og tekst 3 5a Audio-collections: med transskription 5b Audio-collections: uden transskription 5 Total type 5 1+ 6a Multimodale collections, med transskription 6b Multimodale collections, uden transskription 6c Multimodale collections, med transskriptioner og annotationer 6d Multimodale collections, uden transskription eller annotationer 6 Total type 6 7 Andet 5

Tilpasning af SMT-systemet SMT-systemet lige nu: Standalone-applikation, kører på linux-server, Demo: web-adgang ”Flad” tekst håndtering Kan køre med forskellige oversættelsesmodeller: nu ”manualer”, Systemet kan blive bedre med mere domæneafgrænsede data For at opnå integration med workflow: Input til SMT-systemet og fra SMT-systemet kan leveres i Tag-editor-format Der trænes oversættelsesmodeller for de domæner hvor man ønsker at anvende SMT-systemet

Opgaver, bl.a. Fastlæggelse af domæne Center for Sprogteknologi Opgaver, bl.a. Fastlæggelse af domæne Levering af TM til træning – Inter-Set Træning af oversættelsesmodel – CST Samarbejdsaftale Fastlæggelse af testscenarie Konvertering til/fra TagEditor-format – CST Krav til web-applikation Implementering af web-applikation – CST Krav til opdatering af oversættelsesmodel Opdateringfacilitet til model implementeres - CST Funktionel test Eksperimenter med match% Test af oversættelseskvalitet Tilpasning til drift Samlet test

Eksempler på oversættelser og demo Center for Sprogteknologi Eksempler på oversættelser og demo http://192.38.108.139/SDMT/SMV/php/smtdemo.php SMV Engelsk: Enter the emergency number, then press the call key. The wireless device described in this guide is approved for use on the EGSM 850, 900, 1800 and 1900 networks. Automatisk oversættelse: Indtast alarmnummeret, og tryk derefter på tasten opkald. Den trådløse enhed, der beskrives i denne brugervejledning, er godkendt til brug i egsm 850, 900-, 1800 og 1900-netværk. Efterredigeret tekst: Indtast alarmnummeret, og tryk derefter på tasten Ring op. Den trådløse enhed, der beskrives i denne brugervejledning, er godkendt til brug i EGSM 850-, 900-, 1800- og 1900-netværk.