Dias 1 Center for Sprogteknologi, Københavns Universitet Workshop WP5 18. maj 2009 Resurser, værktøjer, typer og formater, oversigt over.

Slides:



Advertisements
Lignende præsentationer
Automatiseret GUI-test Lars Kjølholm Testnet maj 2009.
Advertisements

Urtekram’sk VMI 13. April 2011 M3UG årsmøde 2011.
Langvarigt sygefravær
Første gang du logger på, skal du bestille ny adgangskode her
M3 UG Årsmøde 2011 Leverandør-portal. Inspirationen… 1995: Præsentation af Foss Electrics løsning 2002: API’er bliver tilgængelige 2005: next-move start.
Dias 1 Stormøde 7. okt DK-CLARIN WP5 Lene Offersgaard, Bart Jongejan WP5 Metadata, ressourcetyper, og værktøjer DK-CLARIN stormøde 7. okt
Modul 1 - Processer.
WP 5.2 Kortlægning af eksisterende resurcer/collections
Samarbejde med eller uden Service Level Agreement (SLA)
Portalintegrationsprojektet Claus Andreasen PL, portalintegrationsprojektet.
Klik på Aktivér redigering i meddelelseslinjen, Hvis videoerne i kurset ikke afspilles, skal du måske hente QuickTime eller blot skifte til PowerPoint.
Vejledning i blog-værktøjet WordPress Opdateret august 2009.
Hjemmeside Tirsdag den 5. oktober 2010.
Implementering af it-system
Vejledning i blog-værktøjet WordPress Opdateret februar 2009.
‘Et kig ind i fremtiden: Mobile og pervasive systemer’ (Pervasive Healthcare i Holstebro) Simon Bo Larsen Ole Langvad Wessby Alexandra Instituttet Sekoia.
Innovation og iværksætteri
Beskyt din computer og dine data!
Nyt netpunkt og andre DanBib-nyheder Kirsten Larsen
v/ Anne Kathrine Skibelund, Roskilde Bibliotekerne
Dias 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet WP 5.2 Kortlægning af eksisterende resurcer/collections.
E-commerce hos Bon’A Parte
Kvantitative metoder
Årsaftale projekt Tidslinie © due & partners
Co-funded by the 7th Framework Programme of the European Commission through the contract T4ME, grant agreement no.: Præsentation af METASHARE –
Dansk med it Duncker & Ruus © DIT-systemet Generel introduktion DIT-systemet Udvikling og testning Dorthe Duncker og Hanne Ruus Institut for.
1. Ordreside: Køretøjerside: Brugereside: Timesedlerside: Beskederside: Oversigtskortside: Themeside: 19.
SDMT-SMV Workshop 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet
Grontmij Grontmij Status på udvikling af ny JordWeb ENVINA JORD 25. September 2013 Copyright © 2013 Grontmij A/S | CVR Musikhuskvarteret - Aalborg.
Kort præsentation af principperne bag SOL (Samarbejde Om Læring)
Skoleporten Hvordan tilpasser jeg layout mulighederne i
SkoleIntra i fremtiden – hvordan kan det integreres med andre tjenester og systemer Ole Windeløv, UNI-C.
Introduktion til Microsoft CRM Christian Cletus Bjørn Eilertsen.
Giv medarbejderne adgang til centrale systemer – lige ind i Office Inspirationsseminar 31. oktober 2006.
Søgning - et værktøj til videndeling Inspirationsseminar 31. oktober 2006.
Introduktion til Access (Access, del 1)
Opslagsfelter (Access, del 6). RHS – Informationsteknologi 2 Udgangspunkt Vi er ofte i den situation, at valg af en type for et felt ikke begrænser vores.
OTA - et skoleprojekt ved E. Sjørlund, ES-DATA Projekt : News: news://news.the- coffeeshop.dk/coffeeshop.ota.
DK-CLARIN Workspace Struktur - Arbejdsbænk / Workbench Værktøj Ressource Ny ressourceEgen mappe 1DKClarin (KMIV)
Footer med basic Clarin info ( , adresse, …) DKClarin header Forside Mockup - DEMO Søgning på websiden SØG Hjælp / Demo Ressourcer Værktøj Formater.
25. september 2007 Dias 1 Center for Sprogteknologi Evalueringsmetoder i MT Bente Maegaard og Lene Offersgaard Center for Sprogteknologi.
Nyt Fælles Bibliotekssystem
Effektiv adgang til data Niels Mørck, Carl Bro GIS & IT  Carl Bro GIS og IT  Problemstillingen  Nordjyllands Amts Blanketsystem  Centralisering / decentralisering.
1 HMAK XMLRelationel model og XMLNOEA / PQC 2005 SQLServer og XML Hent data via URL Generering af xml –Raw –Auto –Explicit Hent data via template Evt.
Agenda Lidt om forhold og udfordringer E-ressourcer i undervisningen Danmark set fra luften – slip brugerne løs i samlingen Projekt Profilering.
OPI EFFEKTMÅLINGSVÆRKTØJ
DKABM som grundlag for en samlet og konsistent adgang til den arkivalske kulturarv ODA 13/
BlueDoc 2.0 (C) 2003 TMA Components Web-integreret Intranet søgemaskine.
ALEPH og XML. eLib Seminar 18 – 19 november 2004 ALEPH og XML Status  Print system arbejder med XML lignende mellem filer.  Færdige printfiler kan gemmes.
XML og Skemaer Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
Microsoft Office System 21. Oktober 2003 Jesper Aaberg, Business Productivity Advisor Microsoft Danmark.
Hvordan ændrer jeg min SkoleIntras setup, så den passer til de lokale forhold? Man kan tilpasse SkoleIntra til skolens eller kommunens behov på mange måder.
Opslagsfelter (Access, del 6). RHS – Informationsteknologi – Udgangspunkt Vi er ofte i den situation, at valg af en type for et felt ikke begrænser.
Introduktion til Access (Access, del 1). RHS – Informationsteknologi – Fra design til udvikling Vi ved nu, hvordan vi finder et design for en database,
DIEB4.1 Kursusgang 4 Oversigt: Sidste kursusgang Opgaver Aktivitet 2: Generer design (fortsat) Design af interaktionselementer.
Søgning - Integreret modul. eLib seminar 18.–19. november 2004  Integreret i - udlånsklienten - katalogiseringsklienten - accessionsklienten - men ikke.
KB-cases: HUM og NAT Data management i praksis kick-off 27/ Anders Conrad.
Hvordan skriver man sin afsluttende opgave?
DOMS IT-stormøde 16 november 2009 Kåre Fiedler Christiansen.
Vejforvaltning med vejman.dk V/Paul Stühler, projektleder vejman.dk MapInfo konference 2006.
Call Center, adm kursus, indledning Indledning (registrering af kursister & præsentation) 10 min. Hjælpeværktøjer 5 min. System overblik 30 min. Administrator.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Forløbsbeskrivelse for indkaldelse til og afholdelse af koordinerende møde Kontakt til borger – Kender borger tovholder?
1.08 Test.
TEMA 5 Realisering: Tilpas idéen
Integration med adgangskontrol
Effektiv kommunikation med virksomheder - hvordan?
DIGHUMLAB Forskning i tema1 – Sproglige materialer
Tilslutning til den nye inddrivelsesløsning
Introsidernes betydning
Præsentationens transcript:

Dias 1 Center for Sprogteknologi, Københavns Universitet Workshop WP5 18. maj 2009 Resurser, værktøjer, typer og formater, oversigt over arbejdspakkernes bidrag

Dias 2 Center for Sprogteknologi Intro Indholdsoversigt: Opsummering 12 web-services 11 andre værktøjer(foreløbig) Ca 25 ressourcer Muligt mål: At DK-CLARIN’s WP’s ressourcer og værktøjer er “inde” At andre også kan aflevere ressourcer både nu og senere At der er en måde hvorpå nye værktøjer kan integreres At grænsefladen stadig er brugbar når der lægges nye ting ind.

Dias 3 Center for Sprogteknologi Krav til formater i DK-CLARIN (1) Nogle værktøjer kan håndtere flere formater. Nogle kan selv opdage hvilket format er anvendt. Men værktøjer har krav til fil-formater Fx. lemmatiser, speech-scanner, WP3.2’s søgeværktøj Nogle værktøjer har desuden krav til data-formater og forprocessering, Fx pos-tagger, lemmatiser : afhænger af hvordan ord er xml-opmærket, herunder tokenisering Fx. INSS’s søge- og annoteringsværktøj: bruger DUDS- format og der kan laves konvertere fra/til andre formater Visse formater giver derfor en vis funktionalitet!

Dias 4 Center for Sprogteknologi Krav til formater i DK-CLARIN (2) mv Formidlingsopgave til brugeren: hvis alt er tilladt(frit formatvalg i repositoriet) -> så er alt ikke fuldt “brugbart” hvis kun nogle formater er tilladt -> alt kan alligevel ikke lade sig gøre Formidling ang. Mulighed for fejl ved automatiske værktøjer Brugeren skal også informeres om fejlmuligheder. Også en udfordring hvis vi automatisk anvender værktøjer “bag om ryggen” på brugeren fx konverter eller annotering

Dias 5 Center for Sprogteknologi Hvordan får brugeren adgang til data… - Begrænsninger pga rettigheder gemmer vi til i morgen… Metadata ligger i metadata-registrant Hvor ligger data? I repository Eksternt, henvisning Kan de også skulle hentes hos dataejer “on the fly”?

Dias 6 Center for Sprogteknologi Vil vi tilbyde nogle integrerede søgefaciliteter i data? Tekstsøgning/Lemmasøgning direkte i repositorietekster? kun i fordefinerede korporaer? Gennem web-grænsefladen, fælles opslagsside eller “eksternt”? Søgning i audioannotering vha. WP3.1 og WP3.2 søgemaskiner Opslag i ordbøger: Gennem web-grænsefladen, fælles opslagsside eller “eksternt”? Direkte i repositorie-ressourcer der ligger i xml?

Dias 7 Center for Sprogteknologi Integrering af værktøjer: kun web-services? Web-services REST(+WADL) eller SOAP (+WSDL) Er der også mulighed for at vi integrerer kode direkte? Kunne være nemmere for konvertere, hvis vi vil tilbyde brugeren at konvertere data mellem forskellige formater

Dias 8 Center for Sprogteknologi Integration af værktøjer Web-service-brug 1.bruger vælger data fra repositorie 2.systemet generer data til web-service 3.systemet aktiverer web-service 4.systemet modtager “svar” 5.systemet fortolker “svaret” og præsenterer det for brugeren Brugergrænsefladen/præsentationen af resultatet: Laves det af værktøjsejer eller i samarbejde med værktøjsejer (iFrame) Nogle værktøjer har begrænsninger/optioner som gør det “indviklet” at bruge dem med alle facetter Kræver kommunikation til bruger

Dias 9 Center for Sprogteknologi Næste skridt ang. Tools/Web-services Rundspørge til leverandører Skabelon for at indhente oplysninger På denne baggrund beslutte her i gruppen om alt skal være web-services, kode integreres direkte eller måske “både og” Implementere 1-2 prototyper på web- services/værktøjsintegration til T21 Specifikation af integration afleveres af partnere T23 Beta implementation T28 som gammel plan

Dias 10 Center for Sprogteknologi Spørgeskema ang. Web-services Spørgsmål til web-service-leverandører: 1. Giv en kort beskrivelse af hvad din webservice leverer 2. Beskriv et brugsscenarie af din webservice 3. Er din webservice SOAP eller REST baseret (Eller evt. andre protokoller / formater) 4. Beskriv input til din webservice - Hvilke forskellige formater accepterer den - Hvilke forskellige funktionaliterer har samme webeservice. 5. Hvad er output fra din webservice - Er output i sig selv en ny DKClarin ressource. 6. Hvor lang tid går der fra man spørger webservicen til man får et svar (sekunder, minutter) > - Er der begrænsninger for hvor meget trafik der må være på webservicen. 7. Må alle tilgå webservices, eller er det KUN dkclarin brugere?

Dias 11 Center for Sprogteknologi Konvertering Forskel mellem formatkonverteringer og automatiske annoteringer. De første er fejlfrie skønt de kan give informationstab, De sidste er fejlbehæftede skønt de ikke giver informationstab. Det skal brugeren måske gøres opmærksom på. Opdager brugeren konverteringer, lemmatiseringer?

Dias 12 Center for Sprogteknologi Noter

Dias 13 Center for Sprogteknologi Metadata - status for spec-opgaverne Generelle metadata: opdateret forslag afventer sparring mellem KB og CST. WP2 har opnået enighed om metadata-struktur for WP2-tekster i TEI-P5 format. WP3.2 har lovet beskrivelse for deres metadata i næste uge. Denne forventes at kunne tilpasses audio og video for hele WP3 WP4 Lavt ambitionsniveau, ikke påbegyndt Hver arbejdspakke kan specificere nogle metadata som er obligatoriske WP5.2 specificerer for samlinger EU-CLARIN aktiviteter: vi forsøger at holde os orienteret

Dias 14 Center for Sprogteknologi Drift Aspekter til overvejelse: hw og operativsystem/basis-sw-vedligehold Vedligehold af 3. parts sw-pakker/moduler Vedligehold af egenudviklet sw Web-service-integration-vedligehold Nye web-services Grænseflade-vedligehold Nye data og nye formater for data

Dias 15 Opsummering