CorpusEye Et brugervenligt web-interface til grammatisk opmærkede korpora Eckhard Bick

Slides:



Advertisements
Lignende præsentationer
Kommakursus ”light” Middelfart Gymnasium 2009.
Advertisements

Sådan finder du rundt på Af Lasse Krarup, webmaster
RefWorks 2.00 Velkommen til Det Natur- og Sundhedsvidenskabelige Fakultetsbibliotek - Frederiksberg Campus.
Grundlæggende PowerPoint
Fra formel til funktionel undervisning
DIT-systemet et par introducerende eksempler
Vejviser til Sønderhøj 14, 8260 Viby J
Links Web-udvikling med FrontPage 2003 RHS - Informationsteknologi.
2.-generationsintranet på KU Internet, intranet, ekstranet eller "mit net"? Claus Qvistgaard It-strategichef
Lasse, Theis og Bertram 2.5.  Vores produkt skal være simpelt og nemt at bruge  Man skal kun kunne gå op og ned i menuerne (holder det simpelt)  Der.
Strategi Interoperabilitet Web service – nye standarder danZIG-mødet Leif Andresen Biblioteksstyrelsen.
Begreber og Redskaber 1 BRP.
1 Intro nedarvning (eng.: inheritance) Nedarvningshierarkier Intro polymorfisme (eng.: polymorphism) Abstract / virtual / override / sealed Intro interfaces.
Sådan kommunikerer vi på Dyvekeskolen
Motivation for at indgå i VISL ud fra et seminarieperspektiv Undervisningsbaseret interesse (ikke forskningsbaseret) Studerende, som har for lidt – interesse.
Eckhard Bick Morfosyntaktisk opmærkede korpora for dansk: Korpus90 og Korpus2000 Arboretum Eckhard Bick, 2000.
Mdl. eksamen Emilie & Emil.
Navigation Web-udvikling med FrontPage 2003 RHS - Informationsteknologi.
Begrebsafklaring og et blik på sprogets betydning for tosprogede børn
Kommakursus ”light”.
VISL – begrænsninger og styrker
Adobe læseprogrammet Adobe Digital Editions - installationsprocessen Inden du køber og downloader en e-bog/e-lydbog (en grafisk guide)
Effektivitet, kvalitet og udvikling i daglig drift Konference om tværprofessionelle uddannelsesperspektiver Professionshøjskolerne, Aarhus 22. maj 2012.
PBJ Consult A/S – Mere end et systemhus HR i øjenhøjde
Operationer på relationer
Indhold 1.Hvad er MATRIX Mobil 2.Menu Valg 3.Installation 4.Adgang.
Store IT- innovationer (SITIN) TØ6. Dagens program Overordnet feedback til OO2 Øvelse til kap. 10 Mine projekter Ugens opgave/OO3 Individuel feedback.
No. 1 TemaTitelMateriale 1 IS i sundheds-sektorenPatientdatas anvendelighedLynge et al. 2 Registrering af patientdata Berg. Kap. 2 Waiting for Godot. 3.
Datafangst – IRF 1.maj 2009 DAK-E ICPC kodning – Hvorfor kode?
Fundamentale principper for brugervenlige web-sites WEB 1 IT-C 24. Feb
Permanente identifikatorer IR workshop 14. april 2004 Formål: Sikring af adgang til digitale objekter over tid Adgang er et spørgsmål om Bevaring + Permanent.
Videregående pc-vejledning Modul 07: Elektronisk post 60+Bornholm.
WordNet Elektronisk leksikalsk database Semantisk ordbog Ca
Informatik-civilingeniør på DTU. Civilingeniøruddannelsen 5. årEksamensprojekt + valgfrie kurser 4. årValgfrie kurser 3. årValgfrie kurser 2. årFagpakke.
Fakta og myter om offshoring Torben Pedersen Professor Institut for Strategisk Ledelse og Globalisering Copenhagen Business School.
’Card sort’ Kort sortering  Om ’Usability testing’  Praktisk information vedr. øvelserne  Dagens øvelse  Aflevering af testrapporter  Diverse.
Evaluering af MT SDMT-SMV2 Workshop 2 Bente Maegaard, Lene Offersgaard Center for Sprogteknologi, Københavns Universitet
Comparable Students German Students Composite Pattern State Pattern Observer Pattern Collections Interfaces Abstrakte klasser Design Patterns.
DWDK Øvelsesgang 2. Tegnsæt: utf-8 vs. iso Utf-8 = universelt tegnsæt Giver advarsel i validator Dokument skal gemmes i utf-8 format i notepad.
Produkt præsentation Christian Cletus Bjørn Eilertsen.
Organisering og navigation Ole Gregersen 22. Februar 2006 Usability.
3) Sprog og diskursfællesskab
Semantik, model teori Et (formalt) sprog har ingen mening indtil man interpreterer dets forskellige (korrekte) udtryksformer (vff’s) mhp. en bestemt situation.
ANALYSE AF WEBADFÆRD | F2003 OAW – LEKTIONSGANG 8.
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 8.
9. Interfaces. 2 Nordjyllands Erhvervakademi Objectives “Good class design starts with good application design — how many classes, do they relate.
KB-cases: HUM og NAT Data management i praksis kick-off 27/ Anders Conrad.
Udvikling af mobilsites Einar Gislason / FTF. Mobilsites Mobilvenlige sites.
OPERATIONEL ANALYSE AF WEBADFÆRD OAW – LEKTIONSGANG 8.
23. juni 2015 Det Semantiske Web Mads Carlsen. 23. juni 2015 Problemer med det nuværende Internet Ingen semantiske specifikationer. Søgning giver mange.
Med døden til kaffe – den nødvendige samtale. 6% vs. 71%
DeepDict Et korpusbaseret relationelt leksikon Eckhard Bick Syddansk Universitet & GrammarSoft ApS.
Indsæt hjælpelinjer til placering af objekter 1. Højre klik udenfor slidet og vælg ’Gitter og hjælpelinjer’ 2. Sæt kryds ved ’Vis tegne- hjælpelinjer på.
Corpus Linguistics Used to Explore New Fields Birthe Mousten M.Engl. Ph.D. 7. oktober 2015.
Grammatik Sætninger. Typer af sætninger Sætning: består mindst af et subjekt og et verballed Peter løber Helsætning: en sætning, der kan stå alene Eva.
SYNTKATISK SIGNIFIKATION HVORDAN FINDER VI SUBJEKTET (OG OBJEKTET)? TYSK FAGDAG 6. FEBRUAR 2015 LASSE BRUNØ.
Automatisk oversættelse af
Teknisk informationsmøde 2009
Digital humaniora på KB
Tilgange i humanistisk forskning (med udgangspunkt i sprogvidenskaben)
Tilgange i humanistisk forskning (med udgangspunkt i sprogvidenskaben)
DIGHUMLAB Forskning i tema1 – Sproglige materialer
Modul 07, Elektronisk post
Systemtech A/S IT-leverandør til uddannelsessektoren
- 30 minutters oplæg - 30 minutters ordet er jeres
Management reporter Finanstal Aktivitetstal fra AX
Software Construction
»Jeg tror jeg kan altid huske det danske sprog«
Præsentationens transcript:

CorpusEye Et brugervenligt web-interface til grammatisk opmærkede korpora Eckhard Bick

Baggrund Det tværsproglige VISL-projekt 22 undervisningssprog, 7 forskningssprog robust Constraint Grammar parsing "low-tech" brugere: Lærere, lingvister "high-tech"-brugere: Datalingvister, informatikere

Hvad skal et korpus bruges til? Undervisning: ord og vendinger i kontekst eksempler på grammatiske konstruktioner stilistisk analyse og sammenlingning almen sprogforståelse og - bevidstgørelse Forskning: leksikografi frekvensundersøgelser valensforskning sprogudviklingsundersøgelser sociolingvistik

Hvordan øger man værdien af et korpus? - 1. Opmærkning token vs. lemma morfologisk information: Genus, numerus... syntaktisk information: (a) funktion: Subjekt, objekt... (b) form: Syntagmer, ledsætninger... semantisk information: Semantiske prototyper, semantiske roller, anafora

Opmærkning: ordbaseret CG

Opmærkning: Træbankformat

Korpusmerværdi: 2. Revision

Korpusmerværdi: 3. Søgeinterface fri adgang: (a) web-baseret uden installation og registrering (b) helst frie data (uden password) graded complexity: Formel viden om etiketter og søgesproget er ikke nødvendigt og kan erhverves inkrementelt reg.ex.: joker-tegn og bool'ske operatorer menuer for kategorivalg ordnede data: konkordans, sortering, statistik

Hvilke korporaHvilke korpora?

Hvilke korpora 2

The interface

Enkle tekstsøgninger: fx. metaforer og komposita

Menubaseret kategorisøgning

Output: "rå" konkordans

Sortering og statistik

"invandrer"adjektivkontekst:

"udlænding" adjektivkontekst:

"flygtning" adjektivkontekst:

imperativerdyremetaforer

Træbanker

ID-knap = træ-link

Verbalkomplementering: * < (/P:/ < /spist?er?/ $.. /Od/)

Live korpora: The TextPainterThe TextPainter