Download præsentationen
Præsentation er lastning. Vent venligst
Offentliggjort afSten Knudsen Redigeret for ca. et år siden
1
CorpusEye Et brugervenligt web-interface til grammatisk opmærkede korpora Eckhard Bick http://corp.hum.sdu.dk
2
Baggrund Det tværsproglige VISL-projekt 22 undervisningssprog, 7 forskningssprog robust Constraint Grammar parsing "low-tech" brugere: Lærere, lingvister "high-tech"-brugere: Datalingvister, informatikere
3
Hvad skal et korpus bruges til? Undervisning: ord og vendinger i kontekst eksempler på grammatiske konstruktioner stilistisk analyse og sammenlingning almen sprogforståelse og - bevidstgørelse Forskning: leksikografi frekvensundersøgelser valensforskning sprogudviklingsundersøgelser sociolingvistik
4
Hvordan øger man værdien af et korpus? - 1. Opmærkning token vs. lemma morfologisk information: Genus, numerus... syntaktisk information: (a) funktion: Subjekt, objekt... (b) form: Syntagmer, ledsætninger... semantisk information: Semantiske prototyper, semantiske roller, anafora
5
Opmærkning: ordbaseret CG
6
Opmærkning: Træbankformat
7
Korpusmerværdi: 2. Revision
8
Korpusmerværdi: 3. Søgeinterface fri adgang: (a) web-baseret uden installation og registrering (b) helst frie data (uden password) graded complexity: Formel viden om etiketter og søgesproget er ikke nødvendigt og kan erhverves inkrementelt reg.ex.: joker-tegn og bool'ske operatorer menuer for kategorivalg ordnede data: konkordans, sortering, statistik
9
Hvilke korporaHvilke korpora?
10
Hvilke korpora 2
12
The interface
13
Enkle tekstsøgninger: fx. metaforer og komposita
14
Menubaseret kategorisøgning
15
Output: "rå" konkordans
16
Sortering og statistik
18
"invandrer"adjektivkontekst:
19
"udlænding" adjektivkontekst:
20
"flygtning" adjektivkontekst:
21
imperativerdyremetaforer
22
Træbanker
23
ID-knap = træ-link
24
Verbalkomplementering: * < (/P:/ < /spist?er?/ $.. /Od/)
25
Live korpora: The TextPainterThe TextPainter
Lignende præsentationer
© 2024 SlidePlayer.dk Inc.
All rights reserved.