DIGHUMLAB Forskning i tema1 – Sproglige materialer

Slides:



Advertisements
Lignende præsentationer
Fokusgruppe Hvad er en fokusgruppe?
Advertisements

Nyt rum til læring og udvikling på SDU
Hvad handler tekster om? Eksempler på brugen af automatisk klassifikation og tagging i online nyhedsmedier. Rune Stilling RDFined.
Tilgængelighed og elektroniske dokumenter. Retningslinjer •For ikke-W3C formater –Word, Excel, PDF, Flash, ODF,... –Hvis utilgængelige, så skal findes.
Dias 1 Stormøde 7. okt DK-CLARIN WP5 Lene Offersgaard, Bart Jongejan WP5 Metadata, ressourcetyper, og værktøjer DK-CLARIN stormøde 7. okt
DIT-systemet et par introducerende eksempler
WP 5.2 Kortlægning af eksisterende resurcer/collections
Dansk med it Duncker & Ruus © DIT-systemet Dansk med it Generel præsentation Dorthe Duncker og Hanne Ruus Institut for Nordiske Studier og Sprogvidenskab.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Læring og videndeling om god arbejdsmiljøpraksis Oplæg på AM 2006 ved: Brian Knudsen, Arbejdsmiljøinstituttet Sune Netterstrøm og Peter Frimer, Bymusen.
Mobiltelefoner i mellemtrinnets danskundervisning
Dias 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet WP 5.2 Kortlægning af eksisterende resurcer/collections.
E- undervisning Videreuddannelse for fysioterapeuter Diplomuddannelse.
Værktøjer Tokeniser POS-tagger Navnegenkender Lemmatiser NP-genkender.
Kollegavejledning - indgange • Fag, medier og Faghæfte 48 • Skolekultur og mediekultur • Skolekultur og vejlederkultur • Skolebiblioteket som rum og funktion.
Dansk med it © Duncker & Ruus DIT-systemet Dansk med it Generel præsentation for studerende Dorthe Duncker og Hanne Ruus Institut for Nordiske Studier.
Co-funded by the 7th Framework Programme of the European Commission through the contract T4ME, grant agreement no.: Præsentation af METASHARE –
Dansk med it Duncker & Ruus © DIT-systemet Generel introduktion DIT-systemet Udvikling og testning Dorthe Duncker og Hanne Ruus Institut for.
SDMT-SMV Workshop 1 Lene Offersgaard Center for Sprogteknologi, Københavns Universitet
Autoopmærkning, taksonomi, borgerord og søgning Af Brian Jacobsen Halibut ApS Leverandør til OS2 Sønderborg, 29/ Drupal leverandør Taxon – automatisk.
Forskningsperspektiver på læremidler
Hanne-Pernille Stax, ph.d
INSTITUT FOR UDDANNELSE OG PÆDAGOGIK AARHUS UNIVERSITET Den internationale forskning Om strategier, der styrker relationen mellem teori og praksis i professionsbacheloruddannelser.
Overordnet anbefales: Der henvises i den enkelte opgave/opgavesættet til anvendt IT- værktøj. Hvis der veksles mellem flere i de enkelte opgaver, skal.
©B H Sørensen & K Levinsen Aalborg Universitet 2014 Danmarks Læringsfestival 2014 Projektet etableres Interventioner Løbende implementering Interventioner.
DK-CLARIN Workspace Struktur - Arbejdsbænk / Workbench Værktøj Ressource Ny ressourceEgen mappe 1DKClarin (KMIV)
Gruppeudviklingssamtaler
Tilgængelighed og elektroniske dokumenter Lbc/. Program Tilgængelighed til dokumenter generelt Word og InDesign Tilgængelighed til pdf-filer Øvelser.
Ordnet og tesaurusser Patrizia Paggio Center for Sprogteknologi Københavns Universitet
Footer med basic Clarin info ( , adresse, …) DKClarin header Forside Mockup - DEMO Søgning på websiden SØG Hjælp / Demo Ressourcer Værktøj Formater.
DREJEBOG: Titel på drejebog skrives her
Tilgængelighed og elektroniske dokumenter. Retningslinjer For ikke-W3C formater –Word, Excel, PDF, Flash,... –Der skal findes tilgængelige alternativer.
25. september 2007 Dias 1 Center for Sprogteknologi Evalueringsmetoder i MT Bente Maegaard og Lene Offersgaard Center for Sprogteknologi.
Dias 1 Center for Sprogteknologi, Københavns Universitet Workshop WP5 18. maj 2009 Resurser, værktøjer, typer og formater, oversigt over.
Det semantiske web Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
FOVITS: Informationshåndtering på nettet - sprogteknologiske løsninger 9933 RDF I XML og RDFS Costanza Navarretta Center for Sprogteknologi, Københavns.
XML og Skemaer Costanza Navarretta Center for Sprogteknologi, Københavns Universitet
WordNet Elektronisk leksikalsk database Semantisk ordbog Ca
Tilgængelighed og elektroniske dokumenter lbc/ /2.1.
Fra kursus til lokal skoleudvikling – om og med medier 13. marts 2012.
Microsoft Office System 21. Oktober 2003 Jesper Aaberg, Business Productivity Advisor Microsoft Danmark.
©B H Sørensen & K Levinsen Aalborg Universitet 2014 Konference – Odense d. 11 sept Demonstrationsskoleprojekt Elevernes egenproduktion og elevinddragelse.
Evaluering af MT SDMT-SMV2 Workshop 2 Bente Maegaard, Lene Offersgaard Center for Sprogteknologi, Københavns Universitet
Produktion af musikvideoer 8. årgang, dansk, CA, AD, KU, KK Synlig læring med it Agerbæk Skole og Starup Skole 2013.
Næste uges opgave Forbered interview med opdragsgiver Spørg til målgruppe, primær sekundær Primære mål og funktioner Alle typer data de kan stille til.
CorpusEye Et brugervenligt web-interface til grammatisk opmærkede korpora Eckhard Bick
KB-cases: HUM og NAT Data management i praksis kick-off 27/ Anders Conrad.
EndNote X7 Mandag, d. 13. april Workflow Mac Library mode – Online Search Mode – Intergrated Library & Online Search Windows Library mode – Online.
23. juni 2015 Det Semantiske Web Mads Carlsen. 23. juni 2015 Problemer med det nuværende Internet Ingen semantiske specifikationer. Søgning giver mange.
Brugerundersøgelse Brugssituationen Dataindsamlingsmetoder Spørgeskema
Bjarne Andersen Områdedirektør, it bevaring
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Copenhagen, May 12, 2016 Dias 1 Digital Humaniora, e-science og juraen Birte Christensen-Dalsgaard Project Manager.
Projekter i Aalborg 2015: Studie af Arkitektur og Design studerendes projektarbejde over 34 dage=209timers video Studie af Arkitektur og Design studerendes.
Overskrift her Navn på oplægsholder Navn på KU- enhed For at ændre ”Enhedens navn” og ”Sted og dato”: Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.
Indlejring. Practice Objects Community Skill & Competence building Experts Tools Outreach and user interaction Dialog and marketing Courses and seminars.
TEMA 4 Inspiration & Feedback: Idéen ud i virkeligheden
Kulturministeriets Pure Konsortium for arkiver, biblioteker og museer
Modul 2.1 – Go’dag til Cura og Fælles Sprog III
KUBIS indlejring i KU Absalon & Udvikling af læringsobjekter i www
Reminder……!!!.
Digital humaniora på KB
It i folkeskolens matematikundervisning
Effektiv kommunikation med virksomheder - hvordan?
Introduktion til det tværsektorielle samarbejde om kompetenceudvikling
Metoden fælles beslutningstagning
Brug af elevdata til udvikling af kvalitet i undervisningen
Om prøveformen Filosofi C.
Læringsmål og niveaubeskrivelser
Præsentationens transcript:

DIGHUMLAB Forskning i tema1 – Sproglige materialer Bente Maegaard (med input fra kolleger) bmaegaard@hum.ku.dk

Oversigt Multimodale sprogteknologiske studier Studier i tekst To eksempler hvor CLARIN har spillet en væsentlig rolle Det ene med hovedfokus på forskning Det andet med hovedfokus på undervisning

Multimodale sprogteknologiske studier Brug af CA-data CA= Conversational Analysis Samtaler mellem venner og/eller familiemedlemmer video-optaget hjemme hos folk og transskriberet efter CA’s metode af Johannes Wagners gruppe på Syddansk Universitet Transskriptioner konverteret til PRAAT med script udviklet af Brian MacWhinney’s gruppe (CMU) Ortografisk transskription tidsaligneret på ordniveau og gestus opmærket i ANVIL af CST: hoved- og øjenbevægelser, ansigtsudtryk, kropsholdning, arm- og håndbevægelser følelser/sindstilstand funktioner: feedback, turtagning relationer mellem gestus og ord

Transskription og gestus-opmærkning i følge MUMIN- skema som er blevet anvendt i mange andre sprogteknologiske projekter til at opmærke andre typer data har kunnet bruges til fx at sammenligne gestus i disse samtaler med gestus produceret af folk der møder hinanden for første gang (antal af feedback afhænger af hvor godt vi kender hinanden (flere nik når vi ikke kender hinanden) --> design af robotters gestus bør fx tage højde for dette) at sammenligne gestus i forskellige kulturer mellem folk der kender hinanden godt (gennemført dansk- polsk, ph.d.-studium) at teste automatisk genkendelse af gestusfunktion i forskellige typer opmærkede samtaler (maskinlæring), så langt flere videoer kan opmærkes Publiceret en lang række internationale artikler Costanza Navarretta, Magdalena Lis, Patrizia Paggio

Kunne ikke være gennemført uden CLARIN i DIGHUMLAB Bygger på ressourcer (data og værktøjer) der ligger i CLARIN Bygger på samarbejde i DIGHUMLAB (SDU-KU) Internationale relationer

Korpus-søgning i folkeviser (Hanne Ruus, Dorthe Duncker, Lene Offersgaard) Folkeviser fra 1553-1700 Både med den originale skrivemåde fra renæssancen og med transskription på moderne dansk, se mere på duds.nordisk.ku.dk 6. feb.2015 DIGHUMLAB Clarin.dk

Vejen til korpussøgning i folkeviserne Meget manuelt arbejde gennem lang tid! Manuel annotering, konvertering, formattering Søge med følgende tags: word, neutral, pos, lemma, homograf <file name="HJB10.cqp"> <work title="(Lykken du må vel lignes ved et glar). DKF, vise, 0, 18 r, T, DV: 123 A III 11-12, " author="Hjertebogen"> <Strofe strofeNr="1"> <Vers> Løckyn lykken lykke sb n/a du du du pron n/a maatt måt måtte vb n/a well vel vel adv n/a lygnes lignes ligne vb n/a wed ved ved præp n/a ytt et en art n/a glar glar glar sb n/a , , , , n/a DIGHUMLAB Clarin.dk

DIGHUMLAB Clarin.dk

see you @ info.clarin.dk or www.clarin.eu or bmaegaard@hum.ku.dk