KB-cases: HUM og NAT Data management i praksis kick-off 27/ Anders Conrad
Fælles problemstillinger Eksisterende primærdata Struktur og identifikation til at linke og referere Afledte data, annotationer, artikler Søgning/genfinding Adgang og brug Langtidsbevaring Internationalt benyttede data
HUM-casen: TEI korpora Eksempler: Arkiv for Dansk Litteratur Søren Kierkegaards Skrifter Brevbasen Holberg-udgave Clarin.dk Fx Dansk Referencekorpus Forskning i nordisk litteratur og håndskrifter Fx Arnamagnæansk Samling
TEI community Samarbejde med DIGHUMLAB tema 1 Dansk TEI-community under etablering Løsninger så vidt mulig til gavn for mange Evt. brug af sprogteknologiske værktøjer, fx tokenisering
Søren Kierkegaards Skrifter Søren Kierkegaard Forskningscenteret, KU Eksisterende TEI-korpus Behov for at holde data levende til aktiv forskningsbrug Realkommentarerer og evt. fortolkning Intern linkning i teksten Ekstern linkning fra artikler Versionering og proveniens
NAT-casen: Kepler databasen på AU Stort internationalt rumforskningsprojekt Deltagelse fra Aarhus og Københavns Universitet Database af transformerede rådata fra NASA Eksisterende bit-arkivering Restriktioner i adgang og publicering
Kepler behov Langtidsbevaring Strukturerede datasæt Identifikation, genfinding, genbrug Analyser, artikler, kontekstinformation Links til afledte data Links fra artikler Logning/audit Evt. udviklerbistand fra Kepler-projektet