Henning Grauballe Lektor Danmarks Biblioteksskole, Aalborg Institut for Informationsstudier
Forskning og projekter indenfor ABM området Tøjhusmuséet Statsbiblioteket Danmarks Kunstbibliotek Rigsarkivet Kulturarvsstyrelsen
Forskning og projekter indenfor ABM området Tøjhusmuséet: Ph.d-projekt understøtte tilgængeliggørelsen af den fysiske kulturarv synliggørelse gennem publicering på WWW udgangspunkt i Tøjhusmuseets samlinger problemstillinger i forbindelse med taxonomier og emneordssystemer Projektdeltager: Mette Skov
Forskning og projekter indenfor ABM området Statsbiblioteket: Ph.d-projekt analyse og vurdering af de særlige problemstillinger, der knytter sig til registrering og organisering af samlinger af ikke-trykte medier anvendelse af automatiseret registrering/indeksering udgangspunkt i Statsbibliotekets samlinger bidrage til kvalificering af grundlaget for Statsbibliotekets arbejde med registrering og (fremtidig) genfinding af især audiovisuelle medier (radio, tv, video, musik- og taleoptagelser) Projektdeltager: Brian Kirkegaard
Forskning og projekter indenfor ABM området Danmarks Kunstbibliotek: Ph.d-projekt vidensorganisation inden for billed- og kunstdomænet understøtte tilgængeliggørelse af den visuelle kulturarv i arkiver, biblioteker og museer udgangspunkt i Danmarks Kunstbiblioteks samlinger analyse og vurdering af de særlige vidensorganisatoriske teknikker og problemstillinger, der knytter sig til bibliotekets visuelle samlinger Projektdeltager: Besættes sommeren 2005
Forskning og projekter indenfor ABM området Rigsarkivet: Forskningsprojekt analyse af Rigsarkivets muligheder for at etablere en struktureret emneadgang til arkivets samlinger Projektdeltagere: Haakon Lund, Birger Larsen og Jack Andersen
Forskning og projekter indenfor ABM området Kulturarvsstyrelsen: mapning af registreringsformater fra ABM-sektoren til Dublin Core identifikation og analyse af problemstillinger vedrørende konvertering af data til fællessystem Projektdeltagere: Haakon Lund og Henning Grauballe med bidrag af Per Mørkegaard Hansen, Index data Aps
Mapping af udvalgte data fra ABM - poster til Dublin Core Enkelhed: Fælles ABM - format Mål: Understøttelse af fælles offentlig adgang til Arkiv- Biblioteks- og Museums-ressourcer Målgruppe: Almenheden Hvordan: Mapping af udvalgte data fra ABM - poster til Dublin Core Enkelhed: Så tæt på standardiseret Dublin Core Metadata Element set (ISO15836:2003) som muligt Mapping af 4 domæne-specifikke data-formater Hensyn til datatab og post semantik Understreg, at målgruppen ikke er professionelle men almenheden. Dette har betydning ved valg af data-elementer
Hvorfor en national dansk ABM / DC version ? Eksisterende ABM-formater bygger på systemspecifikke formater Inspireret af internationale standarder men med nationale tilpasninger Registreringstraditioner regler Udviklet med vægt på kravene indenfor de specifikke ABM – domæner
Repræsentationer af fysiske enheder Beskrivelse af digitale enheder Poster er Repræsentationer af fysiske enheder Beskrivelse af digitale enheder Hvordan bevares den originale funktionalitet af data elementer ? Søgeindgange Præsentation De enkelte records er repræsentationer af det oprindelige dvs der er en mening med den udformning de er givet
Grundlæggende problemstilling Samlinger vs Enheder Beskrivelse på samlings-niveau Museer / Arkiver (Arkiv-fonds eller Sager) Aggregat af enheder Beskrivelse på enheds-niveau Biblioteker (AACR2 og Marc) Registrering på enheds-niveau Samlinger via emne, form eller virtuelle samlinger Samlinger i kraft af flerpost-struktur Samling = for det meste gruppering af enheder i sager
Arkiver ABM domæner Database: Arkibas 4 Data-leverandører: Sammenslutningen af Lokalarkiver (SLA) Registrerings-format: Database specifik Indhold: 1.5 million registreringer Database: Daisy Data-leverandører: Statens Arkiver Indhold: 70.000 arkivskabere, 400.000 heuristiske enheder, 3 million pakker og bind
Biblioteker Muséer: ABM domæner Database: DanBib Data-leverandører: Folke- og forskningsbibliteker, Dansk National Bibliografi, LC, BL Registrerings-format: danMARC2 Indhold: 23.7 millioner poster Muséer: Database: Regin Data-leverandører: Kulturhistoriske muséer Registrerings-format: Database specifik Indhold: ??
Dublin Core generelt Grundlæggende sæt af metadata-elementer Udviklet mhp. ophavsgenererede beskrivelser (af internet ressourcer) Genfinding (Resource discovery) Oprindelig udviklet til beskrivelse af dokument-lignende objekter (tekster) men DC metadata kan anvendes på andre typer af ressourcer Interessen spreder sig til Arkiver og Muséer ARENA/ADS (Archaeological Records of Europe - Networked Access/Archaeology Data Service) CIMI ( Consortium for Computer Interchange of Museum Information) RSLP (Research Support Libraries Programme) NOKS (Nordjyllands Kulturhistoriske Søgebase)
Dublin Core generelt Generelle principper for Dublin Core: kernen i element sættet kan udvides efter behovet i konkrete domæner alle elementer er frivillige alle elementer kan gentages elementer kan modificeres vha. kvalifikatorer
Dublin Core generelt DC består grundlæggende af 15 metadata elementer i tre grupperinger: Title, Subject, Description, Language, Relation, Coverage Creator, Publisher, Contributor, Rights Date, Type, Format, Identifier
Dublin Core generelt DC Name Refinements Eksempel Title Creator Dublin Core generelt DC Name Refinements Eksempel Title Alternative Lemprières ordbog : roman Creator Lawrence Norfolk Subject historie huguenotter Ostindisk Kompagni mytologi Description Table of contents, Abstract Historisk roman om Lemprière (1765-1824), forfatteren af et berømt leksikon, og om den fantastiske intrige af verdensomspændende rækkevidde han langsomt afdækker, da hans fader er død på mystisk vis Publisher Kbh. : Munksgaard/Rosinante Contributor oversat af Thomas Harder
Dublin Core generelt DC Name Refinements Eksempel Date Type Format Dublin Core generelt DC Name Refinements Eksempel Date Created, Valid, Available, Issued Modified, Date copyrighted Date submitted 1997 Type Tekst Format Extent Medium 492 sider Papir Identifier Bibliographic citation 87-16-16094-0 Source Lemprière's dictionary
Dublin Core generelt DC Name Refinements Eksempel Language Relation Dublin Core generelt DC Name Refinements Eksempel Language dansk Relation Is version of, Has version Is replaced by, Replaces Is required by, Requires Is part of, Has part Is referenced by, References Is format of, Has format Conforms to 2. paperbackudgave Coverage Spatial Temporal England; Frankrig 1600-1699 1700-1799 Rights Access rights
Dublin Core i relation til mapping Generelt vil der være en række DC elementer som vurderes ikke at være relevante for arkiver og muséer F.eks. DC.publisher og DC.language DC.title Forskellige typer af titler: For arkiver og muséer ofte en titel tildelt ressourcen For biblioteker en titel udtrukket fra ressourcen
Dublin Core i relation til mapping DC.creator Forskellige typer af ophav: Ophav til en SAG f.eks. et museum Ophav til værk/dokument Ophav som institution der har skabt arkivalier Refinements: PreferredName: Vedtagen navneform for ophav AlternativeName: Andre navneformer for ophav (DAISY) TemporalPeriod: Tid for ophavs virke (startår-slutår) Eksempel: DC.Creator.PreferredName = Abel Catrines stiftelse DC.Creator.TemporalPeriod = 1741 - 1949
Dublin Core i relation til mapping DC.subject Angivelse af emnedata Velbeskrevne systemer angives som ”Schemes” Eksempel: UDC; DK5 Etablering af fast navn for systemer ikke beskrevet i DC Eksempel: Den grønne registrant
Dublin Core i relation til mapping DC.description Anvendes til beskrivelse af ressourcen Abstract, gengivelse af indholdsfortegnelse mm. Eksempel: Tekstuelle beskrivelse af sag/genstand (Regin) DC.date Anvendes til angivelse af ”udgivelsesdato” Eksempel: Bestemt år/dato for skabelse af genstanden (Regin)
Dublin Core i relation til mapping DC.type Anvendes til angivelse af ressourcens genre/type DCMI Type Vocabulary anvendes hvor data ikke findes i den oprindelige ressource Anvendes desuden med det formål at kunne skelne mellem hvilket niveau posten befinder sig på Eksempel: Collection anvendes som betegnelse for ressource-type sag (REGIN) og PhysicalObject for ressource-typen skib (REGIN) Collection anvendes som betegnelse for hovedpost (danMARC2 felt 014), Text for bindpost (danMARC2 felt 015)
Dublin Core i relation til mapping DC.format Anvendes til angivelse af fysisk udstrækning eller varighed af ressourcen Eksempler: Varighed af en film, antal bind og pakker i et arkiv DC.identifier Identifikation af den enkelte ressource
Dublin Core i relation til mapping DC.relation Anvendes til angivelse af relationer til dele i f.eks. en sag eller ved hoved/bindposter i bibliografiske ressourcer. Henvisning foretages ved hjælp af identifikation angivet i Dublin Core/Administrative Components Refinements: Eksempler: hasPart isPartOf
Dublin Core i relation til mapping DC.coverage Angivelse af ressourcens emnemæssige dækning mht. tidsperiode og sted Refinements (inspireret af ADS/Arena) SpatialLocationPlace: stednavn under sogn SpatialLocationParish: sogn SpatialLocationUnitary: herred SpatialLocationCounty: amt, gammel amt SpatialLocationCountry: land, geografisk område TemporalPeriod: tekstlig beskrivelse for periode TemporalPeriodBegin: dato for start TemporalPeriodEnd: dato for slut
Dublin Core i relation til mapping DC.rights Anvendes til oplysninger om eventuelle restriktioner på f.eks. adgang (Arkibas)
Post 1 fra DanBib New approaches to the study of religion / edited by Peter Antes, Armin W. Geertz, and Randi R. Warne. - Berlin ; New York : Walter de Gruyter, 2004. - 2 bd. . - (Religion and reason ; 42 ; 43) ISBN: 311017698X Vol. 1 : Regional, critical, and historical approaches Vol. 2 : Textual, comparative, sociological, and cognitive approaches Adgang via internet (Table of contents) Emne: Religion ; Study and teaching ; History ; 20th century LC: BL41, .N49 2005 Lokal klassifikation: 200.71; 22 Includes bibliographical references and index
Post 1 i MARC format 001 00 *a 2678644 021 00 *a 311017698X *b cloth : alk. paper 245 00 *a New approaches to the study of religion *e edited by Peter Antes, Armin W. Geertz, and Randi R. Warne 248 00 *g Vol. 1 *a Regional, critical, and historical approaches *k 559 s. *z 311017698X 248 00 *g Vol. 2 *a Textual, comparative, sociological, and cognitive approaches *kvi, 497 s. *z 3110181754 260 00 *a Berlin *a New York *b Walter de Gruyter *c 2004 300 00 *a 2 bd. 440 00 *a Religion and reason *v 42 *v 43 650 00 *a Religion *x Study and teaching *x History *y 20th century 700 00 *a Antes *h Peter *c 1942- 700 00 *a Geertz *h Armin W. *c 1948- 700 00 *a Warne *h R. R. *k Randi Ruth *c 1952- 856 00 *3 Table of contents *u http://www.loc.gov/catdir/toc/ecip051/2004022173.html
Mapping fra DanMARC2 til DC DC title DC format DanMARC2 felt Dublin Core element Refinement 248 00 *g Vol. 1 *a Regional, critical, and historical approaches *k 559 s. *z 311017698X relation has part DC format DC identifier
Post 2 fra DanBib TIDSSKRIFTSARTIKEL Constitutional and legal reform in Ireland, 1937-1998 : the American context : an essay in culture and law McQuaid, Sarah Dybris I: Nordic Irish studies. - Vol. 1 (2002). - S. 121-146 Link til værtspublikation Emne: Robinson, Mary ; Irland ; USA ; forfatningsret ; retsvæsen ; menneskerettigheder ; historie ; 1900-1999 DK5: 34.28 Med litteraturhenvisninger
Post 2 i MARC 001 00 *a 87390128 016 00 *a 49296835 245 00 *a Constitutional and legal reform in Ireland, 1937-1998 *c the American context *c an essay in culture and law 300 00 *a S. 121-146 557 00 *a Nordic Irish studies *j 2002 *z 1602-124X *V Vol. 0001 (2002) *v Vol. 1 (2002) 666 00 *0 *e Irland 666 00 *0 *e USA 666 00 *0 *f forfatningsret 666 00 *0 *f retsvæsen 666 00 *0 *f menneskerettigheder 666 00 *0 *f historie 666 00 *0 *i 1900-1999 700 00 *a McQuaid *h Sarah Dybris
Mapping fra DanMARC2 til DC Post 2 DanMARC2 felt Dublin Core element Refinement 016 00 *a 49296835 relation is part of 557 00 *a Nordic Irish studies *j 2002 *z 1602-124X *V Vol. 0001 (2002) *v Vol. 1 (2002) Post for værtspublikation DanMARC2 felt Dublin Core element Refinement DC/AC identifier 001 00 *a 49296835
Administrative Components Udvidelse af DC til udveksling af poster ”Meta-data om meta-data” AC - component Post på andet niveau AC er meta-data om meta-data. På administrativt niveau DC - part
Post 3, 4 & 5 fra DanBib Wallace, Patrick F. The Viking Age buildings of Dublin / Patrick F. Wallace. - Dublin : Royal Irish Academy, 1992. - 2 bind : ill.. - (Medieval Dublin Excavations 1982-81. Ser A ; vol. 1 (1992)) ISBN: 1-874045-01-1 Opstilling i folkebiblioteker: 91.155 FAUSTNR: 4 352 807 6 Emne: vikingetiden ; bygninger ; arkæologi ; Irland ; Dublin DK5: 91.155 På titelsiden: National Museum of Dublin Part 1 : Text. - xv, 207 sider FAUSTNR: 4 352 808 4 Oversigt over hele værket References: side 114-119 Wallace, Patrick F. The Viking Age buildings of Dublin / Patrick F. Wallace. - Dublin : Royal Irish Academy, 1992. - 2 bind : ill.. - (Medieval Dublin Excavations 1982-81. Ser A ; vol. 1 (1992)) ISBN: 1-874045-01-1 Opstilling i folkebiblioteker: 91.155 FAUSTNR: 4 352 807 6 Emne: vikingetiden ; bygninger ; arkæologi ; Irland ; Dublin DK5: 91.155 På titelsiden: National Museum of Dublin Part 2 : Illustrations. - vii, 215 sider : ill. FAUSTNR: 4 352 809 2 Oversigt over hele værket
Post 3, 4 & 5 i MARC 001 00 *a 43528076 021 00 *a 1-874045-01-1 100 00 *0 *a Wallace *h Patrick F. 245 00 *a The ¤Viking Age buildings of Dublin *e Patrick F. Wallace 300 00 *a 2 bind *b ill. 440 00 *a Medieval Dublin Excavations 1962-81 *n Ser A *v vol. 1 (1992) 512 00 *a På titelsiden: National Museum of Dublin 666 00 *f arkæologi 666 00 *f vikingetiden 666 00 *e Irland 666 00 *e Dublin -------------------------------------------------- 001 00 *a 43528084 014 00 *a 43528076 245 00 *g Part 1 *a Text 300 00 *a xv, 207 sider 532 00 *a References: side 114-119 -------------------------------------------------- 001 00 *a 43528092 014 00 *a 43528076 245 00 *g Part 2 *a Illustrations 300 00 *a vii, 215 sider *b ill.
Mapping fra DanMARC2 til DC Hovedpost DanMARC2 felt Dublin Core element Refinement 001 00 *a 43528076 DC/AC identifier Bindpost DanMARC2 field Dublin Core element Refinement 001 00 *a 43528084 DC/AC identifier 014 00 *a 43528076 relation is part of 245 00 *g Part 1 *a Text title 300 00 *a xv, 207 sider format (extent)
REGIN / DMI ID Description Spatial coverage Temporal coverage Subject File ID Description Spatial coverage Temporal coverage Subject Item Item Item Item
REGIN -> DC Mapning af en hierarkisk struktur til en flad struktur Flerpoststruktur DC/AC – løsning Kan være kompleks b) Mapning til enkelt post umiddelbart simpelt semantisk mudret
REGIN / DMI Sagsniveau Enhedsniveau Enhedsniveau Sag nr. 10/00 : Div. porcelæn og bøger Syltetøjsskål, kande og glas, Raadvad knive i etui, kogebog, manuskript til en bog og julekort lavet som et personligt brev. Alle genstandene er fra o. 1850-1900. Derudover var der en postkvitteringsbog til sagen, denne skal sendes til Bornholm, da den stammer fra Rønne. Til sagen var der også 20 bøger og hæfter. Bøgerne var hovedsageeligt skønlitterære med nogle enkelte sangbøger og et mindehæfte. Disse er nu opstillet på biblioteket. Størstedelen af bøgerne var også fra 1800´tallet. Der kommer muligvis flere genstande til sagen. Genstande : 7 Genstand nr. 10/00x2 Syltetøjsskål Syltetøjsskål fra Bing og Grøndahl. Skålen er indrettet således at forskellige typer syltetøj har sit eget lille holder, i toppen af skålen er der et "krus", der sikkert har kunnet huse skeer eller lign. Skålen er fra mellem 1853-1895.. Periode : 1850-1920 industritid Indkomstmåde : passiv indsamling Sted/Registrant Overgruppe : Bordstel og borddækning (J03a ) Genstand nr. 10/00x3 Stofetui med 6 Raadvad knive Bestiketui i stof med 6 Raadvad knive med porcelænsskaft. Knivene er ikke mærket. Periode : Ikke angivet Indkomstmåde : passiv indsamling Sted/Registrant Overgruppe : Bordstel og borddækning (J03a ) Enhedsniveau Enhedsniveau
REGIN -> DC (mapning i en enkelt post) DC.Title = Div. porcelæn og bøger DC.Title = Stofetui med 6 Raadvad knive DC.Title = Syltetøjsskål DC.Description = Syltetøjsskål fra Bing og Grøndahl. Skålen er indrettet således at forskellige typer syltetøj har sit eget lille holder, i toppen af skålen er der et "krus", der sikkert har kunnet huse skeer eller lign. Skålen er fra mellem 1853-1895.. DC.Description = Syltetøjsskål, kande og glas, Raadvad knive i etui, kogebog, manuskript til en bog og julekort lavet som et personligt brev. Alle genstandene er fra o. 1850- 1900. Derudover var der en postkvitteringsbog til sagen, denne skal sendes til Bornholm, da den stammer fra Rønne. Til sagen var der også 20 bøger og hæfter. Bøgerne var hovedsageligt skønlitterære med nogle enkelte sangbøger og et mindehæfte. Disse er nu opstillet på biblioteket. Størstedelen af bøgerne var også fra 1800´tallet. Der kommer muligvis flere genstande til sagen. DC.Description = Bestiketui i stof med 6 Raadvad knive med porcelænsskaft. Knivene er ikke mærket. DC.Subject = Bordstel og borddækning DC.Subject = Bordstel og borddækning DC.Subject = Genstande DC.Coverage.Temporal = 1850-1920 DC.Coverage.Temporal = Ikke angivet
REGIN -> DC (mapning til flerpoststruktur) DC/AC.Identifier= 6 [p_Entitet.entitetId] DC.Title = Div. porcelæn og bøger DC.Description = Syltetøjsskål, kande og glas, Raadvad knive i etui, kogebog, manuskript til en bog og julekort lavet som…… DC.Type= Collection DC.Relation.hasPart= 7 + 8 [p_Genstand.genstandId] DC/AC.Identifier= 7 [p_Genstand.genstandId] DC.Title = Syltetøjsskål DC.Description = Syltetøjsskål fra Bing og Grøndahl. Skålen er indrettet …… DC.Subject = Bordstel og borddækning DC.Type= PhysicalObject DC.Coverage.Temporal = 1850-1920 DC.Relation.isPartOf= 6 [p_Entitet.entitetId] DC/AC.Identifier= 8 [p_Genstand.genstandId] DC.Title = Stofetui med 6 Raadvad knive DC.Description = Bestiketui i stof med 6 Raadvad knive med porcelænsskaft. Knivene er ikke mærket. DC.Subject = Bordstel og borddækning DC.Type= PhysicalObject DC.Coverage.Temporal = Ikke angivet DC.Relation.isPartOf= 6 [p_Entitet.entitetId]
Yderligere problemstillinger Ved angivelse af DC.type og DC.format kan der forventes en del inkonsistens mellem de oprindelige registreringsformater. Det bør overvejes om denne inkonsistens skal elimineres ved udarbejdelse af fælles standardiserede betegnelser
Inkonsistens Konvertering af data fra fire meget forskellige domæner inkonsistens Registrering af forskellige typer af artefakter mangel på fælles karakteristika Ujævnhed i konverterede data må accepteres pointeres for brugere af kommende fællessystem Indikation af hvor data oprindelig stammer fra
Information om oprindelig dataproducent Anvendelse af DC/AC til håndtering af systemadministrative data, herunder angivelse af dataproducerende system Eksempler: AC.identifier=[001 *a] AC.identifier.proveniens=[DanBib] AC.identifier=[p_entitet.EntitetID] AC.identifier.proveniens=[p_entitet.MuseumID] Hermed muligt at tage hensyn til domænespecifikke forhold ved: etablering af søgeregistre dannelse af præsentationsformater
Konklusion Udvidelse af Dublin Core element sæt med administrative meta-data (DC/AC) Identifikation af data-oprindelse Lænkning af poster Kompleks Løsning med enkeltposter Simpel - Præsentation (multi-level records) - Identifikation af søgeindgange (multi-level records) Anbefaling Multi-level records af hensyn til klarhed i data