Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Digitalisering af byrådsforhandlinger 1868- 1997. En digital ressource til AarhusArkivet.dk.

Lignende præsentationer


Præsentationer af emnet: "Digitalisering af byrådsforhandlinger 1868- 1997. En digital ressource til AarhusArkivet.dk."— Præsentationens transcript:

1 Digitalisering af byrådsforhandlinger 1868- 1997. En digital ressource til AarhusArkivet.dk

2 Problemstillinger Metoder til retrodigitalisering af kommunale arkivalier Integration af retrodigitaliserede data i en samlet digital løsning Anvendelse af crowdsourcing til berigelse af det generelle arkivsystem (udtræk af data til gennemgående entiteter // ”tags” Eksempel på digitalisering af centrale narrative og ikke statistiske eller genealogiske kilder Perspektiver: fremme brugerinvolvering fremme tilgængeligheden og dermed brugen af kommunearkivet

3 En donation fra Salling-fondene og kommunale innovationsmidler

4 Vores udgangspunkt Mission Vores mission er at give borgerne i Aarhus redskaber til refleksion over fortiden og fortidens rolle for nutiden og på kritisk grundlag skabe medejerskab til byen og understøtte byens brand. Vision Aarhus Stadsarkiv er en organisation, der på grundlag af anerkendte arkivpraksisser og innovative digitale teknikker bevarer og formidler historien som en moderne, inkluderende informationsvirksomhed.

5 Vores udgangspunkt Informations- og videnstrategi Vi arbejder efter en målsætning om, at information er vores mest dyrebare ressource. Vi mener, at informationer så vidt muligt skal være frie. Det, vi ved, skal borgerne også vide. Derfor arbejder vi gerne med åbne data, frie licenser, wikier og digital formidling. Arkivalieforståelse Arkivalier er data overbragt eller tilvejebragt af Stadsarkivet uanset fysisk form. Et retrodigitaliseret dokument og en formidlingstekst er også et arkivalie.

6 Konkrete produkter Et samlet website til alle medier og samlinger – Herunder en integration af samlingsdata (registrering), medier, dokumenter og retrodigitaliserede samlinger som Sejrs Sedler og Byrådsforhandlingerne, biblioteksbase, AarhusWiki + integration med kommunale samlinger som digitaliserede byggesager og historiske luftfotos. Et digitalt arkivsystem En billedløsning (AarhusBilleder) Digitalisering af udvalgte fotosamlinger og filmsamlinger En mobilplatform Smartarkivering fase 2 (B og K-flow integreret i det nye arkivsystem) Designløsning Studieture Digitalisering af Sallingarkivet Indsamling af Salling Memories (=udvikling af prototype på on site-indsamling) ”Din egen historiske e-bog”, udtræk af data til egen komposition

7 Overordnet udfordring: Hvordan sikres integration af data i både registrering og formidling? Data bindes sammen af referencedata baseret på entiteter, dvs. tags/emner, der enten udvindes fra særlige, beskrivende tekstsamlinger eller almindeligt anerkendte taksonomier (DK5, branchekoder mv.).

8 Hvad er entiteter i denne sammenhæng En entitet (-sklasse) er en informationsbærende enhed af blivende interesse for analyseområdet (byen og arkivet). Entiteter samles i autoritetslister En entitet - skal have en nøgle, der entydigt kan identificere de enkelte forekomster i entitetsklassen, - skal være væsentlig for analyseområdet, - kan eksistere selvstændigt, - kan være sted, ting, person, begivenhed eller begreb

9 Hvordan udvindes entiteter (tags) fra særlige, beskrivende tekstsamlinger? 1.Processen begynder med digitalisering af arkivalier ved indskrivning eller scanning // crowdsourcing. 2.Materialet beriges med eksisterende metadata. 3.Materialet beriges med metadata, der kan hentes maskinautomatisk, fx genkendelse baseret på kommunens adresselister. 4.Pause – metadata forstærkes med tagging ved udvidede autoritetslister.

10 Det begyndte med “Sejrs Sedler” fra 125.000 emneindekserede kartotekskort til digital forsknings- og formidlingsressource

11

12

13 Samlet antal sedler: 125.720 Sedler med geotags fra database: 8.944 Sedler med gadenavn uden/eller ugyldigt husnr.: 22.260 Sedler med markeret stedsangivelse uden geotag: 36.896 Sedler med geo-information: 8944 + 22260 + 36896 = 68.100

14 Århus Byråds Forhandlinger 1.Byrådsforhandlingerne 1867-1997 scannes (de ældste med gotisk skrift skrives ind) og oprettes som individuelle elektroniske filer (her hjælper de frivillige også til) 2.Maskingenereret opmærkning af adresser og journalnumre 3.Korrektur af skanningen. Det foregår inde fra et modul, som de frivillige logger sig ind på, og hvor de får adgang til to skærmbilleder – et med et billede af selve byrådssagen og et med den skannede tekst. 4.Den sidste fase er foreløbig, at de frivillige ”opmærker” byrådssagen. Det vil sige, at de markerer personer, steder og organisationer. 5.Emne påføres sagerne fra de sagregistre, der er udarbejdet i tidens løb (bliver nok delvis manuelt) 6.Herefter kan man ved hjælp af journalnummeret bestille den sag, der svarer til referatet, og som gerne skulle ligge nede i arkivets kælder.

15

16 Indskrivning 1867-1899/1900

17 Oprindelige emnesystematik bevares

18 Digitaliserede arkivalier opmærkes af de frivillige

19 En masse data genereres…

20 De opmærkede tekstområder trækkes ud og gennemses. Variationer i stavemåde og små forskydninger i tegnsætning forsøges normaliseret. De normaliserede navne matches mod vores referencedata – indtil videre primært adressedata. Hvis der findes et match kobles den matchede autoritet (entitet) på arkivaliet. Hvis ikke, oprettes autoriteten – næste slide…

21 Entiteter oprettes med de metadata vi nu engang har til rådighed.

22 Som en del af vores referencedata (autoritetslister) kan de frivilliges opmærkninger nu bruges som en kontrolleret indgang til arkivalierne.

23 Hvert arkivalie har i bedste fald en række tilknyttede autoritative entiteter, som kan guide brugeren videre til andre relaterede arkivalier.

24 Hvordan udvindes entiteter (tags) fra særlige, beskrivende tekstsamlinger? Vi kan herefter vende tilbage til de dokumentsamlinger, der tidligere er blevet tagget, og lade computerne lede efter de nytilkomne entiteter (scripts). Scrips erstatter dermed crowdsourcing i udvindingen af tags. Crowdsourcing flyttes (i denne sammenhæng) delvis over til normaliseringsarbejdet med referencedata.

25 Hvor anvender vi entiteterne? - eget arkivsystem - borgernes selvbetjeningsløsning, smartarkivering

26

27

28

29 Problemstillinger Metoder til retrodigitalisering af kommunale arkivalier Integration af retrodigitaliserede data i en samlet digital løsning Anvendelse af crowdsourcing til berigelse af det generelle arkivsystem (udtræk af data til gennemgående entiteter // ”tags” Eksempel på digitalisering af centrale narrative og ikke statistiske eller genealogiske kilder Perspektiver: fremme brugerinvolvering fremme tilgængeligheden og dermed brugen af kommunearkivet


Download ppt "Digitalisering af byrådsforhandlinger 1868- 1997. En digital ressource til AarhusArkivet.dk."

Lignende præsentationer


Annoncer fra Google