Digitalisering af 32 mio. avissider på 3 år

Slides:



Advertisements
Lignende præsentationer
Søgning efter en fil Du vil finde et Word dokument som du ikke kan huske hvor du har placeret men du kan huske et af ordene i dokumentet Du får dette.
Advertisements

Sådan laver Du et POWER POINT program.
Trehøje-Pigerne Side 1 Vejledning til brug af hjemmesiden Det er slet ikke så vanskeligt – så brug hjemmesiden flittigt… Det er.
Krav til informationsformidling
Jeg har brugt gratis billedebehandlingsprogrammet
7. Januar 2012 Hans Christian Engelbrecht
Flickr.com – online billeddeling
Videregående pc-vejledning Modul 04: Windows-elementer 60+Bornholm.
Løntermometer° Vedligehold dit lønsystem. Løntermometeret Mange virksomheder oplever, at et ellers godt lønsystem efter nogle år ikke længere har den.
Vejledning i weblog-værktøjet
Introduktion ved Anne Reuss
Tilgængeliggørelse af elektroniske arkivalier
Klik på Aktivér redigering i meddelelseslinjen, Hvis videoerne i kurset ikke afspilles, skal du måske hente QuickTime eller blot skifte til PowerPoint.
Vejledning i blog-værktøjet WordPress Opdateret august 2009.
Vejledning i blog-værktøjet WordPress Opdateret oktober 2012.
Vejledning i blog-værktøjet WordPress Opdateret august 2008.
Vejledning i blog-værktøjet WordPress Opdateret februar 2009.
Beskyt din computer og dine data!
Velkommen til Statsbiblioteket
Kommunikation / it.
Statsbibliotekets opgaver
Undervisning i Plone CMS marts 2014 Lær at lægge indhold på koncernens websteder.
Hvordan bruger jeg First Class konferencerne ?
Oplæg til temadag om fjernlån i Middelfart den 22. maj 2014
Side-egenskaber Web-udvikling med FrontPage 2003 RHS - Informationsteknologi.
Vælg layout 1. Højre klik uden for dit slide 2. Vælg et passende layout fra “drop ned” menuen 3. Bemærk at der findes 4 forskellige farvetemaer du kan.
SEO PÅ AU.
Foreløbig e-Læringsprogram til ændret søgeportal februar 2014 Simpel søgeportal.
Skal du digitalisere en fuldmagt, du har fået på papir fra en borger?
Informationssøgning for pol-intro sidefagsstuderende Statskundskab
Introduktion til brugen
Introduktion til Microsoft CRM Christian Cletus Bjørn Eilertsen.
Flyt den til din mp3 afspiller
Avanceret søgning i Google
Validering af data (Access, del 7)
Oprettelse af tabeller (Access, del 2)
Webserveren kan afvikle flere applikationer, der hver har deres eget selvstændige ”liv” og hukommelse. Den enkelte applikation består typisk af flere elementer.
DS v Dine fordele med eBrevsprækken? Med eBrevsprækken modtager du din brevpost elektronisk i din . Med eBrevsprækken bliver dine breve.
Overskrift Max 1 linje Forside dias Der findes 4 farveskemaer at vælge mellen: Marker det / de slides du vil have en anden farve på, Vælg ”Design” / ”Farver”
Oprettelse af Digital Post
Biblioteksorientering Lidt om Statsbiblioteket Registrering som låner Søg og bestil bøger Artikler fra tidsskrifter og aviser Dine.
Footer med basic Clarin info ( , adresse, …) DKClarin header Forside Mockup - DEMO Søgning på websiden SØG Hjælp / Demo Ressourcer Værktøj Formater.
vejen fra fysisk medie til online brug
Filer Hvordan søges der efter en Word-fil = med et dokument. eller en billed-fil Sommer.
Niels Bønding Niels Bønding Digitalisering af 32 mio. avissider på 3 år Aarhus
Teknisk dialogmøde den 11. september 2013 Vinduespolering.
ADR & SCANNERKORT. Automatic Delivery Rewards (ADRs) Den enkle måde at handle produkter på, med levering hver måned. Du får fordelen af en rabat på 5.
Finde og åbne et chatrum Brug søgefunktionen i Lync til at finde de rum, du har adgang til. 1.I hovedvinduet i Lync skal du klikke på fanen Chatrum. 2.Skriv.
Lave egne visninger - kreditorer
Videregående pc-vejledning Modul 10: Sådan gør du 60+Bornholm.
© 2012 Microsoft Corporation. Alle rettigheder forbeholdes. Planlægge et Lync-møde Du kan planlægge et Lync-møde ved at bruge Outlook tilføjelsesprogrammet.
Opgavestyring i Elevplan
FORTROLIGT. Må kun distribueres til partnere med aftale om hemmeligholdelse. Microsoft giver ingen garantier, hverken udtrykkeligt eller stiltiende. ©
Videregående pc-vejledning Modul 03: Harddisken 2 60+Bornholm.
Scanning, klargøring, makroer, erfaringer. Erfaringer, praksis Hvilken opløsning sætter I scanneren til? Scanner I i gråtoner, farver eller sort/hvid?
© 2012 Microsoft Corporation. Alle rettigheder forbeholdes. Tilføje en kontakt Listen Kontakter gør din kommunikation lettere og gør det muligt for dig.
Webserveren kan afvikle flere applikationer, der hver har deres eget selvstændige ”liv” og hukommelse. Den enkelte applikation består typisk af flere elementer.
Synliggørelse af ældre samling Anna Dorthe Bracht Nielsen Danmarks Statistik Nordisk statistikermøde, København august 2010.
Vælg layout 1. Højre klik uden for dit slide 2. Vælg et passende layout fra “drop ned” menuen 3. Bemærk at der findes 4 forskellige farvetemaer du kan.
Vis hjælpelinjer som er en hjælp ved placering af billeder 1.Højre klik på den aktuelle side og vælg ’gitter og hjælpelinjer’ 2. Sæt kryds ved ’Vis’ tegnehjælpelinjer.
Publiceringsgenvej i OJS Send din færdigformaterede fil uden om det redaktionelle workflow og direkte til elektronisk publicering Denne publiceringsform.
Søg efter retningsgivende dokumenter i PRI-systemet November 2010.
Lidt hjælp til hjemmesiden Log ind Første gang du skal logge ind på siden skal du kigge nederst til højre og finde…. Log ind med det brugernavn og det.
Dd.mm.åååå Side 1 Titel på præsentation (Arial Reg. 32 pkt.) Foredragholders navn og dato (Arial Reg. 18 pkt.)
SEO-workshop LOF.dk 24. mar. 2017
Mere digital litteraturforsyning
På biblioteket giver vi også hinanden licenser
Vejledning: Publicering af artikler på portalen.
Præsentationens transcript:

Digitalisering af 32 mio. avissider på 3 år Middelfart 22-05-2014

Hvem er jeg? Niels Bønding 46 år og vendelbo Cand. phil. i filosofi 1998 11 år som proceskonsulent og projektleder i TDC PRINCE2 Practitioner og IPMA C certificeret Ansat på Statsbiblioteket fra 15. august 2013 som projektleder for Avisdigitaliseringsprojektet – samme dag som beslutningen om Ninestars som leverandør blev truffet.

Manuel efterbehandling i Chennai Scanning i Hamburg Manuel efterbehandling i Chennai Hovedkvarter og IT-udvikling i Bangalore Ninestars bygning i Chennai

ProduktionsPROCES

Scanning af mikrofilm Mekel Mach 5 scannere placeret i Hamburg Vi har været med ved kalibreringen af scannerne. Vi og Ninestars har ved fælles hjælp opnået et rigtig godt resultat. Det rå output er TIFF scannet i 300 dpi. Den endelige fil er en JPEG2000 og kæden mellem dem er lossless Vi får samtidig målt emulsion density på mikrofilmene til brug for kassationsprocessen Lossless vej gennem scannersoftwaren

Billedkvalitet – bevaringskvalitet?

Billedkvalitet – bevaringskvalitet!

OCR og segmentering - Formidling Modtaget 30-12-2013 Modtaget 24-02-2014

OCR og segmentering - formidling Modtaget 30-12-2013 Modtaget 24-02-2014

Hvilken kvalitet til hvilket formål? Vi skal bevare aviserne i den bedst mulige kvalitet for fremtiden Vi skal formidle aviserne i den bedst mulige kvalitet for nutiden Vi skal kunne afgøre hvorvidt en bevaringskopi (og en mikrofilm) er tilstrækkelig god til, at vi kan vælge at kassere den kopi, der ligger i Vestindisk Pakhus i København. For det er her pengene kommer fra. Teknisk: Fx størrelse, opløsning, dato for skanning, skanningsoperatør. I alt gemmes 30 værdier pr. billede Data gemmes som mix filer – ”an XML schema for a set of technical data elements required to manage digital image collections” http://www.loc.gov/standards/mix/ Mikrofilm: Beskriver hvilke titler, fra hvilke datoer, der findes på en bestemt mikrofilm. Plus tekniske oplysninger om filmen og filmingen. I alt gemmes 25 værdier i hjemmelavet xml schema ”Avisen”: Udgave og udgivelse: Morgen, aften, weekend, ekstra eller særudgave? - 20 værdier Siden: Beskriver siden, dens placering i udgaven og placering på mikrofilmen. Essentielle data for at sikre at visning sker i korrekt rækkefølge og at der kan bladres.

Metadata registreres i processen Tekniske metadata om den enkelte scannede side Fx størrelse, opløsning, dato og operatør Metadata om mikrofilmen Titler, datoer, film og filmning Udgave og udgivelse og den enkelte side Morgen, aften, weekend, ekstra eller særudgave Placering af siden i udgaven og på mikrofilmen Teknisk: Fx størrelse, opløsning, dato for skanning, skanningsoperatør. I alt gemmes 30 værdier pr. billede Data gemmes som mix filer – ”an XML schema for a set of technical data elements required to manage digital image collections” http://www.loc.gov/standards/mix/ Mikrofilm: Beskriver hvilke titler, fra hvilke datoer, der findes på en bestemt mikrofilm. Plus tekniske oplysninger om filmen og filmingen. I alt gemmes 25 værdier i hjemmelavet xml schema ”Avisen”: Udgave og udgivelse: Morgen, aften, weekend, ekstra eller særudgave? - 20 værdier Siden: Beskriver siden, dens placering i udgaven og placering på mikrofilmen. Essentielle data for at sikre at visning sker i korrekt rækkefølge og at der kan bladres.

Supplerende Metadata Sammenkædning af titler over tid Kobling til De Danske Aviser Geografiske data Søgning i den genkendte tekst er ikke nok til at man kan gå opdagelse i samlingen. ”Aktuelt” gennem tiden er ikke ”Aktuelt” men derimod en mængde forskellige titler. Geografi bærer sin egen vanskelighed over tid: taler vi sogn eller kommune, amt eller region?

Afhænger af Copydanaftale Adgang til aviserne Periode Adgang på SB og KB Snippets/thumbnails Fjernadgang alle Academic Licens 1950+ Ja Afhænger af Copydanaftale Nej 1940 1930 1920 1910 Måske ophavsret? 1900 1890 1880 1870 1860 ældre

MEDIESTREAM Mediestream er Statsbibliotekets online portal, hvor digitaliserede samlinger af dansk audiovisuel kulturarv tilgængeliggøres. I dag er der adgang til radio, tv og reklamefilm, som er opdelt i såkaldte ”subportaler” (i topmenuen). De digitaliserede aviser vil blive tilgængelige i en sådan subportal i Mediestream inden udgangen af 2014. Pt. foreligger designudkast til hvordan aviserne vil blive fremvist.

AVIS-SUBPORTAL Brugeren præsenteres for denne side efter at have klikket på ”AVIS” i top- menuen. Herfra er det muligt at søge i de digitaliserede aviser. Ligeledes er der link til en oversigt over alle digitaliserede aviser. Brugerne inddrages i portalen via avisforsider fra for 100 år siden. Rettighedsbeskyttet materiale: Thumbnails, ca. 170x240 px, både sort/hvid og farve.

SØGERESULTATER Hvert søgeresultat består af en hel avis som fx første resultat: Aarhus Amtstidende 8. oktober 1902. I denne avis er der tre hits, som matcher søgningen på ”program”. Det vises ved at opliste overskriften i de artikler, som ”program” optræder i. Bemærk at det er et kvalificeret bud på overskriften, men det kan også være den første sætning fra en annonce, tv-oversigt og lignende, eller det kan være en sætning fra midten af artiklen, hvis systemet tager fejl. Thumbnails vil max være avisens sidebredde, og der zoomes ikke yderligere ind. Vi forestiller os nu, at en bruger har søgt på ordet ”program”. Det giver en række søgeresultater, som vises på udkastet til højre.

SØGERESULTATER I udsnittet til højre ses et enkelt søgeresultat. På thumbnailen er det angivet med en grøn markering, hvor på avissiden det første hit optræder. Der zoomes hverken ind eller ud på thumbnails. Deres maksimale bredde er altid avisens sidebredde, men der panoreres op eller ned på avissiden for at vise den relevante markering. Igen ses kvalificerede bud på overskrifter. Bemærk, at der ikke er tale om en såkaldt ”snippet”, da ordene umiddelbart omkring søgeordet ikke vises. Rettighedsbeskyttet materiale: 1. Thumbnails, ca. 170x100 px, både sort/hvid og farve 2. “Overskrift” på artikel/annonce/dødsannonce mv.: Maksimalt de første 10 ord.

FULDPOST-VISNING Ved at klikke på et søgeresultat kommer brugeren til en fuldpost- visning, som ses til højre. Til forskel fra foregående side vises her ikke kun et udsnit men derimod hele avissiden som thumbnail ud fra den definerede størrelse. Ved at klikke på et af de tre søgeresultater kan brugeren få vist en thumbnail af den avisside, hvor søgeresultatet optræder. Rettighedsbeskyttet materiale: 1. Thumbnails, ca. 170x240 px, både sort/hvid og farve 2. “Overskrift” på artikel/annonce/dødsannonce mv.: Maksimalt de første 10 ord.

AVISOVERSIGT Hvis brugeren fra forsiden klikker på linket til oversigten over alle digitaliserede aviser, vises siden til højre. Her er det muligt at finde en enkelt titel og klikke sig videre til yderligere oplysninger om denne.

AVISHISTORIK Til højre ses detaljerne for en enkelt avis. Det inkluderer titelhistorik, samlingens omfang, udgivelsessted mv. For at inspirere brugerne vises de mest sete udgaver af avisen i bunden af siden. Rettighedsbeskyttet materiale: 1. Thumbnails, ca. 170x240 px, både sort/hvid og farve