Digtalizace v NK ČR
Digitalizace a digitální zpřístupnění dokumentů
(text připraven podle materiálů NK ČR)
NK ČR provozuje dvě pracoviště digitalizace. Prvním je pracoviště přímé digitalizace rukopisů a vzácných dokumentů, které vzniklo na základě aktivit soustředěných kolem programu Paměť světa, a které NK ČR provozuje ve spolupráci s firmou Albertina icome Praha.
Druhým pracovištěm je pracoviště digitalizace mikrofilmů, které bylo vybudováno díky realizaci projektu ”Digitalizace mikromédií” v letech 1997 až 1999. Pracoviště zajišťuje přípravu dokumentů pro mikrofilmování a digitalizaci včetně tvorby metadat, skenování mikrofilmů, spojování indexních údajů s obrazovými soubory a zpřístupňování dokumentů prostřednictvím internetu, lokální sítě NK ČR a CD-R médií.
Skenování mikrofilmů a úpravy obrazových dat

Pro skenování mikrofilmů NK ČR používá skenery SunRise a Wick and Wilson, které umožňují skenovat svitkové mikrofilmy 35 a 16mm a mikrofiše. Výstupem jsou obrazové soubory v 16 bitové šedé škále, ve formátech TIFF, JPEG a GIF. Kromě uvedených skenerů disponuje NK ČR také hybridní kamerou, která umožňuje vytvářet v jednom procesu mikrofilm i digitální záznam. Obrazové soubory vyžadují následné úpravy, zejména pootočení a ořez, převzorkování ve formátu JPEG, konverzi do formátu DjVu. U vybraných titulů jsou obrazové soubory zpracovávány technologií OCR pro získání textového formátu. Textový formát však neslouží pro zpřístupnění uživatelům, ale pouze pro vyhledávání pomocí nástroje CONVERA Retrieval Ware. Obrazový formát považujeme za základní, protože zachovává původní grafickou podobu dokumentu a zabezpečuje vyšší úroveň autenticity. Pro úpravy obrazových dat používá NK ČR systém Sírius.
Financování digitalizace
Objem dat
V digitální knihovně NK ČR Kramerius je v současné době 6 milionů stran digitalizovaných dokumentů. Z toho je asi 1 milion stran monografií.
Schema současného workflow
V současné době jsou data vznikající v projektu Kramerius v rámci programu VISK dodávána ve dvou složkách, v archivní kopii a v kopií pro systém Kramerius. Archivní složka obsahuje obrazové soubory v jpg, metadata k obrazovým dokumentům v textovém souboru, textový soubor s OCR, dále soubor obsahující popis struktury dokumentu s názvem odvozeným od čísla zakázky, kontrolní součet MD5, strukturální a administrativní metadata. Složka pro kramerius obsahuje obrazové soubory v djvu se stejnými pojmenováními, textové soubory administrativními metadaty, textové soubory s OCR, textové soubory obsahujíc administrativní metadata k textovým souborům, soubor obsahující strukturu dokumentu a strukturální a administrativní metadata.
Kromě toho do úložitě v současné době vstupují také data z Projektu Manuscriptorium a Webarchiv.
Projekt IOP
Cílem projektu je vybudování dvou digitálizačních pracovišť v NK ČR a v MZK v Brně a systém pro douhodou archivaci digitálních dokumentů. Projekt by měl umožnit digitalizaci bohemikálních dokumentů z 19. a 20. století (celkem asi 300 milionů stran) během asi 20 let, během vlastní doby trvání projektu (2010-14) by mělo být digitalizováno asi 80 milionů stran. K digitalizaci by měla být využita nejnovější technologie robotického skenování (některé z přístrojů 4DigitalBooks, Treventus, Kirtas, Qidenus)
Prezentace k tématu z konference Knihovny současnosti 2008, Seč, PhDr. Jiří Polišenský, NK ČR
Typy operací plánovaného robotnického pracoviště:
| Pracoviště výběru dokumentů | Pracoviště přípravy | Pracoviště skenování | Pracoviště zpracování dat |
|
|
|
|
