Personal tools
You are here: Home Digitalizace v NDK Digitalizace do roku 2012
Search in NDL

Navigation
« February 2012 »
Mo Tu We Th Fr Sa Su
12345
6789101112
13141516171819
20212223242526
272829
Links
iop_only_logo

 

eu_logo

   

MKCR_logo

 

NK logo

 

logo_mzk_nove

 
Document Actions

Digitalizace do roku 2012

by Jan Hutař last modified 2011-04-13 14:35

Digitalizace v NK ČR 

NK ČR provozuje dvě pracoviště digitalizace. Prvním je pracoviště přímé digitalizace rukopisů a vzácných dokumentů, které vzniklo na základě aktivit soustředěných kolem programu Paměť světa, a které NK ČR provozuje ve spolupráci s firmou Albertina icome Praha. 

Digitalizace rukopisů a strých tisků

Soustavná digitalizace rukopisů probíhá v NK ČR od roku 1996. K jejímu posílení co do počtu zdigitalizovaných dokumentů přispěl program Manuscriptorium zahájený v roce 1999 a podporovaný z podprogramu VISK 6. Inkunábule a staré tisky byly digitalizovány zatím pouze v letech 2006–2008 v souvislosti s mimořádným financováním z MŠMT. V roce 2009 tento zdroj nebyl obnoven, takže digitalizace tištěných dokumentů ustala. Zcela mimo tyto dvě skupiny byla zdigitalizována část sbírky map a plánů na základě jednorázového grantu. Situace v digitalizaci rukopisů sice není ideální, ale v mezinárodním srovnání je dobrá. V případě dalšího materiálu (inkunábule, staré tisky mapy atd.) je vzhledem k ideálnímu stavu špatná a v mezinárodním srovnání slabá.

Digitalizace novodobých fondů

Druhým pracovištěm je pracoviště digitalizace mikrofilmů, které bylo vybudováno díky realizaci projektu ”Digitalizace mikromédií” v letech 1997 až 1999. Pracoviště zajišťuje přípravu dokumentů pro mikrofilmování a digitalizaci včetně tvorby metadat, skenování mikrofilmů, spojování indexních údajů s obrazovými soubory a zpřístupňování dokumentů prostřednictvím internetu, lokální sítě NK ČR a CD-R médií.

Skenování mikrofilmů a úpravy obrazových dat

null null null

Pro skenování mikrofilmů NK ČR používá skenery SunRise a Wick and Wilson, které umožňují skenovat svitkové mikrofilmy 35 a 16mm a mikrofiše. Výstupem jsou obrazové soubory v 16 bitové šedé škále, ve formátech TIFF, JPEG a GIF. Kromě uvedených skenerů disponuje NK ČR také hybridní kamerou, která umožňuje vytvářet v jednom procesu mikrofilm i digitální záznam. Obrazové soubory vyžadují následné úpravy, zejména pootočení a ořez, převzorkování ve formátu JPEG, konverzi do formátu DjVu. U vybraných titulů jsou obrazové soubory zpracovávány technologií OCR pro získání textového formátu. Textový formát však neslouží pro zpřístupnění uživatelům, ale pouze pro vyhledávání pomocí nástroje CONVERA Retrieval Ware. Obrazový formát považujeme za základní, protože zachovává původní grafickou podobu dokumentu a zabezpečuje vyšší úroveň autenticity. Pro úpravy obrazových dat používá NK ČR systém Sírius.  

Tato infrastruktura se využívá ke zpracování periodik a monografií, přičemž v současné době pokrývají přibližně 20 % z celkové produkce reformátovaných dokumentů v rámci programu VISK 7 Kramerius (zbytek se řeší službami u dodavatelů). 

Financování digitalizace

VISK, Norské fondy.

Objem dat

V digitální knihovně NK ČR Kramerius je v současné době 6 milionů stran digitalizovaných dokumentů. Z toho je asi 1 milion stran monografií.

Schema současného workflow

V současné době jsou data vznikající v projektu Kramerius  v rámci programu VISK dodávána ve dvou složkách, v archivní kopii a v kopií pro systém Kramerius. Archivní složka obsahuje obrazové soubory v jpg, metadata k obrazovým dokumentům v textovém souboru, textový soubor s OCR, dále soubor obsahující popis struktury dokumentu s názvem odvozeným od čísla zakázky, kontrolní součet MD5, strukturální a administrativní metadata. Složka pro kramerius obsahuje obrazové soubory v djvu se stejnými pojmenováními, textové soubory administrativními metadaty, textové soubory s OCR, textové soubory obsahujíc administrativní metadata k textovým souborům, soubor obsahující strukturu dokumentu a strukturální a administrativní metadata.

Kromě toho do úložitě v současné době vstupují také data z Projektu Manuscriptorium a Webarchiv.

null



 
 
null

This site conforms to the following standards: