Digitalizace v projektu NDK
Autor: Jan Hutař
Poslední změna:
Středa 23.06.2010 14:22
Projekt NDK - Digitalizace
Cílem projektu je vybudování dvou digitálizačních pracovišť v NK ČR a v MZK v Brně a systém pro douhodou archivaci digitálních dokumentů. Projekt by měl umožnit digitalizaci bohemikálních dokumentů z 19. a 20. století (celkem asi 300 milionů stran) během asi 25 let, během vlastní doby trvání projektu (2010-14) by mělo být digitalizováno asi 26 milionů stran. K digitalizaci by měla být využita nejnovější technologie robotického skenování (některé z přístrojů 4DigitalBooks, Treventus, Kirtas, Qidenus) Konkrétní přístroje a související technologie bude vybrány ve výběrovém řízení.
Předpokládá se využítí formátu JPEG2000 pro archivní i uživatelskou kopii, dále také Alto XML.
Robotické skenery
Vzhledem k velkému počtu dokumentů, které mají být digitalizovány, je třeba použít nejmodernější skenovací technologie – roboty pro skenování knih. Tam, kde povaha a fyzický stav dokumentu robotické skenování neumožňuje, budou použity velkoformátové ruční knižní skenery.
Kromě kapacitních požadavků na digitalizační linky jsou důležité i požadavky kvalitativní:
- Vysoká míra automatizace skenovacího procesu zajišťující maximální výkon.
- Pro skenování novin a dokumentů větších formátů požadujeme robotické skenery umožňující skenovat dokumenty do formátu A2.
- Pro skenování dokumentů 19. a 20. stol. postižených degradací papíru požadujeme robotické skenery s maximálně šetrným mechanismem obracení stránek, které nevyužívají mechanické součástky.
- Pro skenování soudobých dokumentů menšího formátu požadujeme robotické skenery s maximálním výkonem. Šetrné obracení stránek s využitím mechanických součástek je v tomto případě akceptovatelné.
- Všechny skenery by měly umožňovat skenování v barvě, šedé škále, nebo v černobílém zobrazení, s min. rozlišením 300 dpi.
- Skenery by měly být schopné načítat data pomocí čteček čárových kódů, pro citlivou práci se vzácnými dokumenty by měly využívat speciální „kolébky“ pro šetrné uložení skenovaných materiálů.
Ukázky práce robotických skenerů:
http://www.youtube.com/watch?v=y16rNqnxj0U
http://www.youtube.com/watch?v=RROgUub-cDQ
http://www.youtube.com/watch?v=HSHaQFiaVKA
Prezentace k tématu z konference Knihovny současnosti 2008, Seč, PhDr. Jiří Polišenský, NK ČR
Typy operací plánovaného robotnického pracoviště:
| Pracoviště výběru dokumentů |
Pracoviště přípravy |
Pracoviště skenování |
Pracoviště zpracování dat |
- vyjmutí svazků z regálu a provedení výpůjčky
- kontrola čárového kódu
- kontrola fyzického stavu knihy
- transport dokumentů na místo přípravy
- provedení výpůjčky
- převzetí digitalizovaných knih
- kontrola konzistence odkazů ze systému Aleph do Krameria
- vrácení knih do skladu
|
- vytváření sbírky pomocí čárových kódů v systému ALEPH
- export záznamů ze systému ALEPH do systému RELIEF kontrola duplicit
- kontrola konzistence dat (porovnání údajů na záznamu a titulním listu)
- vyřazení duplicit a nestandardních dokumentů (zjevně poškozených, neúplných, s nekonzistencemi dat či identifikačních údajů)
- konverze bibliografického záznamu do popisných metadat dle DTD
- rozhodnutí o způsobu zpracování (Periodical, Monograph, Monograph Unit)
- rozhodnutí o zpracování „component parts“
- zjištění typu písma pro OCR (fraktura x antikva)
- zjištění a označení obsahu
- zjištění možností zpřístupnění pomocí souborů autorit a stanovení roku zveřejnění
- vytvoření denní skenovací dávky v systému Reliéf (identifikace denní dávky, identifikace dokumentu - čárový kód, identifikace zakázky, popisná metadata)
- vrácení vyřazených svazků
- předání dokumentů k dalšímu zpracování (vytvoření záznamu, vytvoření jednotek, oprava nesprávných údajů)
- transport připravených dokumentů na místo skenování
- převzetí digitalizovaných dokumentů z pracoviště zpracování dat
- kontrola fyzického stavu knihy
- export dat ze systému KRAMERIUS do systému RELIEF
- kontrola údajů v systému RELIEF
- import dat do NKC – SKC
- předání digitalizovaných knih na pracoviště výběru dokumentů
|
- přejímka denní dávky knih včetně indexní složky (book folder)
- vytvoření skenovací složky (scann folder)
- skenování
- kompletace skenů (scanns assembling)
- kontrola úplnosti (integrity inspection)
- předání indexní složky, skenovací složky a knih k dalšímu zpracování
|
- převzetí denních dávek knih, indexních složek a skenovacích složek
- stránkování dokumentu (dokument pagination) – vytvoření struktury dokumentu
- úpravy obrazových souborů: ořez a narovnání, potlačení pozadí a průtisků (image treatment)
- převzorkování a konverze obrazových souborů (jpg a DjVu)
- kontrola kvality obrazových souborů (image quality inspection)
- Kontrola a opravy struktury dokumentu, vytvoření opravné složky (correction folder)
- zpracování OCR a vytvoření OCR složky (OCR folder)
- vytvoření technických a administrativních metadat
- vytvoření komplexního dokumentu (digital document aggregation): SIP
- import digitálních dokumentů na úložiště (archiv + Kramerius)
- vrácení knih
|