Národní knihovna České republiky

Standardy pro obrazová data

Doporučení pro digitalizaci

Doporučení pro data vzniklá v podprogramu VISK 7: Národní knihovna ČR doporučuje ořez dokumentů cca 1 mm vně okraje dokumentu a narovnání podle řádků textu. Veškeré úpravy obrazů je třeba provádět na archivních souborech, uživatelský soubor se bude generovat až po všech úpravách. Uživatelská i archivní kopie musím mít stejný rozměr (v pixelech) a stejné rozlišení (v DPI).

Datová specifikace

Standardy Národní digitální knihovny předpokládají využívání grafického formátu JPEG2000 jak pro archivní kopie, tak pro kopie určené pro zpřístupňování.

Pro archivní kopie je zvolena bezeztrátová komprese, tzv. matematicky bezeztrátová komprese. Pro uživatelské kopie je zvolena ztrátová komprese, tj. vizuálně bezeztrátová až vizuálně mírně ztrátová komprese. Nastavení komprese uživatelských kopií je optimalizováno vzhledem k zvolenému image serveru (IIP image), který se používá ve zpřístupňující aplikaci Kramerius. Z uživatelských kopií se pomocí tzv. image serveru (IIP image server) automaticky generují uživatelské kopie (on-the-fly) v grafickém formátu JPEG v předem nastaveném kompresním poměru, který kvalitativně odpovídá vizuální kvalitě zpřístupňovaných kopií (cca Q = 90).

Specifikace vychází z potřeb Národní knihovny České republiky a z porovnání doporučení pro kódování souborů JP2 v rámci zahraničních projektů zabývajících se digitalizací a dlouhodobým uchováním obrazových dat.

Pro dokumenty (knihy, periodika) požadujeme skenování v rozlišení minimálně 300 PPI. Barevná hloubka pro tyto dokumenty je fixně nastavena na 24 bitů, barva (RGB).

Využití aplikace Kakadu při digitalizaci

Národní knihovna ČR používá pro vytváření obrázků ve formátu JPEG2000 software Kakadu 7 od firmy Kakadu Software.

 

Příkazové řádky (Command line) pro Kakadu kodek

Archivní kopie (Archival Copy)

kdu_compress -i example.tif -o example.jp2 "Cblk={64,64}" Corder=RPCL "Stiles={4096,4096}" "Cprecincts={256,256},{256,256},{128,128}" ORGtparts=R Creversible=yes Clayers=1 Clevels=5 "Cmodes={BYPASS}" Cuse_sop=yes Cuse_eph=yes

 

Zpřístupňující kopie (Production Master Copy)

Kompresní poměr 1:8

kdu_compress -i example.tif -o example.jp2 "Cblk={64,64}" Corder=RPCL "Stiles={1024,1024}" "Cprecincts={256,256},{256,256},{128,128}" ORGtparts=R -rate 3 Clayers=12 Clevels=5 "Cmodes={BYPASS}"

Kompresní poměr 1:10

kdu_compress -i example.tif -o example.jp2 "Cblk={64,64}" Corder=RPCL "Stiles={1024,1024}" "Cprecincts={256,256},{256,256},{128,128}" ORGtparts=R -rate 2.4 Clayers=12 Clevels=5 "Cmodes={BYPASS}"

Kompresní poměr 1:20

kdu_compress -i example.tif -o example.jp2 "Cblk={64,64}" Corder=RPCL "Stiles={1024,1024}" "Cprecincts={256,256},{256,256},{128,128}" ORGtparts=R -rate 1.2 Clayers=12 Clevels=5 "Cmodes={BYPASS}"

Kompresní poměr 1:30

kdu_compress -i example.tif -o example.jp2 "Cblk={64,64}" Corder=RPCL "Stiles={1024,1024}" "Cprecincts={256,256},{256,256},{128,128}" ORGtparts=R -rate 0.8 Clayers=12 Clevels=5 "Cmodes={BYPASS}"

 

K výše uvedeným příkazovým řádkům je možné, nikoliv nezbytné, pro optimalizaci zpracování připojit následující příkazy, jež nemají vliv na vlastnosti výsledného obrazu:

-double_buffering číslo

-num_threads číslo

Například: -double_buffering 10 –num_threads 4

Od verze 7 nástroje Kakadu není nutné tyto příkazy zadávat, nástroj je aktivuje defaultně. V případě příkazu –num_threads se přesto doporučuje hodnotu zadat.

 

 

09.11.2016