Dlouhodobá ochrana digitální dat
Co je to dlouhodobá ochrana digitálních dat?
Problematika uchovávání digitálních dat v takové podobě, aby byla tato data znovu vyhledatelná, srozumitelná a použitelná i po dlouhé době a v jiných kontextech (na jiných platformách apod.), než v kterých původně vznikla, se anglicky obvykle nazývá „digital preservation“, „preservation of digital objects“ a někdy také „digital curation“.
Dlouhodobá ochrana digitálních dat je oblastí výzkumu a praxe. Není to zatím obor, který by bylo možné studovat na univerzitě, ani to není nějaký soubor softwarových nástrojů nebo procedur, které by bylo možné k ochraně dat použít.
Společným terminologickým a konceptuálním rámcem všech projektů v této oblasti je model OAIS (Open Archival Information System), který původně vznikl v oblasti kosmického výzkumu. Dnes jsou základní pojmy tohoto modelu společným jazykem všech, kteří se ochranou digitálních dat zabývají.
Digitálními daty (informacemi, objekty) se zde myslí jednak produkty digitalizace původně analogových (fyzických) dokumentů, jednak objekty, které už jako digitální vznikly (tzv. born digital). Digitální data jsou uložena a spravována v digitálním repozitáři. Digitální repozitář (též digitální archiv) lze chápat jako organizaci lidí a systémů se závazkem ochraňovat a zpřístupňovat digitální data pro určitou skupinu uživatelů. Infrastruktura jednotlivého repozitáře může být navržena tak, aby navíc umožňovala i snadnou vzájemnou spolupráci s jinými systémy (portály, digitálními knihovnami) pomocí daných komunikačních protokolů. Digitální knihovnou rozumíme soubor aplikací, které nad daty v repozitáři provádějí nějaké stanovené operace za účelem jejich zpřístupnění koncovým uživatelům. Digitální repozitáře sehrávají klíčovou roli v dlouhodobé ochraně digitálních dat.
V literatuře najdeme různé definice dlouhodobé digitální ochrany:
1, Řízená snaha zajistit použitelnost digitálních objektů po mnoho let. Jde především o snahu zajistit, aby se digitální objekty nikdy neztratily, aby nedošlo k jejich poškození, aby bylo možné je vždy najít a aby byly srozumitelné. To vše bez ohledu na jejich možnou technologickou zastaralost. GLADNEY, Henry M. Preserving digital information. Berlin : Springer-Verlag, 2007).
2, Uchovávání informací v přesné a samostatně srozumitelné podobě po dlouhou dobu. (OAIS 2002: 1-11)
3, Všechny aktivity zabývající se správou digitálních nebo elektronických objektů spojené s jejich uchováváním a zpřístupňováním. (VERHEUL, Ingeborg. Networking for Digital Preservation : Current Practice in 15 National Libraries. München : K.G. Saur, 2006.)
Dlouhodobou ochranou se obvykle myslí ochrana během (někdy i za) období, ve kterém dochází k technologickým změnám (jako jsou zavádění nových formátů, nástupy nových médií nebo nové architektury procesorů, počítačů apod.).
Jak již bylo zmíněno, digitální objekty jsou v rámci této ochrany uloženy v nějakém digitálním repozitáři, který tuto ochranu zajišťuje. Zároveň jsou však tyto objekty dále využívány určitou komunitou uživatelů, a tak musí být zajištěna nejen ochrana objektů, ale také ochrana přístupu k těmto objektům při dodržení zákonných omezení vyplývajících z autorských práv a dalších možných omezení jejich použití.
Cíle dlouhodobé ochrany digitálních dat
Dlouhodobá ochrana digitálních dat je proces, jehož cíle mohou být odlišné pro různé typy digitálních objektů nebo v různých kontextech. Nejnižší úrovní dlouhodobé ochrany digitálních dat je snaha udržet digitální objekty v podobě původních a nijak nezměněných bitových sekvencí bez ohledu na srozumitelnost nebo na použitelnost těchto bitů. Komplexnější přístup k dlouhodobé ochraně digitálních dat se snaží zajistit, aby byly informace v budoucnosti dostupné v takové podobě, která bude čitelná a srozumitelná budoucím uživatelům. Tj. aby význam, který digitální objekty nesou (v modelu OAIS content information), zůstal zachován a neztratil srozumitelnost. Tento přístup již vyžaduje použití technických, strukturálních i jiných metadat a jejich ochranu, a v řadě případů také uchovávání dalších informací, které budoucím uživatelům umožní porozumět obsahu digitálních objektů (v modelu OAIS se všechna tato metadata a další informace, které pomáhají poznat a pochopit původní strukturu, obsah a smysl dokumentů, nazývají representation information). Pro uživatele může být také důležité mít k dispozici informace o původu každého uchovávaného objektu (v modelu OAIS provenance information) a o operacích, které archiv nebo repozitář s daty během doby jejich uložení provedl (v modelu OAIS fixity information). Uživatelé musí mít důvěru v to, že objekty, tak jak je z repozitáře dostávají, jsou autentické, přesné, úplné, tj. právě v takovém stavu, v jakém byly do repozitáře vloženy, resp. v takovém stavu, v jakém je stanoveno (např. v representation information), že mají být. Říkáme, že digitální repozitář, který je schopen dostát všem těmto nárokům, je tzv. důvěryhodným digitálním repozitářem. Důvěryhodnost je tedy přidanou hodnotou, kterou repozitář získá, pokud je navržen a provozován podle určitých kritérií.
Nástroje
Z technického hlediska existuje řada přístupů nebo metod, které dlouhodobou ochranu digitálních dat usnadňují (zálohování, vícenásobné kopie, pravidelné výměny úložných médií, analogové zálohy, emulace, migrace, udržování dokumentace, audit repozitáře, sledování rizik, hodnocení formátů, sledování softwaru a hardwaru, pečlivá tvorba metadat pro potřeby dlouhodobé ochrany atd.). Ovšem dlouhodobá ochrana digitální dat je technickým problémem jen zčásti. Dalším problémem je, jak zajistit organizaci, financování, kvalifikovaný personál a efektivní řízení.
Archivních řešení/systémů podporujících dlouhodobou ochranu digitálních dokumentů je dnes k dispozici hned několik. Základní preservační funkce má dnes i řada opensource nástrojů (Fedora Commons, Dspace, a v poslední době vznikají další jako Archivematica nebo RODA ) i poslední generace proprietárních systémů (IMB DIAS, ExLibris Rossetta, Tessella SDB). Všechny respektují standardy OAIS, pořadavky TRACu. Zapojují externí služby a různé moduly (JHOVE, DROID, FITS, NZME, GDFR, PRONOM, Planets testbed, PLATO), pro plánování dlouhodobé ochrany, pro extrakci metadat, charakterzici a validaci formátů, a využívají metadatové schema Premis.
Další zdroje informací o "Digital Preservation":
Digital Preservation
Management Resources: http://www.icpsr.umich.edu/dpm/index.html
TRAC: http://www.crl.edu/PDF/trac.pdf
NESTOR: http://edoc.hu-berlin.de/series/nestor-materialien/8/PDF/8.pdf
DRAMBORA: http://www.repositoryaudit.eu/
PLATTER: http.//www.digitalpreservationeurope.eu/platter.pdf
WePreserve: http://www.wepreserve.eu
Webová stránka DPE: http://www.digitalpreservationeurope.eu/registries/resources, http://www.digitalpreservationeurope.eu/publications
DP Coalition: http://www.dpconline.org/
ERPANET: http://www.erpanet.org/
NDIIPP / LOC: http://www.digitalpreservation.gov/
PLANETS: http://www.planets-project.eu/
CASPARS: http://www.casparpreserves.eu
PADI: http://www.nla.gov.au/padi
FP 7: http://cordis.europa.eu/fp7/ict/telearn-digicult/digicult-preservation_en.html
Shaman: http://www.shaman-ip.eu
Experti, výzkumná centra
Webová stránka DPE - registry: http://www.digitalpreservationeurope.eu/registries/
Výzkumná centra
DP Coalition: http://www.dpconline.org
DCC: http://www.dcc.ac.uk/
Konference
iPRES: http://www.bl.uk/ipres2008
Konference WePreserve: http://www.wepreserve.eu/events/nice-2008/
Školící střediska
DELOS: http://www.delos.info/
DPE: http://www.digitalpreservationeurope.eu/registries/trainers/
Blog
http://digital-preservation-cz.blogspot.com/
