Preservació digital distribuïda: lliçons d'experiències internacionals

 

[Versión castellana]


David Leija

Professor de la Facultat d'Arquitectura, Disseny i Urbanisme
Universidad Autónoma de Tamaulipas

Miquel Térmens

Professor del Departament de Biblioteconomia, Documentació i Comunicació Audiovisual
Universitat de Barcelona

 

Resum

Objectius: l'objectiu d'aquest estudi és oferir una panoràmica general dels sistemes d'organització de les xarxes de preservació digital distribuïda.

Metodologia: específicament, l'article s'inicia abordant de manera exploratòria els models de referència teòrica i tècnica de xarxes d'arxius digitals amb fins de preservació digital distribuïda a llarg termini. A continuació, s'analitzen tres casos internacionals en què se n'explora l'organització interna dels membres i com això repercuteix en el servei ofert. S'acaba amb un estudi comparatiu (FODA) dels tres sistemes.

Resultats: els sistemes de preservació digital distribuïda, més enllà dels components tècnics, són organitzacions basades en la cooperació, els membres de les quals han de complir una sèrie de requisits previs.

Resumen

Objetivos: el objetivo de este estudio es ofrecer una panorámica general de los sistemas de organización de las redes de preservación digital distribuida.

Metodología: específicamente, el artículo se inicia abordando de manera exploratoria los modelos de referencia teórica y técnica de redes de archivos digitales con fines de preservación digital distribuida a largo plazo. A continuación, se analizan tres casos internacionales en los que se explora la organización interna de sus miembros y cómo ello repercute en el servicio ofrecido. Se termina con un estudio comparativo (FODA) de los tres sistemas.

Resultados: los sistemas de preservación digital distribuida, más allá de sus componentes técnicos, son organizaciones basadas en la cooperación en las que sus miembros han de cumplir una serie de requisitos previos.

Abstract

Objectives: This study offers an overview of the systems used to organize distributed digital preservation networks.

Methodology: The article starts by examining the theoretical and technical reference models offered by digital archive networks dedicated to long-term distributed digital preservation. It then analyzes the internal organization of the member institutions of three international networks and considers how their system of organization affects the service offered. It concludes with a feature-oriented domain analysis of the three systems.

Results: While the technology they use may vary, the distributed digital preservation networks studied share a common commitment to collaborative practices and their member institutions need to meet certain prior requirements.

 

1 Models d'arxiu per a preservació digital

Han passat gairebé vint anys des que Rothenberg va publicar l'article "Ensuring the Longevity of digital documents" (Rothenberg, 1999), en el qual visualitzava, analitzava i feia una previsió tècnica sobre la problemàtica de l'accessibilitat futura de suports i formats digitals davant el problema de la seva obsolescència tecnològica. Des de llavors fins a l'actualitat s'han concebut diferents models d'actuació que conformen diferents opcions orientades a la millora continuada i la sostenibilitat d'un programa de preservació digital. Un d'aquests models és el de la preservació digital distribuïda, que intenta anar més enllà de simplement l'aplicació d'una solució tècnica per abastar també activitats de planificació i de col·laboració coordinada entre institucions.

En preservació digital, els models d'arxiu fan referència als sistemes d'emmagatzematge digital en conjunt, així com a totes les accions i estratègies col·laterals que es requereixen per mantenir-los actius. En tot model d'arxiu i gestió d'objectes digitals intervenen dues funcions indispensables, que són l'accés i la preservació. Aquestes funcions, encara que en algun moment puguin ser contradictòries, s'han de desenvolupar de forma complementària amb diferents procediments de gestió d'objectes digitals, com ara els de control de la procedència, l'autenticitat i la integritat digital. La forma en què encaixen aquests diferents procediments de gestió pot variar segons com una determinada organització els implementi o, si escau, defineixi com a model d'arxiu (D'Amato, 2012).

 

1.1 El model de referència: Open Archival Information System (OAIS)

D'acord amb la definició simplificada, OAIS ­– Reference Model for an Open Archival Information System és un arxiu d'una organització (o d'una part) en què persones i sistemes han acceptat la responsabilitat de preservar informació i posar-la a disposició d'una comunitat designada. Aquest compromís es concreta en el reconeixement d'una sèrie de responsabilitats o funcions definides com a estàndard normatiu, les quals permeten a un arxiu OAIS distingir-se d'altres usos del terme arxiu (Giaretta, 2011).

El model OAIS va ser creat l'any 2002 pel Consultative Committee for Space Data Systems, actualitzat l'any 2012 (OAIS, 2012) i reconegut com a norma ISO 14721:2003. Actualment és el marc de referència més àmpliament acceptat per a la concepció tècnica d'arxius de preservació digital.

A partir del model de referència OAIS, amb el pas del temps han anat apareixent diferents alternatives tècniques, d'organització i d'operació específica per atendre les necessitats de la preservació digital d'arxius.

Des del punt de vista de la seva arquitectura general i de quin és el seu enfocament prioritari, podem categoritzar que existeixen quatre models d'aplicació de la preservació digital en un entorn determinat. El primer és el model centralitzat, que manté el seu interès primari en les eines o aplicacions informàtiques per a una gestió de la informació i les dades centralitzada. El segon és el model de la preservació descentralitzada o distribuïda, que prioritza l'enfocament en les dades i la seva distribució geogràfica. Tots dos models coexisteixen en dues modalitats d'accés a l'arxiu diferents. L'arxiu en mode obert se centra en l'accés i la preservació en conjunt com a activitats prioritàries, i la manera d'arxiu tancat té com a prioritat la preservació com a activitat duta a terme per separat sobre els objectes que custodia i deixa la funció d'accés a un segon pla i de forma restringida (Térmens, 2013).

Actualment ja disposem d'un nombre considerable de sistemes que apliquen la modalitat de preservació descentralitzada o distribuïda, entre els quals destaquen APTrust, Archivematica, Cariniana, Chronopolis, Danish Bit Repository, Data-PASS, DPN, DuraCloud, HathiTrust, Internet Archive, iRODS, LOCKSS i MetaArchive Cooperative. Les polítiques de col·laboració en l'àmbit de la preservació digital s'estan estenent, ja que permeten crear sistemes més sòlids i que generen una major confiança en el compliment de la seva missió (Day, 2008). Però les diferències entre aquests sistemes són considerables, motiu pel qual mereixen ser estudiades. A continuació, mostrarem dues opcions generals per a la col·laboració externa en preservació; després veurem alternatives pròpies en el cas de repositoris institucionals.

 

1.2 Models de col·laboració externa per a preservació digital

Seguint Brown (2013), observem que hi ha diferents opcions per a la col·laboració entre institucions amb fins de preservació digital.

 

1.2.1 Opció subcontractada

Avui en dia la subcontractació representa un mercat en creixement format per serveis externs de repositoris segurs i per sistemes gestors de preservació digital externs a les organitzacions. Aquest mercat ja està oferint serveis complets que inclouen programari propi i les tècniques necessàries per mantenir els objectes digitals copiats, al dia i accessibles a llarg termini, sempre que es mantingui la relació amb els proveïdors del servei. Podem dir que aquesta opció és la primera aproximació a la descentralització d'un procediment de preservació digital. És una opció fàcil d'implementar perquè permet evitar la inversió en equip i en sistemes per a un sistema propi de l'organització. La subcontractació es pot fer a altres institucions o bé a empreses privades de serveis digitals, i hi ha una gran variabilitat en els nivells d'implicació i responsabilitats entre les dues parts, el client i el contractista, però normalment hi ha una gran delegació a la segona.

 

1.2.2 Opció d'associació

L'opció de col·laborar de manera associada està plantejada principalment quan diverses organitzacions comparteixen els mateixos objectius i prenen la responsabilitat de participar activament en el desenvolupament de serveis compartits.

La relació entre les diferents organitzacions cooperants requereix l'establiment d'acords, els quals poden ser informals, formals o, si s'escau, amb entitats legals separades. En el model d'associació, les organitzacions membres adopten diferents rols i funcions, però el fi conjunt és el d'hostatjar i copiar totes les col·leccions dels participants o una part utilitzant diferents tecnologies de col·laboració que ajudin a mantenir la informació digital compartida segura, autèntica i sempre disponible amb diferents rèpliques distribuïdes. L'associació manté avantatges similars als d'un club, on els integrants comparteixen bones pràctiques i millora continuada.

 

1.3 Models de col·laboració en repositoris institucionals

L'aplicació del model OAIS als dipòsits institucionals de les universitats i altres institucions científiques i culturals és un cas complicat, ja que en aquests repositoris preval la funció d'accés sobre la de preservació. Hitchcock et al. (2007) han proposat diferents escenaris de treball en què es modifica el model OAIS per adaptar-lo a la realitat dels repositoris institucionals. A continuació, comentem dos d'aquests escenaris o models, que en aquest cas estan pensats per ser implementats de manera distribuïda entre diverses organitzacions.

 

1.3.1 Model de proveïdor de servei

Aquest model empra una adaptació concreta del sistema OAIS, en què les entitats funcionals es modifiquen de la manera següent. L'entitat ingressada (ingest) es modifica a una interfície d'ingrés personalitzada al repositori institucional (IR interface ingest), la gestió de dades (data management) pren la personalitat del repositori institucional (institutional repository) i l'emmagatzematge d'arxiu (archival storage) es modifica per convertir-lo en un proveïdor de servei de preservació (preservation service provider).

 

1.3.2 Models de xarxa i federats

Els models de xarxa i federats inclouen principalment la col·laboració de diversos clients o operadors, que comparteixen continguts i rèpliques similars pel que fa a compromís de soci. És a dir, es comprometen a mantenir còpies idèntiques sota polítiques i normatives establertes pels participants. En aquest cas, la modificació del model OAIS se centra en l'accés, l'ingrés i l'emmagatzematge.

Com podem observar, els models d'arxiu amb fins de preservació digital a llarg termini corresponen a una alta gamma de flexibilitat d'acord amb opcions, tipologia d'obertura d'arxiu, federacions, distribució i altres components. El nostre cas d'interès se centra a estudiar l'aplicació de la preservació digital de forma distribuïda, associada, en xarxa i federada com a model d'integració d'una estratègia de preservació.

 

2 Casos internacionals de preservació distribuïda

A manera pràctica, podem dir que el model de preservació digital distribuïda (PDD) és una combinació del model d'opció d'associació de Brown (2013) i de la proposta de model de xarxa i federats de Hitchcock et al. (2007), ja que implementen estratègies de preservació digital descentralitzades en mode de col·laboració associada i sobre una xarxa de distribució organitzacional. Skinner i Schultz (2010) van estandarditzar la definició de la PDD tècnicament, ja que, partint del model de referència OAIS, es van definir els processos i tecnologies que havien de ser presents en cada un dels processos d'enviament, disseminació i preservació d'objectes digitals que defineixen un model distribuït. En aquest tipus de model prenen preeminència l'existència d'una plataforma oberta de programari, d'una xarxa d'afiliats i l'ús d'un protocol d'organització que formalitza l'estratègia de preservació digital pel que fa a la col·laboració i la distribució dins d'una xarxa privada.

El model de preservació digital es basa en el principi que qualsevol sistema responsable d'activitats de preservació digital ha de mantenir i distribuir còpies dels fitxers digitals que protegeix en diferents localitzacions geogràficament disperses. En aquestes localitzacions els fitxers no es guarden com un simple suport, sinó que es gestionen autònomament seguint uns criteris acordats amb els quals evitar pèrdues de dades o com a suport de les activitats de preservació. A la pràctica, la distribució dels fitxers es fa en diferents localitzacions que funcionen com a servidors o nodes autònoms, seguint un programari i una metodologia que periòdicament duu a terme una activitat de monitorització, validació i còpia dels fitxers per garantir-ne la integritat digital.

Si en els sistemes de preservació digital regits per un únic organisme ja es poden detectar multitud de variants, quan parlem de preservació distribuïda les alternatives tècniques i d'organització augmenten (Zierau; Schultz, 2013). Per aquest motiu l'estudi de casos internacionals d'implementació del model de preservació digital distribuïda pot il·lustrar les raons que sustenten aquestes diferents alternatives i els avantatges i inconvenients que comporten.

L'estudi de casos internacionals es va dur a terme des d'un punt de vista exploratori. La selecció de tres xarxes de preservació digital distribuïda es va fer de forma no probabilística i es va definir d'acord amb factors com la tipologia de xarxa de preservació digital (només en xarxes de preservació digital distribuïda), la disposició de comunicació (entrevista personal o via correu electrònic) i la disponibilitat d'informació pública institucional (llocs web o repositoris) sobre els models de xarxa. A partir d'aquests criteris es va obtenir un panorama descriptiu de casos, se'n van desenvolupar individualment els antecedents i objectius, i es va dur a terme un diagrama conceptual del seu model de xarxa i dels seus elements de composició funcional. Un cop feta la descripció de cada cas, es van analitzar i interpretar individualment per integrar-hi una matriu FODA de fortaleses, oportunitats, debilitats i amenaces de cadascuna de les xarxes de preservació digital distribuïda.

Les xarxes seleccionades com a casos d'estudi van ser tres: The National Danish Bit Repository, la Xarxa Cariniana del Brasil i el model emprat pel Consorci de Serveis Universitaris de Catalunya (CSUC) en la seva participació dins del MetaArchive Cooperative.

 

2.1 El cas del National Danish Bit Repository

L'objectiu funcional de la xarxa del National Danish Bit Repository (NDBR) és el de proveir un protocol i un sistema de preservació digital amb arquitectura distribuïda que coordina les tres institucions daneses participants, que són The National Archives, The Royal Library i l'State and University Library (Sørensen, 2014). Mitjançant una capa de coordinació es gestionen les diferents accions i pilars (unitats d'emmagatzematge) de cadascuna de les institucions participants, seguint els acords establerts de nivell de servei (SLA). Els pilars d'emmagatzematge són avaluats i gestionats per la capa de coordinació del programari propi, que manté la informació sobre l'estat del contingut digital emmagatzemat en les institucions participants.

El model del NDBR conceptualment utilitza elements com ara client, protocol, capa de coordinació i pilars. Pel que fa a les funcions tècniques, són definides en l'element de protocol amb diferents accions i prestacions per als clients (nodes d'emmagatzematge) que representen els repositoris o el programari de les organitzacions, així com la forma en què poden accedir-hi per l'element de capa de coordinació que duu a terme les gestions oportunes de distribució de rèpliques digitals en els diferents pilars (node o unitat d'emmagatzematge independent) distribuïts en les tres institucions participants. El model del NDBR utilitza diferents tipus de mitjans d'emmagatzematge com a proposta alternativa a la dependència de tecnologies úniques, integra unitats de disc magnètic, unitats de cinta i unitats d'estat sòlid, i permet la possibilitat de connectar unitats en el núvol.

El client d'aquest model forma part dels serveis del node d'emmagatzematge quant a programari de la institució, el qual sol·licita serveis i processos al protocol dins de la capa de coordinació que desenvolupa les activitats de coordinar els diferents processos i serveis (inclosa la replicació). Les diverses accions, processos i serveis es refereixen per igual als pilars o nodes d'emmagatzematge compartits.

 

Figura 1. Model de visió conceptual i funcional del NDBR

Figura 1. Model de visió conceptual i funcional del NDBR

 

En el model del NDBR destaca particularment que cadascuna de les institucions pot gestionar diferents pilars d'emmagatzematge independentment o com a unitats compartides, i s'utilitza un pilar exclusivament per recollir els checksums de control d'integritat dels fitxers, fet que dona més autonomia a aquest tipus de registres i en facilita la replicació per seguretat.

Cal esmentar que en el model conceptual i funcional del NDBR els factors de seguretat i confidencialitat i l'existència de diferents necessitats en les tres institucions participants els van portar a crear un sistema de desenvolupament propi. En aquest cas, van donar una gran importància al fet que estaven custodiant i preservant material d'una alta sensibilitat nacional (arxius nacionals) o de gran importància cultural (The Royal Library i l'State and University Library). En aquest cas s'entén l'estratègia de mantenir la independència operativa i funcional en les seves activitats de preservació sense fer ús de serveis de preservació digital externs o cooperatives internacionals, ja que aquesta opció forma part del nivell d'exigències i necessitats pròpies d'aquestes institucions. Mantenir la cooperació entre tres institucions de primer nivell nacional no resulta fàcil, i encara menys fer-ho amb un desenvolupament tecnològic propi i autònom. Per això creiem que el model del NDBR és un referent que ha de seguir-se.

 

2.2 El cas de Cariniana del Brasil

Cariniana és la Xarxa Brasilera de Serveis de Preservació Digital. Està coordinada per l'Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT), del Ministério da Ciência, Tecnologia i Inovação (MCTI), i està formada per diferents universitats i centres de recerca del Brasil.

Metodològicament i tecnològica, Cariniana és una xarxa de serveis de col·laboració de preservació digital construïda sobre el programari LOCKSS, desenvolupat per la Stanford University (Márdero, 2013). Actualment la xarxa està integrada per vint caixes d'institucions sòcies, quatre caixes coordinadores i dues capes de col·laboració que gaudeixen de diferents prestacions i necessitats en la xarxa. Cada caixa és un node de maquinari amb capacitat d'emmagatzematge i dotat de programari d'interconnexió amb la resta dels nodes. Cal assenyalar que aquest model de xarxa privada de preservació va ser creat inicialment per a la preservació de les revistes científiques de les universitats i els centres de recerca del Brasil, però després el seu objectiu es va ampliar per afavorir la preservació d'altres tipus de materials mitjançant la creació de diferents subxarxes temàtiques.

El model d'organització de la xarxa Cariniana distingeix tres grups de formes de col·laboració. Primerament, hi ha els col·laboradors integrals, formats per institucions públiques o privades que aporten i comparteixen infraestructura d'emmagatzematge i que posseeixen documents digitals en sistemes electrònics de gestió. Segonament, trobem el grup de les institucions col·laboradores, que participen en algun projecte de preservació digital i posseeixen documents digitals compatibles amb els sistemes de preservació digital, però que acaben sent preservats pels col·laboradors integrals. Finalment, hi ha els col·laboradors individuals, que són persones que col·laboren en projectes i recerca en preservació digital.

Dins el model de xarxa Cariniana podem observar tres actors principals. En primer lloc, trobem la integració d'una xarxa i subxarxes privades d'institucions d'educació superior i centres d'investigació; en segon, una institució coordinadora de la xarxa (IBICT), i, finalment, l'adopció de la tecnologia del sistema LOCKSS de preservació digital en mode distribuït.

 

Figura 2. Model de la xarxa privada Cariniana i d'integració de subxarxes

Figura 2. Model de la xarxa privada Cariniana i d'integració de subxarxes

 

Específicament, el model de preservació digital distribuïda de Cariniana està format per quatre subxarxes amb diferent contingut temàtic, les quals, al seu torn, estan integrades per sis caixes (LOCKSS Box) que mantenen una integració compartida. En aquest model i visió general, podem observar que cada subxarxa manté dins dels seus nodes o caixes una caixa d'IBICT, que funciona com el node que connecta amb la capa de coordinació IBICT de subxarxes i de la xarxa general. Aquesta capa de coordinació IBICT està connectada amb la capa de suport internacional del sistema o Aliança LOCKSS.

Basant-nos en la definició del model conceptual i funcional de PDD, a la xarxa Cariniana les activitats de coordinació i suport es duen a terme de forma centralitzada en el nucli operatiu de la capa de coordinació (IBICT). Aquí les caixes de les subxarxes fan les activitats d'ingrés de continguts i, gràcies als serveis oferts pel sistema LOCKSS, també poden copiar, monitoritzar, reparar i validar els seus continguts emmagatzemats  així com les rèpliques de les altres caixes de la seva xarxa, totes elles connectades amb el protocol Library Cache Auditing Protocol (LCAP).

En aquest model de serveis de preservació digital distribuïda, l'aliança internacional amb el sistema LOCKSS permet tenir accés a l'assistència tècnica de la Stanford University, sense que aquesta última interfereixi en l'administració de la xarxa Cariniana (Duarte; Márdero, 2015). D'aquesta manera, el sistema de preservació brasiler, d'una banda, disposa dels avantatges de l'aliança amb el sistema tecnològic pioner en l'àmbit de la preservació digital distribuïda desenvolupat per la Stanford, la qual cosa aporta la seguretat, el suport i la garantia de tenir un sistema sòlid i robust de PDD. D'altra banda, tenir la figura d'una institució coordinadora nacional com l'IBICT, amb infraestructura pròpia i experiència en el treball col·laboratiu a escala nacional, facilita la integració de les institucions sòcies, que disposen de diferents opcions de col·laboració.

Cal destacar que, pel que fa a la propietat dels servidors, i a diferència de la xarxa NDBR, que disposa de protocols i servidors de desenvolupament propis, en el model de la xarxa Cariniana la inclusió d'un servidor propietari extern, amb funcions no administratives i només de verificació de metadades, en connexió amb la xarxa privada de cada institució, representa un factor important que s'ha de considerar segons quin sigui el tipus de continguts que hagin de preservar-se i replicar-se. Aquest podria ser un tema sensible que frenés la col·laboració i la incorporació de nous socis, a causa d'aspectes de privacitat de la xarxa o, si escau, de la seguretat de la informació dels registres que s'intercanvia entre cadascuna de les caixes i que, pel que fa a les metadades, recull i verifica el servidor propietari.

 

2.3 El cas del CSUC al MetaArchive Cooperative

El model de xarxa de preservació digital distribuïda en el qual participa el Consorci de Serveis Universitaris de Catalunya (CSUC) és un model que integra diferents capes de coordinació de tipus col·laboratiu i de cooperació. El CSUC empra per a la preservació digital de tesis doctorals el servei extern del sistema MetaArchive Cooperative.

El CSUC va néixer l'any 2013 de la fusió del Consorci de Biblioteques Universitàries de Catalunya (CBUC) i el Centre de Supercomputació de Catalunya (CESCA) amb la finalitat d'oferir i mancomunar els serveis acadèmics, científics i de gestió de les entitats en consorci, format per la Generalitat de Catalunya i deu universitats catalanes. Dins dels diferents serveis que s'ofereixen al CSUC es troba el repositori Tesis doctorals en xarxa (TDX), integrat a l'efecte de preservació en la xarxa MetaArchive Cooperative.

El CBUC ja tenia experiència en la utilització de diferents mecanismes de suport amb objectius de preservació digital, bé a nivell local (centre de dades del CESCA) o bé regional (còpia de seguretat en altres ciutats de Catalunya), però per al repositori TDX es va buscar un sistema ja més avançat que assegurés de forma més robusta la seguretat i la preservació dels continguts. Així es va optar per participar dels serveis de la xarxa MetaArchive Cooperative, que utilitza el sistema LOCKSS com a base dels serveis de preservació digital distribuïda i integra una capa de coordinació amb l'aplicació web Conspectus, amb la qual s'administra la replicació segura, i la implementació de connectors i col·leccions entre els diferents participants de la xarxa. El MetaArchive és un sistema cooperatiu que permet la replicació de les tesis emmagatzemades al TDX entre diferents nodes d'emmagatzematge de la xarxa, la majoria al continent americà (Schultz; Gore, 2010).

La participació del CSUC a la xarxa del MetaArchive Cooperative pot definir-se funcionalment com un node d'emmagatzematge i coordinació, ja que a més de ser un node soci en la xarxa coordina la subxarxa col·laborativa d'universitats que aporten continguts al repositori digital de continguts (TDX). Pel que fa a l'organització, el MetaArchive Cooperative permet que els socis hi participin segons diferents possibilitats d'integració (sustaining member, preservation member, collaborative member). En el cas del CSUC, hi participa com a membre col·laboratiu (collaborative member) ja que coordina una sèrie d'institucions sota un únic node d'emmagatzematge i cooperació.

Quant a les capes de coordinació com a elements funcionals, en primer lloc, hem de parlar de la capa central de coordinació que gestiona el MetaArchive Cooperative, la qual té la funció principal d'administrar els diferents socis representats per diferents caixes o nodes distribuïts a partir de la integració del sistema LOCKSS i l'aplicació web Conspectus combinant els elements conceptuals i funcionals d'organització i tècnics. El MetaArchive Cooperative administra l'adreça (caixa o node) on cadascuna de les rèpliques ha de residir, així com les gestions de sol·licitud a cadascuna d'elles per connectar-se sota la implementació dels connectors necessaris de cada soci per crear grups de replicació de continguts. En segon lloc, trobem com a segona capa de coordinació la del CSUC, que, com hem esmentat, manté una funció doble de node d'emmagatzematge i coordinador de la subxarxa de membres que aporten continguts al TDX.

En la representació i integració del model de participació del CSUC a la xarxa de preservació distribuïda MetaArchive Cooperative, podem observar que s'integren definicions, conceptes i protocols tècnics del sistema LOCKSS i Conspectus, els d'administració i coordinació cooperativa del MetaArchive, així com els protocols de coordinació i participació del CSUC com a coordinador de continguts de la subxarxa d'universitats que formen el node o caixa de preservació digital distribuïda a la xarxa.

 

Figura 3. Model de la participació col·laborativa del CSUC a la xarxa MetaArchive Cooperative

Figura 3. Model de la participació col·laborativa del CSUC a la xarxa MetaArchive Cooperative

 

En aquest cas, el CSUC, com a intermediari o broker coordinador de serveis universitaris, aporta un avantatge competitiu que parteix de l'especialització, evolució i experiència en la integració col·laborativa d'àmbits tecnològics (CESCA) i bibliotecaris (CBUC) que van més enllà de ser una simple capa de coordinació. Gràcies a això, el CSUC disposa d'elements essencials en tot el procediment de preservació digital tant pel que fa a rols tècnics com a organització institucional. Cal recordar que el fet de disposar d'un servei extern de preservació digital distribuïda no garanteix tenir una solució completa, ja que, tot i així, per complir plenament els objectius requerits cal disposar de tot un sistema d'organització d'infraestructures tècniques i humanes institucionals paral·leles.

 

2.4 Contrast FODA d'elements funcionals en casos de models de PDD

Dels tres casos presentats, se'n va estudiar l'organització i com aquesta presenta característiques que poden afavorir o dificultar la funció final de preservació. El resultat és una anàlisi FODA (vegeu la taula 1) amb el balanç i la consideració general de les fortaleses, oportunitats, desavantatges i amenaces que presenta cada model de PDD.

 

Model
Fortaleses
Oportunitats
Desavantatges
Amenaces
NDBR
  • Desenvolupament propi del sistema i protocol de preservació digital distribuïda Bit Repository Project.
  • Xarxa privada basada en confidencialitat, seguretat i privacitat de documents i dades d'ordre nacional.
  • Capa de coordinació i protocol d'organització interinstitucional de tres institucions.
  • Flexibilitat per a la integració de nodes o institucions addicionals.
  • Evita dependències tecnològiques en usar diversos sistemes i suports d'emmagatzematge com a estratègia.
  • Personalització del sistema de PDD a requeriments extres i adequació a cada institució participant.
  • Alt cost de la inversió en el desenvolupament i manteniment de sistemes i infraestructures tècniques i humanes.
  • Poca quantitat de nodes replicats geogràficament a Dinamarca.
  • Nul·la replicació internacional que asseguri còpies fora del país.
  • Dificultats per al manteniment sostenible de la xarxa a llarg termini a causa dels costos d'operació.
  • Possibilitat de pèrdua de dades en tasques de migració i refresc a causa de la diversitat de suports d'emmagatzematge.
  • Risc de pèrdua de dades en no tenir més de tres nodes.
Cariniana
  • Aliança i integració amb el sistema pioner en preservació digital distribuïda LOCKSS.
  • Xarxa privada amb mètode de treball, solució tecnològica i polítiques pròpies per a la gestió interinstitucional.
  • Disposa d'una institució coordinadora estratègica (IBICT) que funciona com a node i capa de coordinació interinstitucional de la xarxa de PDD al Brasil.
  • Flexibilitat per integrar nodes o institucions addicionals a la xarxa privada a l'Amèrica Llatina.
  • Replicació distribuïda en sis caixes repartides en institucions del Brasil, que disposen d'una extensió territorial adequada per a la seva distribució geogràfica nacional.
  • Pioners a l'Amèrica Llatina a implementar el sistema LOCKSS com a xarxa de preservació digital distribuïda.
  • Baix cost anual, però amb dependència tècnica del suport extern del sistema LOCKSS.
  • Enllaç a servidors externs de l'Stanford University (LOCKSS Prop Server) com a propietari del sistema que recull metadades de les caixes al Brasil.
  • Replicació nul·la en nodes fora del país.
  • Complexitat de la coordinació a causa del creixement del nombre de nodes amb diferents necessitats.
  • Dificultats per al manteniment sostenible de la xarxa a llarg termini a causa dels costos d'operació.
  • Risc de pèrdues en confidencialitat, seguretat i privacitat de la xarxa en dependre de servidors centrals externs (Stanford University).
CSUC
MetaArchive Cooperative
  • Ús i integració del servei de preservació digital del MetaArchive Cooperative mitjançant l'ús de l'aplicació web Conspectus que gestiona el sistema base LOCKSS.
  • Alta replicació distribuïda geogràficament fora de la zona d'origen del CSUC (Europa) en set nodes distribuïts entre el nord i el sud d'Amèrica.
  • Té dues capes de coordinació: la capa de servei del MetaArchive i la capa en la qual el CSUC coordina els continguts preservats de diverses institucions a TDX.
  • Experiència del CSUC com a consorci cooperatiu d'educació superior en repositoris digitals i serveis universitaris.
  • Distribució geogràfica rotativa i periòdica de nodes d'emmagatzematge per assegurar nodes actius i sostenibles.
  • Baix cost d'inversió en infraestructura tècnica i d'operació del node participant a la xarxa MetaArchive Cooperative.
  • Cost mitjà de servei de participació com a node col·laboratiu (grup d'universitats).
  • Dependència tècnica per a la integració a la xarxa i necessitat que cada node desenvolupi connectors especialitzats per connectar-se a la xarxa MetaArchive Cooperative.
  • Vot nul en decisions administratives o tècniques de la cooperativa (atesa la condició d'usuari col·laboratiu). També sense dret a decidir en quina institució o zona geogràfica es replicaran els diferents continguts que s'han de preservar.
  • Risc de baixa de socis col·laboradors del CSUC, així com del MetaArchive Cooperative.
  • Dificultats per al manteniment sostenible de la xarxa a llarg termini a causa dels costos d'operació.
  • Risc de pèrdues en confidencialitat, seguretat i privacitat de la xarxa en dependre de servidors centrals externs (MetaArchive Cooperative).

Taula 1. Comparació FODA en tres models de PDD

 

3 Conclusions

L'anàlisi dels exemples de casos en models de xarxes de preservació digital distribuïda i els protocols de la seva organització ens mostra el que moltes organitzacions no volen veure i que es tradueix en el fet que la preservació digital distribuïda no s'ha de considerar només com el tractament d'una implementació tecnològica, ja que prioritàriament requereix un treball paral·lel de coordinació, administració i organització de tecnologia, persones i institucions.

En aquest estudi, hem trobat patrons similars pel que fa a l'organització dels models de xarxes de preservació digital distribuïda, ja que utilitzen capes de coordinació representades per una institució coordinadora, la qual centralitza i distribueix procediments, responsabilitats i rols a cadascuna de les institucions que formen part d'una xarxa de preservació digital distribuïda. També és important esmentar que hem observat que les institucions que formen part o accedeixen a les prestacions d'una xarxa de PDD prèviament han cobert i integrat una sèrie de condicionaments tècnics necessaris, com ara la normalització i estandardització de la producció digital documental, la definició de polítiques de gestió i difusió, la integració de sistemes de gestió documental i de repositoris, i la integració de sistemes de preservació digital centralitzada. A més, s'ha comprovat que la majoria de les institucions participants de la xarxa tenen una cultura prèvia de cooperació interinstitucional o d'historial de treball cooperatiu que els permet gestionar millor temes com la distribució de rèpliques, els acords de serveis i la pròpia governança de la xarxa.

També observem que, per implementar un pla o programa de preservació digital distribuïda, és obligatòria l'existència d'un full de ruta personalitzat de requisits, necessitats i prestacions de cadascuna de les institucions participants, ja que, si una d'elles no compleix requisits previs, tant tècnics com d'organització o econòmics, serà perillós mantenir i sostenir un programa col·laboratiu de preservació digital.

Finalment, s'observa que una xarxa de preservació digital distribuïda tendeix a tenir un funcionament centralitzat per als temes de coordinació i administració, distribuït per a l'organització de les responsabilitats tècniques, i col·laboratiu per a temes de sostenibilitat econòmica.

 

Agraïments

Agraïm la col·laboració del personal del Danish Bit Repository, Cariniana i el CSUC en prestar-se a contestar les nostres preguntes.

 

Bibliografia

Brown, Adrian (2013). Practical digital preservation: A how-to guide for organizations of any size. London: Facet Publishing.

D'Amato, Gianluca (2012). "Towards distributed digital preservation". Notes from 2nd LIBER Workshop on Digital Preservation. Digital Preservation Coalition: Florence, Italy, 7th-8th, May 2012. <http://www.dpconline.org/docman/miscellaneous/advice/755-dpc-liber-may2012/file>. [Consulta: 06/11/2017].

Day, Michael (2008). "Toward Distributed Infrastructures for Digital Preservation: The Roles of Collaboration and Trust". International journal of digital curation, vol. 3, no. 1. <http://ijdc.net/index.php/ijdc/article/view/60>. [Consulta: 06/11/2017].

Duarte Tavares, Maria de Fátima; Márdero Arellano, Miguel Ángel (2015). "Preservação do patrimônio científico das humanidades: a emergência da Rede Cariniana". Cadernos de história, vol. 16, no. 25, p. 30–45. <http://periodicos.pucminas.br/index.php/cadernoshistoria/article/viewFile/P.2237-8871.2015v16n25p30/8890>. [Consulta: 06/11/2017].

Giaretta, David (2011). Advanced Digital Preservation. Berlin: Springer-Verlag.

Hitchcock, Steve; Brody, Tim; Hey, Jessie M. N.; Carr, Leslie (2007). "Digital Preservation Service Provider Models for Institutional Repositories: Towards Distributed Services". D-Lib magazine, vol. 13, no. 5/6. <http://www.dlib.org/dlib/may07/hitchcock/05hitchcock.html>. [Consulta: 06/11/2017].

Márdero Arellano, Miguel Ángel (2013). "Preservación digital distribuida: un modelo para América Latina". BIREDIAL 2013 Conferencia internacional acceso abierto, preservación digital y datos científicos: San José, Costa Rica, del 15 al 17 de octubre de 2013. <http://eprints.rclis.org/20737/>. [Consulta: 06/11/2017].

OAIS (2012). Reference Model for an Open Archival Information System (OAIS). CCSDS 650.0-M-2. Recommended Practice. Magenta Book. Washington DC: Consultative Committee for Space Data Systems (CCSDS). <http://public.ccsds.org/publications/archive/650x0m2.pdf>. [Consulta: 06/11/2017].

Rothenberg, Jeff (1999). Ensuring the Longevity of Digital Information (expanded version of the article "Ensuring the Longevity of Digital Documents" that appeared in the January 1995 edition of Scientific American). <https://www.clir.org/pubs/archives/ensuring.pdf>. [Consulta: 06/11/2017].

Schultz, Matt; Gore, Emily B. (2010). "The Importance of Trust in Distributed Digital Preservation: A Case Study from the MetaArchive Cooperative". iPRES 2010. Proceedings of the 7th International conference on preservation of digital objects: Vienna, Austria, September 19-24, 2010. <https://phaidra.univie.ac.at/view/o:185509>. [Consulta: 06/11/2017].

Skinner, Katherine; Schultz, Matt (ed.) (2010). A Guide to Distributed Digital Preservation. MetaArchive Cooperative. Atlanta: Enducopia Institute. <https://educopia.org/sites/educopia.org/files/publications/A_Guide_to_Distributed_Digital_Preservation_0.pdf>. [Consulta: 06/11/2017].

Sørensen, Jan Dalsten (2014). "From stand-alone preservation to cross-institutional collaboration". Archives and cultural industries. 2nd annual conference ICA (International Council of Archives): Girona, 11th-15th October 2014. <http://www.girona.cat/web/ica2014/ponents/textos/id119.pdf>. [Consulta: 06/11/2017].

Térmens, Miquel (2013). Preservación digital. Barcelona: Editorial UOC.

Voutssás, Juan (2012). "Long-term digital information preservation: challenges in Latin America". Aslib proceedings, vol. 64, no. 1, p. 83–96.

Zierau, Eld; Schultz, Matt (2013). "Creating a Framework for Applying OAIS to Distributed Digital Preservation". iPRES 2013. Proceedings of the 10th International conference on preservation of digital objects: September 3-5, 2013, Lisbon, Portugal. <http://phaidra.univie.ac.at/o:377399>. [Consulta: 06/11/2017].

 

Citació recomanada

Leija Román, David Alonso; Térmens Graells, Miquel (2017). "Preservació digital distribuïda : lliçons d'experiències internacionals". BiD: textos universitaris de biblioteconomia i documentació, núm. 39 (desembre) . <http://bid.ub.edu/39/leija.htm>. DOI: http://dx.doi.org/10.1344/BiD2017.39.24 [Consulta: 16-08-2018].