[Versión castellana]


Ciro Llueca Fonollosa

Projecte PADICAT (Patrimoni Digital de Catalunya)
Biblioteca de Catalunya

cllueca@bnc.esResum [Abstract] [Resumen]

Les tecnologies de la informació i comunicació han facilitat que el patrimoni cultural i científic i la informació en general es presentin en format digital, com també en els formats analògics tradicionals. La reacció no s'ha fet esperar, i des de la dècada dels noranta han sorgit diversos projectes destinats a garantir l'accés permanent a la producció digital —la recopilació i l'emmagatzematge, el tractament, la preservació i la difusió. En aquest article es presenta la panoràmica mundial dels models existents de dipòsits digitals nacionals, nom que reben aquests projectes impulsats habitualment per les biblioteques nacionals amb un objectiu comú: fer que les pàgines web siguin sempre accessibles.


1 Introducció

Les tecnologies de la informació i la comunicació han facilitat que el patrimoni cultural i científic i la informació en general es presentin en format digital, com també en els formats analògics tradicionals. Actualment, i tal com ho exposen les Directrices para la preservación del patrimonio digital,1 els recursos que són fruit del coneixement o l'expressió dels éssers humans, ja siguin de caràcter cultural, educatiu, científic o administratiu, o comprenguin informació tècnica, jurídica, mèdica i d'un altre tipus, es generen directament en format digital o es converteixen a aquest format a partir de material analògic ja existent. Els productes que d'antuvi es generen digitalment no existeixen en un altre format que no sigui l'electrònic original.

Aquesta realitat, sumada a la voluntat de les persones, les institucions i els governs de vetllar per la preservació de qualsevol forma de patrimoni, ha possibilitat que les administracions de diversos països hagin promogut polítiques destinades a garantir l'accés permanent a la producció digital —la recopilació i l'emmagatzematge, el tractament, la preservació i la difusió— per part dels agents públics i privats.

Les dificultats són notables. Per començar, els mètodes tradicionals de preservació de la producció bibliogràfica (com ara el dipòsit legal) són de difícil aplicació en l'entorn digital perquè, a banda de la possible obsolescència del text legal (el cas espanyol), els recursos digitals poden instal·lar-se en servidors d'arreu del món (com passa també amb els impressors que no són editors). Aquest fet dificulta la tradicional correspondència geogràfica entre la ubicació del productor i la llengua o la temàtica publicada. En segon lloc, la producció digital té un creixement exponencial i, a més, és molt variable la durabilitat dels materials publicats a Internet2 i, en conseqüència, limitada la possibilitat d'accés permanent al patrimoni. Finalment, cal assenyalar la qüestió de la propietat intel·lectual del producte digital, que està mancat d'un dret basat en el principi de còpia per a la preservació que asseguri la conservació i perdurabilitat del patrimoni digital, amb les limitacions comercials que siguin necessàries.

Com s'ha apuntat, i malgrat les dificultats, diversos països han entès la necessitat de passar a l'acció i d'establir polítiques i emprendre accions de preservació per assegurar la pervivència de la producció digital, com ja s'havia fet històricament amb els documents impresos i en suports tradicionals, mitjançant les lleis nacionals del dipòsit legal. En la major part dels casos que es presentaran ha estat la biblioteca nacional qui ha liderat el procés de preservació i l'accés del patrimoni digital; per fer-ho ha implicat la resta d'agents.

El juny de 2005, la Biblioteca de Catalunya va posar en marxa el projecte PADICAT (Patrimoni Digital de Catalunya). El text que ara es presenta és un dels fruits de la primera fase del projecte. L'objectiu d'aquest article és presentar la panoràmica mundial en matèria d'accessibilitat permanent a la producció web,3 i els models existents a l'hora de capturar les produccions digitals en línia. No s'examinen altres qüestions d'aquests models, com ara els aspectes legals de cada territori o les diferències dels programaris emprats per les biblioteques.


2 Dipòsits digitals nacionals: arxivant la web

En els orígens de la preservació digital podem esmentar les accions de les biblioteques virtuals, amb projectes de biblioteques de recerca, universitàries, nacionals i també públiques dedicats a presentar directoris temàtics de recursos electrònics. Complementàriament i per donar resposta a necessitats temàtiques concretes (normalment d'àmbit geogràfic que seguien el model enciclopèdic digital dels CD-ROM), es va optar per crear dipòsits multiformat (imatges, so, text, gràfics, etc.). El pas lògic següent ha estat conservar els recursos propis per garantir-ne l'accés amb totes les variables formals que s'han produït en el temps; són les iniciatives que es coneixen amb els noms de dipòsits institucionals, arxius d'e-prints, etc. Quan el procés es dedica a un territori, parlem dels dipòsits4 digitals nacionals, dels arxius web o de les biblioteques nacionals digitals.

Un dipòsit digital nacional té la missió de garantir l'accés a llarg termini als recursos digitals que es generen en un territori, o sobre un territori determinat. De fet, la missió de la Biblioteca de Catalunya, com a biblioteca nacional que és, no és altra que recollir, conservar i difondre la producció bibliogràfica catalana i la relacionada amb l'àmbit lingüístic català, i vetllar per la conservació i la difusió del patrimoni bibliogràfic. I s'entén que aquest patrimoni bibliogràfic inclou també la producció bibliogràfica digital catalana que conformarà el PADICAT, el Patrimoni Digital de Catalunya.


2.1 Els models existents

Les experiències existents de dipòsits nacionals digitals s'agrupen en dos models inicials. Per una banda, el model integral o exhaustiu (model majoritari, i característic de Suècia, Noruega, Finlàndia, Islàndia i Àustria, entre d'altres) aposta per la integració automàtica del total de la web objecte de preservació a partir de determinats criteris infraestructurals (lingüístics, segons el domini de les web, segons la ubicació del servidor, etc.). I per l'altra, el model selectiu (assimilat per Austràlia, el Canadà, el Japó i el Regne Unit, entre altres països) dirigeix les accions de recopilació d'acord amb una política selectiva temàtica (sobre un espai geogràfic determinat, al voltant d'un tema d'interès nacional, etc.); per fer-ho arriba a acords amb els editors o productors de recursos web.

Aquests dos models han deixat pas en alguns països, però cada vegada amb més força, a models híbrids que complementen la captura periòdica del total de la web nacional amb acords amb els productors, que es basen en interessos temàtics o que tenen relació amb esdeveniments d'actualitat (eleccions, catàstrofes, etc.).

Finalment, altres anàlisis teòriques5 de la situació apunten cap a una classificació més complexa (segons que la web que s'hagi de capturar sigui estàtica o dinàmica, per exemple), però entenem aquí que la captura restrictiva de la web segons la seva complexitat de preservació i garantia d'accés (si és estàtica, és més fàcil capturar-la i preservar-la) és només un primer pas per a l'objectiu final de tots els dipòsits digitals nacionals.


2.1.1 El model integral

Els principals avantatges o punts forts del model integral són:

Els principals inconvenients o punts febles del model integral són:


2.1.2 El model selectiu

Els principals avantatges o punts forts del model selectiu són:

Els principals inconvenients o punts febles del model selectiu són:


2.1.3 El model híbrid

Els dos models anteriors han deixat pas a models híbrids que complementen la captura sistemàtica del web nacional (model típicament integral) amb acords amb institucions productores segons els interessos temàtics (model selectiu). Addicionalment, el projecte es pot dirigir a efectuar captures selectives de determinats esdeveniments d'interès general com, per exemple, els Jocs Olímpics, eleccions, catàstrofes naturals, etc.

El cas danès, per exemple, està enfocat en l'acció triple que suposa la captura exhaustiva del web danès, els acords amb entitats editores del país i la captura exhaustiva però focalitzada d'esdeveniments d'interès.

De l'estudi detallat dels dipòsits existents es desprèn que aquesta és la tendència cap a la qual tendeixen la majoria dels projectes integrals (Àustria, els Països Baixos, Suècia, Finlàndia, etc.).

Lògicament, els projectes híbrids incorporen alguns dels avantatges descrits anteriorment (col·lecció rica i equilibrada, màxim accés, impuls dels acords estratègics, compilació automatitzada i seguiment de les llacunes), però també elements negatius (cost elevat, equips més nombrosos o càrrega de gestió).


2.2 Dipòsits digitals nacionals

S'han trobat referències de vint casos de dipòsits nacionals:10 Alemanya, Austràlia, Àustria, el Canadà, Dinamarca, els Estats Units d'Amèrica, Estònia, Finlàndia, França, Grècia, Islàndia, el Japó, Lituània, Noruega, Nova Zelanda, els Països Baixos, el Quebec, el Regne Unit, la República Txeca i Suècia. Atenent al model que segueixen, es poden classificar de la manera següent:

Tanmateix, com ja s'ha esmentat, la major part dels dipòsits que segueixen un model integral han adoptat mesures per incloure determinats recursos (com ara publicacions periòdiques) que els fan acostar a paràmetres híbrids. Aquesta és la tendència generalitzada.

A continuació analitzarem els casos existents, centrant-nos en tres exemples que representen els models anunciats: integral (Kulturarw3 de Suècia), selectiu (Pandora d'Austràlia) i híbrid (Netarkivet de Dinamarca). Pel que fa a la resta de projectes, en un annex es fa una descripció sumària de les característiques de cadascun. No s'aporten dades d'Islàndia ni d'Estònia per manca de bibliografia.


2.2.1 Kulturarw3 (http://www.kb.se/kw3/ENG)

El projecte és liderat per la Kung. Royalbiblioteket (Suècia). S'inicia l'any 1996 i segueix el model integral. És exhaustiu pel que fa a la captura del web suec —350.000 webs (febrer de 2005)— i la catalogació dels materials no és una prioritat. L'accés al fons està limitat a les dependències de la Kung. Royalbiblioteket.

El cas suec és paradigma d'anticipació. A partir dels orígens del dipòsit legal, de 1661, la revisió de la legislació que es du a terme el 1993 inclou la informació electrònica publicada en suports tangible (fitxers informàtics i CD-ROM). La biblioteca sueca crea el 1996 el Kulturarw3, l'arxiu web suec. Sis anys més tard, el 2002, es decreta a Suècia que la biblioteca nacional realitza de iure els treballs de preservació i accessibilitat permanent del patrimoni digital suec.

La col·lecció cobreix revistes digitals i publicacions periòdiques no diàries, a excepció, des de fa uns mesos, d'una selecció de més de 100 títols de diaris suecs, documents estàtics (arxius electrònics) i documents dinàmics amb enllaços. Ulteriorment es recopila el contingut de llistes de discussió, i arxius FTP oberts. Per les dades fetes públiques el febrer de 2005, sabem que en aquella data les dimensions de Kulturarw3 eren de 306 milions d'arxius i uns 10.000 Gb: 350.000 llocs web.

Les eines de captura i organització són el programari Combine i, més recentment per als diaris digitals, Heritrix.

Els punts forts del projecte Kulturarw3 són els derivats de l'exhaustivitat en la compilació automàtica i el valor pel fet de plasmar la societat digital sueca.11 S'hi poden trobar des de revistes científiques a weblogs d'ONG. Els punts febles estan relacionats amb importants llacunes en el control d'allò que es captura, en la nul·la profunditat en la infranet (continguts de pagament o amb contrasenya, pàgines òrfenes, etc.) i en la manca de catalogació de l'arxiu. Com s'ha apuntat, el fet que l'arxiu només sigui consultable a les dependències de la biblioteca sueca és una característica negativa del sistema.


2.2.2 Pandora (http://Pandora.nla.gov.au/index.html)

El projecte és liderat per la National Library of Australia (Austràlia). S'inicia l'any 1996 i segueix el model selectiu. El seu abast se centra en la selecció de publicacions en línia i webs sobre Austràlia, d'autor australià o sobre un tema australià. La catalogació és exhaustiva, i les possibilitats de cerca, molt avançades. Disposa d'un programari propi, Pandas, que s'ha implementat en altres projectes.

L'arxiu web d'Austràlia, Pandora, va ser creat el 1996 per la National Library of Australia per garantir l'accés permanent a una selecció de publicacions en línia i de llocs web d'Austràlia i sobre Austràlia.

A falta d'una llei que reguli el dipòsit legal digital (la vigent és de 1968), la política de la biblioteca i els seus socis de projecte, que formen el comitè científic de la política selectiva, és arribar a acords amb les entitats editores dels documents susceptibles de ser capturats. S'ha publicat una guia dels criteris en què es basa la selecció dels llocs web capturats. Les dades estadístiques de setembre de 2005 mostren que l'arxiu conté 27 milions de fitxers i que té un creixement mensual de 30 Gb. És consultable en línia.

Els desavantatges del sistema australià estan relacionats amb la seva pròpia naturalesa:12 el criteri de la selecció és forçosament subjectiu, malgrat la transparència de la política de selecció. El context (els enllaços als quals apunta el recurs), queden deslligats del document, perquè poden no estar inclosos en la selecció. Finalment, el cost de tractament (selecció, captura periòdica, catalogació, etc.) de cada ítem és molt elevat.

Per contra, els beneficis es concentren en la qualitat del tractament i la presentació del patrimoni. L'accessibilitat en línia, en règim obert, és possible pels acords subscrits amb els productors (que comporta l'accés als recursos de la infranet). Les dades de la catalogació són compartibles amb la resta d'equipaments australians (o internacionals). Es procura un creixement temàtic equilibrat de la col·lecció.

Vistos els models integral i selectiu, la tercera via que hem de considerar és la mixta. Com ja s'ha apuntat, bona part dels dipòsits digitals nacionals plantejats inicialment com a integrals han anat adoptant mesures per incloure recursos molt significatius, com ara publicacions periòdiques, en els seus fons.

Tres són els projectes pioners a apostar per una política clara de conjugació de les captures exhaustives, els acords amb institucions i organitzacions, i el detall per a activitats concretes: França, Dinamarca i Nova Zelanda. A continuació s'examina amb detall el projecte de Dinamarca.


2.2.3 Netarkivet (http://netarchive.dk/index-en.php)

El projecte és liderat per Det Kongelige Bibliotek (Dinamarca). S'inicia l'any 1998 i segueix el model híbrid que es basa en la captura exhaustiva, els acords per a la selecció i les activitats especials relacionades amb la realitat danesa. Les tasques de captura integral s'han iniciat el juliol de 2005. Des de 1997, la Llei de dipòsit legal inclou “totes” les publicacions de Dinamarca, i des de 2005 la biblioteca danesa té potestat per capturar tots els tipus de pàgines web daneses. La Kongelige Bibliotek facilita el lliurament del dipòsit legal per mitjà d'un formulari web.

A partir d'un model inicial (domini .dk), el 2004 s'adopta el sistema híbrid, adreçat —com s'ha esmentat— al triple objectiu (integral + selectiu + especials). Hi participen la Kongelige Bibliotek (la biblioteca nacional de Dinamarca) i la State and University Library (ubicada a Uhus). Puntualment (en la selecció de llos web de literatura danesa, per exemple) s'hi incorporen entitats temàticament vinculades.

El 24 de juny13 de 2005 s'anuncia al gran públic la posada en marxa del projecte danès en el seu vessant integral, lligant-ho amb la nova modificació de la Llei de dipòsit legal.

Després de la primera fase de captura integral de juliol de 2005 amb el programari Heritrix, el projecte Netarkivet conté 600.000 dominis .dk, xifra que representa, segons la mateixa institució, el 60 % dels dominis danesos. Paral·lelament, fins a l'any 2004 i per al model selectiu, el dipòsit s'acosta als 500 terabytes de volum, amb un exponent de creixement anual de 30 Tb.

No és accessible en línia.

El projecte danès té punts forts evidents, que són infraestructurals:


2.3 Organitzacions i projectes suprainstitucionals

Els projectes descrits, que duen a terme les biblioteques nacionals, es troben sovint sota “paraigües” més amplis de cooperació entre biblioteques o altres tipus d'institucions.


2.3.1 International Internet Preservation Consortium

L'organització que aplega la major part d'aquestes iniciatives és l'IIPC (International Internet Preservation Consortium, http://netpreserve.org), que té la missió d'adquirir, preservar i fer accessibles el coneixement i la informació sobre Internet per a les futures generacions de tot el món, promovent l'intercanvi global i les relacions internacionals.

Va ser creat formalment el juliol de 2003 pels 12 membres que actualment formen el consorci: Bibliothèque Nationale de France (http://www.bnf.fr) (coordinador), Biblioteca Nazionale Centrale di Firenze (http://www.bncf.firenze.sbn.it), Det Kongelige Bibliotek (http://www.kb.dk), Helsingin yliopiston kirjasto-Suomen Kansalliskirjasto (http://www.lib.helsinki.fi), Internet Archive (http://www.archive.org), Kungliga biblioteket Sveriges nationalbibliotek (http://www.kb.se), Landsbokasafn Islands- Haskolabokasafn (http://www.bok.hi.is), Library and Archives Canada (http://www.collectionscanada.ca), Nasjonalbiblioteket (http://www.nb.no), National Library of Australia (http://www.nla.gov.au), The British Library (http://www.bl.uk) i The Library of Congress (http://www.loc.gov).

Els objectius de l'IIPC són els següents:

Existeixen diversos grups de treball (eines d'accés, gestió de continguts, etc.) creats a l'empara del Consorci, i amb la intenció de publicar informes i facilitar l'accés a programari, qüestions, aquestes, que no han estat públicament completades.

El Consorci, doncs, no captura webs, sinó que agrupa una sèrie d'institucions que ho fan, i té com a objectiu promoure aquestes activitats.


2.3.2 Nordic Web Archive

L'NWA (Nordic Web Archive, http://nwa.nb.no) és un fòrum de les biblioteques nacionals escandinaves (Dinamarca, Finlàndia, Islàndia, Noruega i Suècia) per a la coordinació i l'intercanvi d'experiències en els camps de la captura i l'emmagatzematge de documents web.15

Des de novembre de 2000 s'ha desenvolupat el conjunt d'eines NWA:16 un programari per accedir als document web arxivats, creat emprant PHP, Perl i Java, amb estàndards oberts com ara els protocols HTTP i XML per a la comunicació entre les diferents parts del sistema. L'ús del paquet de programari (cerca i navegació per l'arxiu web) es realitza per mitjà d'un cercador web estàndard, i no es necessari cap plugin específic.

La iniciativa va ser fundada per Nordunet2 (programa de recerca dels escandinaus), Nordinfo (consell escandinau per a la informació científica que inclou les biblioteques de recerca) i les biblioteques nacionals escandinaves.


2.3.3 Internet Archive

L'Internet Archive (http://www.archive.org) és una organització sense ànim de lucre fundada el 1996 per construir una “biblioteca d'Internet” i oferir accés permanent a investigadors, historiadors, personal acadèmic i el públic en general a les col·leccions històriques en format digital. Situat a l'antiga presó de San Francisco (EUA), l'arxiu ha rebut donacions d'IBM, d'Alexa (filial d'Amazon) i d'altres organitzacions que han facilitat el seu creixement.

Rep el suport de diversos organismes, com ara The Library of Congress, els US National Archives i els UK National Archives, entre d'altres.

A l'actualitat, Internet Archive es considera l'arxiu web més gran del món,17 i inclou text, àudio, imatge en moviment i programari, així com pàgines web arxivades de tot el món, amb un nombre representatiu de recursos catalans.18 En accés obert i en línia, el gegant conté en un petabyte un total aproximat de 600 milions de llocs web, des de 1996 fins a l'actualitat, i cada dos mesos es realitza una captura massiva que afecta milions de pàgines web (creixement mensual de 20 Tbytes), seguint el model exhaustiu que Suècia i altres països representen.

El programa Heritrix (http://crawler.archive.org) és el gestor (programari lliure) que utilitza l'Internet Archive, i el sistema d'emmagatzematge es realitza en múltiples còpies, separades geogràficament.

Recentment i amb seu a Amsterdam s'ha creat l'European Digital Archive, branca europea de l'Internet Archive.


3 El futur és generalitzat, híbrid, costós i cooperatiu: conclusions sobre la panoràmica

L'interès per la preservació digital està ja generalitzat als països desenvolupats, encara que amb un grau de desenvolupament heterogeni. Probablement, quan es publiqui el present article existiran més dels vint projectes mencionats, encara que estiguin en fase de disseny.

El futur és híbrid: la diferenciació en models (integral versus selectiu) representa només la primera fase de desenvolupament dels projectes.

Els projectes de dipòsit són econòmicament costosos, i passen forçosament per la implicació del nombre més elevat d'agents possibles que dotin de continuïtat els programes un cop iniciats. En aquest sentit, els fracassos que regularment afecten els projectes estudiats ho són per manca de finançament.

Existeix un corrent global de cooperació (compartir experiències, el relat dels èxits i fracassos, programari en codi obert) entre els projectes. L'exemple més evident és la generalització del programa Heritrix.

Els acords amb els productors i editors web són garantia d'èxit. No sempre una llei moderna de dipòsit legal acompanya els dipòsits digitals nacionals que existeixen, i l'accés a les infranets (i a la Internet invisible) ha de preveure's, amb llei o sense.

A Catalunya, la Biblioteca de Catalunya ha iniciat amb el seu projecte PADICAT (Patrimoni Digital de Catalunya) les actuacions necessàries per fer sempre accessibles les webs catalanes.


Data de recepció: 03/10/2005. Data d'acceptació: 25/10/2005.


Annex. Descripció sumària dels projectes de dipòsits nacionals

AOLA (http://www.ifs.tuwien.ac.at/~aola)[Archive of Czech web resources] (http://webarchiv.nkp.cz/index-e.html)[Archiving the French web] (http://www.bnf.fr)[Archiving the Web Greek]Deposit.ddb.de (http://deposit.ddb.de/online/vdr/titel.htm)E-Collection (http://epe.lac-bac.gc.ca/)e-Depot (http://www.kb.nl/dnp/e-depot/e-depot-en.html)EVA (http://www.lib.helsinki.fi/tietolinja/0203/webarchive.html)IRIS (http://catalogue.bnquebec.ca:4400/cap_fr.html)LIBIS Electronic Resources Subsystem (http://www.libis.lt/en/welcome.html)Minerva (http://www.loc.gov/minerva/)New Zealand's digital Heritage (http://www.natlib.govt.nz/bin/media/pr?item=1085885702)Paradigma (http://www.nb.no/paradigma/eng_index.html)UK Web Archive (http://www.webarchive.org.uk/)WARP (http://warp.ndl.go.jp)

Notes

1 Directrices para la preservación del patrimonio digital (Canberra: Unesco, 2003), <http://unesdoc.unesco.org/images/0013/001300/130071s.pdf>. [Consulta: 03/10/2005].

2 L'UK Web Archiving Consortium fixa en 44 dies la mitjana de vida d'una pàgina web <http://info.webarchive.org.uk/pressrelease21-06-04.html>. [Consulta: 03/10/2005].

3 El 1999 la Facultat de Biblioteconomia i Documentació de la Universitat de Barcelona va tenir una iniciativa en aquesta mateixa línia en organitzar un seminari sobre aquesta qüestió i publicar-ne els treballs: Biblioteques digitals i dipòsits nacionals de recursos digitals (Barcelona: Universitat de Barcelona, Facultat de Biblioteconomia i Documentació, 1999).

4 Dipòsit és la paraula catalana normalitzada que designa el repository anglès.

5 José Antonio Cordón, “El depósito legal y los recursos digitales en línea”. En: Las bibliotecas nacionales del siglo XXI (Valencia: Biblioteca Valenciana, 2005), <http://bv.gva.es/documentos/Ponencias/Cordon.pdf>. [Consulta: 03/10/2005].

6 La traducció de nu és ara. Malgrat que sigui el domini geogràfic de l'illa Nieu, a la Polinèsia, en suec i en altres llengües escandinaves és molt utilitzat per dotar d'un component dinàmic el nom del domini.

7 Eines com ara Maxmind (http://www.maxmind.com) o Ip2location (http://www.ip2location.com) faciliten la ubicació geogràfica dels servidors.

8 InternetLab (http://internetlab.cindoc.csic.es) pertany al CINDOC-CSIC.

9 Archiving web resources (Canberra: National Library of Australia, 2004), <http://www.nla.gov.au/webarchiving/>. [Consulta: 03/10/2005].

10 Un recurs que proporciona informació detallada dels projectes nacionals és PADI: Preserving Access to Digital Information (http://www.nla.gov.au/padi/) de la National Library of Australia. PADI conté informació actualitzada de la pràctica totalitat dels projectes existents, així com informació diversa dels aspectes relacionats amb la preservació web (dipòsit legal, eines, bibliografia, etc.). La National Library of Australia també va organitzar, el novembre de 2004, el congrés Archiving web resources, en el qual són accessibles en règim obert la major part de presentacions realitzades en aquella activitat. Finalment, també cal tenir present l'IWAW (International Web Archiving Workshop, http://www.iwaw.net) que se celebra anualment, organitzat per un grup de professionals procedents dels diversos projectes. En aquest espai web també es pot consultar la documentació relativa als projectes existents. El creixement del nombre de projectes destinats a crear dipòsits nacionals és constant, i pròximament s'hauran de sumar als exposats en aquest article els de les biblioteques nacionals de Luxemburg, Singapur, Egipte, Croàcia i, evidentment, el de la Biblioteca de Catalunya.

11 Joan Mannerheim, “Collect all, catalogue some”. En: Archiving web resources (Canberra: National Library of Australia, 2004), <http://www.nla.gov.au/webarchiving/>. [Consulta: 03/10/2005].

12 Margaret Phillips, “What to collect and how to do it: the National Library of Australia's selective approach”. En: Archiving web resources (Canberra: National Library of Australia, 2004), <http://www.nla.gov.au/webarchiving/>. [Consulta: 03/10/2005].

13 La data té una càrrega simbòlica: la festa de Sant Joan (el solstici d'estiu) és especialment celebrada als països escandinaus.

14 “New legal deposit law”, Netarchive.dk, <http://netarchive.dk/newsite/news/index-en.php>. [Consulta: 03/10/2005].

15 Porsteinn Hallgrímsson, Sverre Bang, “Nordic Web Archive”. En: Archiving web resources (Canberra: National Library of Australia, 2004), <http://www.nla.gov.au/webarchiving/>. [Consulta: 03/10/2005].

16 El paquet de programari es pot descarregar a Sourceforge (http://nwatoolset.sourceforge.net).

17 Michele Kimpton, “Saving the web for future generations”. En: Archiving web resources (Canberra: National Library of Australia, 2004), <http://www.nla.gov.au/webarchiving/>. [Consulta: 03/10/2005].

18 En són exemples (agost de 2005) les pàgines web de la Generalitat de Catalunya (http://www.gencat.net), amb 207 captures des de maig de 2002; el diari Avui (http://www.avui.es), amb 55 captures des de gener de 1998, o la Universitat de Barcelona (http://www.ub.edu i http://www.ub.edu), amb 223 captures des de febrer de 1997, etc.