[Versión castellana]

Lluís M. Anglada i de Ferrer

Director del Consorci de Biblioteques Universitàries de Catalunya (CBUC)

langlada@cbuc.es


Sandra Reoyo Tudó

Gestora de projectes del Consorci de Biblioteques Universitàries de Catalunya (CBUC)

sreoyo@cbuc.es


Joan Cambras

Cap del Departament de Sistemes del Centre de Supercomputació de Catalunya (CESCA)

jcambras@cesca.es


Ricard de la Vega

Tècnic líder de l'Àrea de Dipòsits i Portals del Centre de Supercomputació de Catalunya (CESCA)

rdelavega@cesca.es



Resum [Resumen] [Abstract]

Entre 1998 i 1999, el Consorci de Biblioteques Universitàries de Catalunya (CBUC) va crear una nova línia de treball: la Biblioteca Digital de Catalunya (BDC), que va néixer amb la finalitat de contractar informació electrònica interdisciplinària per a la comunitat universitària i investigadora dels membres del Consorci. Gairebé al mateix temps, aquesta línia de treball es va ampliar amb la informació pròpia generada per aquesta comunitat, i es va començar a treballar amb la definició i la implementació dels dipòsits electrònics cooperatius, que són l'objecte d'aquest estudi. Se n'analitza l'evolució, l'estat actual, l'estratègia per aconseguir la inclusió de documents (polítiques institucionals, comitès científics, etc.), el continent (programes, tecnologia usada, protocols, etc.) i el contingut (estàndards utilitzats, drets d'autor, preservació, etc.). Per acabar, es reflexiona sobre els avantatges, extrets de la mateixa experiència, d'aquests dipòsits electrònics cooperatius.


1 La Biblioteca Digital de Catalunya: de les contractacions als dipòsits electrònics

El Consorci de Biblioteques Universitàries de Catalunya (CBUC) es va crear amb l'objectiu de constituir un catàleg col·lectiu que fos un instrument d'informació bibliogràfica i de catalogació per còpia, però ràpidament va ampliar les activitats, que s'agrupen sota tres línies estratègiques: la primera està destinada a millorar l'accés a les col·leccions impreses, la segona gira al voltant de la informació digital i la tercera està orientada a la innovació.

Entre 1998 i 1999 va néixer la Biblioteca Digital de Catalunya (BDC), que avui inclou tant informació electrònica contractada conjuntament pels membres del CBUC, com els dipòsits electrònics amb informació pròpia. La informació electrònica contractada actualment a editors comercials inclou, aproximadament, 10.600 revistes electròniques, 8.000 llibres electrònics i 37 bases de dades. La importància de les contractacions de recursos electrònics fetes sota el nom de BDC no ens ha de fer oblidar que gairebé alhora es van posar els fonaments del primer dipòsit electrònic cooperatiu dels cinc que mantenen avui les universitats de Catalunya i la Biblioteca de Catalunya a través del CBUC i del Centre de Supercomputació de Catalunya (CESCA).

La construcció d'un dipòsit per a documents electrònics es va començar bastant abans que rebessin el nom de dipòsits institucionals (amb el qual s'han reconegut en la literatura professional posteriorment)1 i que s'usés el terme accés obert (open access) o la sigla anglesa corresponent OA. La situació actual és de cinc dipòsits actius que utilitzen quatre programes diferents. Era aquesta la situació a la qual podíem esperar arribar quan vam començar amb el primer dipòsit fa set anys?

El primer dipòsit va sorgir d'una oportunitat. El Govern de Catalunya va elaborar un pla estratègic per a la societat de la informació en el marc del qual es van poder formular propostes innovadores per afavorir l'ús d'Internet a les universitats. Aquestes propostes van ser: una iniciativa d'administració electrònica, un sistema de compra de llibres de les edicions universitàries a través de la xarxa, la creació de material docent digital i el dipòsit electrònic de tesis doctorals de text complet que van fer el CBUC i el CESCA.

Per implementar aquest dipòsit es va prendre l'opció estratègica de no fer-ho creant programari propi per a la gestió, sinó usant-ne un de ja existent. Hi va influir l'experiència de les biblioteques de les universitats de Catalunya dels anys vuitanta de crear i usar programari de gestió de biblioteques.2 Els deu anys d'experiència en l'elaboració de programari van mostrar que s'inverteixen molts recursos (entre els quals el temps no és el menys important) en el desenvolupament de programes i que els resultats no sempre s'ajusten a la inversió. Un informe encarregat pel CBUC sobre la situació internacional de la digitalització de tesis doctorals ens va permetre de conèixer l'existència de la Networked Digital Library of Theses and Dissertations (NDLTD),3 que proporcionava aleshores un programa de codi lliure: l'ETD. Va caldre adaptar el programa a l'objectiu propi de fer un dipòsit cooperatiu, però es van obtenir aprenentatges positius del fet d'utilitzar eines construïdes per d'altres per a propòsits similars als nostres.

L'aprenentatge bàsic d'aquella experiència inicial —el TDX— va ser que la dificultat principal en la construcció d'un dipòsit no era la posada a punt del programa informàtic, sinó l'establiment d'un marc legal que permetés d'iniciar el projecte i, sobretot, convèncer la comunitat universitària que oferir documents (en aquest cas, les tesis) en accés obert no només és fàcil, sinó que té, a més, molts avantatges. Més endavant, en aquest article, detallarem els mecanismes creats per al dipòsit de les tesis i per als altres per facilitar la introducció dels documents i per disminuir les resistències d'editar electrònicament i en obert.

Quan es va posar en funcionament el dipòsit de tesis es va analitzar també la possibilitat de crear-ne un altre per a revistes. Per qüestions d'oportunitat, la idea va quedar ajornada. No obstant això, des de 1998 el CBUC tenia una base de dades de sumaris electrònics que, amb modificacions lleus, va permetre d'afegir als sumaris de les revistes el text complet dels articles. Així va ser com el 2001 vam poder publicar a Internet la primera revista de textcomplet. El projecte va rebre més tard el nom de RACO (Revistes Catalanes amb Accés Obert) però, tot i l'encert de l'objectiu i dels esforços que s'hi van dedicar, va quedar clar que usar un programa no adequat limitava el projecte fins al punt de fer-lo inviable.

Entre 2001 i 2003 el CBUC va dur a terme un seguiment de la literatura professional pel que fa a programes d'automatització de biblioteques, ja que es feia necessària la substitució del que aleshores estava en ús (VTLS). Això va permetre d'observar que hi havia noves realitats emergents en els serveis bibliotecaris, els dipòsits institucionals o IR (de l'anglès, institutional repositories) i que estava sorgint programari nou (la majoria de codi lliure) per a la gestió de la biblioteca digital o, més específicament, per a la gestió d'objectes digitals. En aquest període es va començar a gestar un canvi del que havia estat un paradigma sòlid durant els últims vint anys: els sistemes automatitzats de gestió de les biblioteques que havien trobat l'èxit en la integració de funcions van començar, gràcies als estàndards d'interoperabilitat a concebre's "desintegrats". Això feia que el panorama fos diferent i que es considerés convenient crear un sistema de gestió d'objectes digitals (encara no l'anomenàvem dipòsit) al marge del sistema integrat de gestió bibliotecària.

Des de 1999 s'havia estat treballant també, tot i que en l'àmbit teòric, amb els esquemes aleshores emergents de metadades i concretament amb l'aplicació del Dublin Core a la catalogació de recursos bibliotecaris. Aviat es va arribar a la conclusió que sense un dipòsit en funcionament real mai no s'arribaria a concretar un conjunt de metadades que facilités la descoberta i la usabilitat dels documents digitals. Entre el final de 2003 i el principi de 2004, es va proposar de crear un dipòsit d'objectes digitals no amb la finalitat que fos un servei en si mateix, sinó com un suport a les activitats "digitals" de la biblioteca universitària (el mateix OPAC, els sistemes d'aprenentatge electrònic o l'edició digital) i com una manera de millorar la preservació dels documents digitals aleshores ja freqüents a les universitats. Es va acordar de seleccionar conjuntament un mateix programa amb els objectius d'experimentar amb els processos de captació i catalogació d'objectes digitals tenint en compte que l'objectiu de les biblioteques és facilitar la consulta (actual i futura) dels objectes digitals.

Es pretenia aleshores d'usar aquest dipòsit de manera immediata per a revistes electròniques o per a versions digitals de revistes elaborades originalment en paper i per ampliar més endavant el domini del dipòsit als working papers, els materials docents, els fitxers d'àudio i de vídeo, etc. No es tenia clar si el dipòsit seria únic o no, però es creia fermament que un únic programa informàtic permetria de gestionar la varietat d'objectes digitals esmentats.

Es va crear un grup de treball del Consorci amb la finalitat de seleccionar el programari. La tasca es va veure facilitada per una guia de la Soros Foundation,4 de manera que aquest grup va concloure la tasca en poc temps i va seleccionar com a programa més adequat per a les nostres necessitats i objectius el DSpace. El 2004 van començar els treballs d'adaptació del DSpace a les necessitats pròpies i a posar-lo en funcionament, però aviat es va veure que el programa s'adaptava perfectament als articles, els working papers, els informes de recerca, etc., però no tant a les revistes5 o a altres objectes digitals. El dipòsit es va concretar en un fons de literatura gris d'investigació (excepte tesis) amb el qual les biblioteques de les universitats de Catalunya van començar a determinar les polítiques i els processos de treball comuns en el marc del DSpace (per exemple, definir comunitats, subcomunitats i col·leccions), a prendre decisions quant a les metadades, i a experimentar amb els circuits i els procediments per fer l'edició electrònica en el marc dels dipòsits.

Els treballs van continuar i, durant el curs acadèmic 2004-2005, es va escollir el programa OJS per al desenvolupament del dipòsit de revistes en accés obert i, una mica més tard, el programa comercial CONTENTdm d'OCLC per a la gestió del dipòsit Memòria Digital de Catalunya (per a imatges i reproduccions d'objectes). Més recentment, el 2007, es va decidir d'iniciar un dipòsit per a material docent (l'MDX) i utilitzar també el DSpace.

Després del que hem explicat podria semblar que no hi ha estratègia en la creació de dipòsits, però no és així. El dipòsit de tesis ja havia permès de fixar dos aprenentatges: a) preferir els programes ja desenvolupats (tot i haver d'adaptar-los) a les aplicacions perfectes però encara no existents, i b) assumir que les dificultats més grans eren convèncer la comunitat universitària que "publicar" en electrònic i en obert era positiu i que, a més, no era difícil. El procés (fallit) de recerca d'un programa ideal per a propòsits múltiples ens va convèncer que les característiques d'alguns tipus de documents requeririen encara durant algun temps la utilització de programes diferents. Es va fixar aleshores una política de no qüestionar (almenys de moment) els contenidors ja seleccionats per centrar-se a omplir-los de contingut.

Actualment, en el marc del CBUC es té la visió que alguns desenvolupaments notables en l'àmbit dels dipòsits encara han de venir i que l'impacte de les cerques federades pot ser determinant per decidir fins a quin punt és millor l'ús d'un únic programa de propòsit general per a tot tipus d'objectes o el de programes específics per a cada tipus de document.


2 Els dipòsits electrònics cooperatius

Actualment, la BDC inclou cinc dipòsits electrònics cooperatius: el TDX (tesis), el RACO (revistes), el RECERCAT (documents de recerca), l'MDC (imatges) i l'MDX (material docent), que entrarà en funcionament aquest any. Els objectius comuns d'aquests dipòsits són:

  1. Facilitar la introducció de documents a la xarxa contribuint així al moviment mundial de l'accés obert.
  2. Proporcionar un instrument de visualització i de cerca conjunta de documents que en fomenti l'ús.
  3. Crear serveis de valor afegit (com ara els mecanismes de preservació, les estadístiques, els URL permanents, etc.).

Els dipòsits de la BDC tenen diverses característiques comunes: són d'accés obert, compleixen el protocol d'interoperabilitat de l'Open Archives Initiative, usen metadades Dublin Core, estan construïts i alimentats de manera cooperativa, i quatre dels cinc dipòsits estan desenvolupats amb programari lliure. Aquests dipòsits estan instal·lats en un clúster Linux d'alta disponibilitat amb les característiques de balanceig de càrrega de les consultes que reben, i de tolerància a la fallida en cas de desastre en algun dels nodes que componen la plataforma. A continuació s'especifiquen els programes escollits per a cada dipòsit, les modificacions principals que s'hi han dut a terme i la interoperabilitat d'aquests dipòsits nacionals i internacionals amb d'altres a través del protocol OAI-PMH.


2.1 Programari

Són molts els avantatges que aquest tipus de programari ha aportat als dipòsits però, sens dubte, el principal ha estat l'adaptabilitat, ja que ha permès de dur a terme millores que han apropat els programes als requisits establerts per a cadascun. A banda de l'adaptabilitat i dels costos, els dipòsits també s'han beneficiat d'altres avantatges del programari lliure, com ara l'escrutini públic, ja que el codi està sotmès a un procés de revisió que aporta dinamisme a la correcció d'errors, o la independència del proveïdor, fet que garanteix la continuïtat teòrica del programa. Les comunitats internacionals que donen suport als programes en què es basen els dipòsits (comunitats DSpace, OJS, ETD-main, etc.) són importants (per la quantitat d'institucions que hi estan implicades, pel volum d'usuaris, etc.), la qual cosa ja és en si mateixa una garantia de continuïtat.

En primer lloc, en el TDX, pel que fa a programari, es poden diferenciar tres capes: la de la gestió de continguts de la col·lecció de tesis, la de la indexació i la publicació de les dades, i la de la recol·lecció de tesis d'altres dipòsits espanyols que usen el protocol OAI-PMH. Per a la primera, s'ha adaptat l'Electronic Theses and Dissertations (ETD)6 de la Virginia Tech University (VT) com un projecte de col·laboració entre la Graduate School de la VT, la Digital Library and Archives (DLA) i la Networked Digital Library of Theses and Dissertations (NDLTD), de la qual el TDX forma part; per a la segona capa, s'usen el Glimse i el WebGlimse, i, per a la tercera, el mòdul MetaIndex i les llibreries X-Server del programa MetaLib, d'ExLibris.

En segon lloc, el RECERCAT està implementat a partir del programa de codi obert DSpace7 (actualment, en la versió 1.4). Aquest programa el va crear el Massachusetts Institute of Technology (MIT) i Hewlett Packard (HP). El DSpace és un dipòsit digital innovador que captura, emmagatzema, indexa, preserva i redistribueix els resultats de la investigació d'una organització. S'han dut a terme diferents adaptacions per a la cerca amb diacrítics, la classificació per matèries dels documents segons la classificació decimal universal (CDU), el control d'autoritats i les cerques per tipus de document. També s'ha implementat un mòdul d'estadístiques personalitzat, ja que els diferents connectorsque s'ofereixen per al DSpace no complien els requisits que es desitjaven per al projecte. L'MDX, que es posarà en funcionament aquest any 2008, també s'ha implementat amb el DSpace. S'utilitza l'última versió estable (1.4.2) i s'hi ha afegit les llibreries Manakin, que permeten una major personalització de les comunitats i les col·leccions. Segons els resultats obtinguts es preveu d'usar també el Manakin al RECERCAT.

En tercer lloc, el RACO es basa en el programa de codi obert Open Journal Systems (OJS)8, desenvolupat pel Public Knowledge Project (PKP) amb l'objectiu de promoure l'accés a la investigació, i facilitar l'administració i la publicació de revistes científiques. S'han desenvolupat dos mòduls nous: un per implementar una classificació temàtica de revistes i un altre per simplificar el procés de publicació.

La condició de programari lliure ens ha permès també d'adaptar cada dipòsit als diferents idiomes i després contribuir amb aquestes traduccions a la comunitat internacional. Tots els dipòsits són accessibles en català, castellà i anglès i, a més, el TDX també en gallec. Finalment pel que fa a costos, cal remarcar que l'adquisició del programari lliure és inexistent, però no així el cost del desenvolupament i la implementació. Per adaptar els programes seleccionats a les necessitats establertes de cada dipòsit és necessari invertir-hi temps i recursos tant materials com de personal.

Anteriorment hem comentat que s'han utilitzat quatre programes diferents per als cinc dipòsits actius actualment. Tres són programari lliure, que són els que s'han comentat fins ara, i el quart és un programa comercial: el CONTENTdm9 d'OCLC per al dipòsit d'imatges en l'MDC. Aquest programa s'ha contractat amb una llicència per a objectes il·limitats.


2.2 Open Archives Initiative

Els dipòsits utilitzen un protocol d'interoperabilitat creat per l'Open Archives Initiative (OAI)10 que augmenta la visibilitat de la informació electrònica i comparteix les metadates del dipòsit amb altres dipòsits internacionals, com ara l'OAIster11. El protocol de l'OAI per a la recol·lecció de metadades (OAI-PMH) és un mecanisme de baix nivell per a la interoperabilitat entre els dipòsits. Hi ha dos actors possibles: per una banda, els proveïdors de dades (els data providers), que són dipòsits que exposen metadades estructurades via el protocol OAI-PMH, i, per l'altra, els proveïdors de servei (els service providers), que efectuen peticions OAI-PMH als proveïdors de dades per recol·lectar metadades.

El TDX és el dipòsit que fa més temps que és proveïdor de dades d'aquest protocol (des de 2003). En part, això pot explicar el gran augment de consultes que rep: es va passar de 278.708 consultes anuals el 2003 a 1.184.750 el 2004, 2.211.960 el 2005 i més de 3 milions i mig durant el 2006 i 2007.

Els quatre dipòsits de la BDC que estan en funcionament actualment són proveïdors de dades del protocol, cosa que fa que s'obtingui una visibilitat dels continguts més gran. A més, dos també són proveïdors de serveis: el RECERCAT i el TDX. El setembre de 2006 es va adaptar el DSpace amb un connector que permet que el RECERCAT sigui també recol·lector de metadades. D'aquesta manera, el dipòsit es va convertir en híbrid en permetre que alguna de les institucions participés aportant-hi una recol·lecció de metadades del dipòsit institucional.

Després de potenciar la visibilitat de les tesis doctorals que conté el TDX els últims anys, des de final de 2006 s'ha treballat per incrementar el valor del dipòsit. Actualment, es poden consultar des del TDX no només les tesis de les universitats que hi participen, sinó també totes les tesis d'altres dipòsits espanyols accessibles amb el protocol OAI-PMH. Actualment es recol·lecten: les de Dialnet, les de la Universidad Carlos III, les de la Complutense de Madrid i les d'Alacant. En total, un fons de gairebé 10.000 tesis doctorals de text complet. Aquesta cerca rep el nom, en la interfície del TDX, de cerca global.12 Per engegar aquesta nova funcionalitat, s'ha utilitzat el mòdul MetaIndex i les llibreries X-Server del programa MetaLib d'ExLibris, que permet d'importar les metadades dels diferents dipòsits que operen amb el protocol OAI-PMH. D'aquesta manera, les tesis continuen estant emmagatzemades en el dipòsit original, però el TDX permet de consultar-les a través de metadades. Amb aquesta nova funcionalitat, el TDX s'ha convertit en el primer dipòsit de l'Estat que, a més de donar accés a les tesis pròpies, permet també de buscar entre les tesis doctorals d'altres dipòsits de l'Estat que ofereixen metadades OAI-PMH.


2.3 Contingut

La Comissió Tècnica del CBUC, formada pels directors de les biblioteques de les institucions membres del Consorci, va establir al final de 2005, com a objectiu principal per als dipòsits i per al període de 2006-2008, recaptar el màxim nombre de documents i introduir-los en els dipòsits cooperatius. Des del Consorci s'ha treballat per facilitar aquesta tasca (coordinació, recomanacions, edició de materials de difusió, etc.), però la feina principal la porten a terme les institucions que participen en cada dipòsit.

Si fem una mirada retrospectiva al passat, veurem que la posada en marxa del primer dipòsit (el TDX) no va ser ràpida pel que fa a contingut: es va trigar més de 16 mesos a arribar a les primeres 500 tesis, mentre que actualment cada any se n'incorporen unes 1.000. La proporció de tesis introduïdes ha millorat any rere any, no només a causa dels nous participants, sinó també perquè les universitats aconse­gueixen reunir i incorporar més tesis al TDX, alguna gràcies al fet que ho ha convertit en un requisit per poder obtenir el títol de doctor. En aquest moment, de mitjana, una de cada dues tesis llegides en les universitats catalanes s'introdueix en el dipòsit.

En aquest apartat comentarem els aspectes principals implicats abans, durant i després la introducció dels documents en els dipòsits de la BDC. Cal destacar que sempre que és possible els dipòsits utilitzen procediments comuns. A continuació presentem un breu estat dels dipòsits pel que fa tant a materials que inclouen (tipus i quantitat), com a institucions que hi participen actualment.

Tesis Doctorals en Xarxa13


Conté el text complet de les tesis doctorals llegides en les universitats de Catalunya i altres comunitats autònomes espanyoles. Hi participen actualment 20 universitats amb un total de més de 5.300 tesis, i ha rebut més de 3,5 milions de consultes el 2007.


Dipòsit de la Recerca de Catalunya14


Conté literatura d'investigació de text complet d'universitats i d'institucions de recerca de Catalunya. Hi participen actualment 17 institucions amb un total de més de 4.300 documents, i ha rebut gairebé 400.000 consultes el 2007.


Revistes Catalanes amb Accés Obert15


Conté articles de text complet de revistes científiques, culturals i erudites catalanes. Hi participen actualment 39 institucions amb 177 revistes i 38.000 articles.


Memòria Digital de Catalunya16


Aquest és l'últim dipòsit que s'ha posat en marxa (novembre de 2006) i, per aquest motiu, actualment és el menys consolidat, tot i que està tenint una molt bona acceptació. És un dipòsit d'imatges (fotografies, cartells, manuscrits, etc.) que té com a finalitat principal difondre i preservar les col·leccions especials de les biblioteques de Catalunya. Hi participen actualment 7 institucions, amb aproximadament uns 100.000 documents.


Material Docent en Xarxa


És un dipòsit per a materials docents. S'ha començat a definir el 2007 i es posarà en funcionament enguany. La creació s'ha fet a partir de la feina d'un grup de treball que n'ha definit les característiques i els processos de treball.

Està previst que durant aquest any en curs s'incloguin aquests cinc dipòsits cooperatius en el MetaBUscador17 (usa el programa comercial MetaLib d'ExLibris) de la BDC i també en els metacercadors locals. D'aquesta manera serà possible consultar conjuntament tots els recursos (tant informació contractada com informació pròpia) de la Biblioteca Digital de Catalunya amb una única cerca.


2.4 Aspectes legals

Un dels obstacles principals per introduir documents als dipòsits d'accés obert és la por al plagi dels autors. Des que vam posar en marxa el primer dipòsit, el TDX, hem treballat aquest aspecte des de diferents vessants: oferint assessorament legal, establint processos en cas de detecció de plagi, recopilant i publicant al web les respostes a les preguntes més freqüents,18 etc. Per a cadascun dels dipòsits de la BDC s'ha encarregat un dictamen jurídic que té com a objectiu estudiar la situació dels drets d'autor i oferir les eines que permetin a les institucions que hi participen de sol·licitar el permís dels autors per publicar els treballs a través dels dipòsits. Quan una institució s'integra en un dipòsit firma un conveni de col·laboració amb les institucions coordinadores (CBUC i CESCA) i se li facilita la documentació jurídica.

En el cas del TDX, per a cadascuna de les tesis s'ha de firmar un contracte d'edició entre la universitat on s'ha llegit i l'autor, a través del qual s'autoritza la universitat a publicar la tesi en l'entorn d'Internet i es reserva el dret de publicar-la en altres suports i/o editorials. Hi ha un model bàsic de contracte que cada universitat ha personalitzat.

En el RECERCAT, tots els documents inclosos estan subjectes a la llicència Creative Commons(CC) de Reconeixement - No comercial - Sense obres derivades (actualment, en la versió 2.5). Aquesta llicència esta­bleix que el treball es pot copiar, distribuir i comunicar públicament, sempre que els autors i les institucions se citin i que no es faci cap ús amb finalitats comercials ni obra derivada. Per obra derivada s'entén el document que s'ha editat, traduït, combinat amb materials de terceres persones, canviat de format o modificat de qualsevol altra manera. Si no és el mateix autor qui introdueix el document (self-archiving) i, per tant, qui accepta les condicions d'aquesta llicència CC, se li ha de sol·licitar el consentiment escrit per introduir-lo en el dipòsit amb aquestes condicions. Els programes informàtics de codi lliure estan subjectes a la llicència pública general de GNU Creative Commons.

Per al RACO, el procediment és semblant: quan s'incorpora una institució nova se li facilita la documentació jurídica amb els diferents models de documents per sol·licitar permís als autors dels articles. Així mateix s'ofereix un model de clàusules per incorporar en els contractes d'edició o en les condicions de publicació de les revistes.

Per als dos últims dipòsits establerts, l'MDC i l'MDX, els aspectes legals estan en fase d'estudi i de definició.

Des que vam començar a treballar amb els dipòsits, i fins ara, s'han detectat només dos casos d'usos indeguts de tesis incloses al TDX. Quan es van conèixer aquests usos, un especialista va estudiar el problema i es va establir el procediment per actuar. Es van resoldre ràpidament i sense complicacions.


2.5 Introducció dels documents

Actualment la majoria de les universitats que formen part del Consorci i que participen en els dipòsits cooperatius també disposen de dipòsits locals o estan en vies d'implementar-los. La introducció dels documents es duu a terme en els dos dipòsits, ja que cadascun té la seva finalitat principal i, a més, és una altra manera de contribuir a preservar-los (a l'estil del programa LOCKSS: lots of copies keep stuff safe).

Els dipòsits cooperatius, en tant que col·lectius, proporcionen més visibilitat i difusió dels documents (més massa crítica, més usuaris, etc.), i els dipòsits locals contribueixen a incrementar i consolidar la visibilitat institucional. Com ja s'ha comentat en l'apartat específic de programari, per facilitar la participació en ambdós dipòsits s'han modificat els programes que gestionen els dipòsits col·lectius perquè permetin tant la introducció directa de metadades i dades (els fitxers amb el text complet), com la introducció indirecta de metadades.

La introducció directa de metadades i dades, que és la manera majoritària, la fan les mateixes institucions participants en els dipòsits cooperatius, les quals decideixen com. Normalment, el servei de biblioteques hi té sempre un paper actiu, però no n'ha de ser el responsable. Per exemple, en el cas del TDX, cada universitat funciona de manera diferent: coordina el procés el servei de publicacions, el de gestió de tercer cicle o bé la biblioteca. En el cas del RECERCAT, normalment, la introducció es fa des de la biblioteca o bé des dels mateixos departaments, però el servei de biblioteques acaba de validar el document. La introducció indirecta consisteix a incorporar les metadades i dades en els dipòsits locals i recopilar les metadades a través del protocol OAI-PMH per facilitar-ne la consulta a través del dipòsit col·lectiu. La consulta de les dades (text complet) es fa finalment en el dipòsit local.

Els documents que s'introdueixen en els dipòsits, tant en els col·lectius com en els locals, es descriuen amb metadades Dublin Core qualificades i s'ofereixen especificacions de com donar la informació dels diferents elements. Per exemple, els punts d'accés dels autors, de les matèries, etc., s'estableixen prenent com a referència el Catàleg Col·lectiu de les Universitats de Catalunya.19 Anualment es porten a terme diferents actuacions de qualitat, com ara la revisió dels índexs d'autors per evitar les duplicitats, tesis que no tenen resum, etc.

Amb l'objectiu d'experimentar amb la digitalització retrospectiva i incrementar els documents introduïts en aquests dipòsits, l'any 2005 es va dur a terme una prova pilot de digitalització que gràcies al bon resultat ens ha permès de continuar treballant-hi. La feina s'externalitza a empreses que treballen amb els estàndards20 i els criteris consorciats, les quals una vegada feta la digitalització introdueixen el fitxer de consulta (PDF) directament en els dipòsits.

Per al RACO, els anys 2005, 2006 i 2007 s'han digitalitzat un total de 52 revistes que representen més de 200.000 pàgines i, per al TDX, s'ha començat a fer per primera vegada el 2007 i s'han digitalitzat 400 tesis que representen més de 150.000 pàgines. Aquest any 2008 també s'han creat dues noves convocatòries per facilitar la digitalització de documents que s'han d'incloure en aquests dos dipòsits. Aquests programes de retrodigitalització han estat possibles gràcies a ajuts de la Generalitat de Catalunya.21

Un dels objectius dels dipòsits institucionals és garantir l'accés permanent als documents, és a dir, preservar-los a través del temps independentment del format, la mida, etc. Actualment es porten a terme accions bàsiques de preservació, com ara fer còpies de seguretat, comprovar la integritat dels documents (checksums), URL permanents, etc. Per ampliar aquestes accions, i millorar i assegurar aquest aspecte, el CBUC va encarregar un estudi22 en què es detecten les accions principals que cal dur a terme. Les conclusions principals d'aquest informe fan referència tant a aspectes tecnològics com organitzatius.


3 Reflexions finals

Aquests últims anys hem vist com les primeres temptatives, tímides i dubitatives, d'establir "magatzems" de documents electrònics (per exemple, de tesis) han evolucionat de manera conceptual i pragmàtica fins a establir-se com a realitats consolidades en el panorama bibliotecari mundial sota el nom de dipòsits institucionals.23 Simultàniament, i a partir del concepte de l'autoarxivament dels articles de revistes científiques i de ponències en congressos, s'ha consolidat el moviment de l'accés obert a la informació científica. Una de les declaracions principals (tot i que no l'única) a favor de l'accés obert, la de Berlín, ha trobat a Espanya el suport de quinze universitats.

El dipòsit de documents de física i matemàtiques arXiv.org24 s'ha citat sovint com una mostra del que es podria aconseguir en la resta de disciplines del saber humà, però l'arXiv.org ha mostrat també que l'existència d'un dipòsit disciplinari potent no ha invalidat l'existència de revistes que continuen afegint valor a les publicacions preliminars (preprints) emmagatzemades de manera conjunta i digital. Les dues vies que ha trobat l'accés obert per expressar-se han estat els dipòsits i les revistes25 i, probablement, les dues, més que vies alternatives (com alguns debats semblen donar a suposar), es mostraran com a complementàries. Ni les revistes d'accés obert ni els dipòsits semblen tenir el camí totalment lliure per al desenvolupament futur. Si ens centrem en aquests últims, creiem que la comunitat internacional té tres tasques importants pendents: incrementar l'autoarxivament en els dipòsits, integrar-los en els instruments bibliogràfics ja existents, i trobar un equilibri entre el caràcter institucional dels dipòsits i la voluntat científica.

Dèiem a l'inici d'aquest article que, en el nostre cas, el que semblava un obstacle difícil de superar (la tecnologia associada a l'establiment d'un dipòsit) havia estat la part fàcil de la tasca, mentre que la difícil havia estat la d'establir els mecanismes i les inèrcies d'alimentació dels dipòsits. Diversos articles recents26, 27, 28, 29 mostren com la dificultat que estan experimentant les biblioteques universitàries de tot el món és la d'establir un entorn que ajudi a la captació de continguts per als dipòsits institucionals. La solució més òbvia seria que les universitats fessin obligatori l'autoarxivament dels documents d'investigació en els dipòsits institucionals, però tot i el gran nombre d'adhesions a declaracions com la de Berlín, la veritat és que les polítiques d'obligació són una excepció. És també cert que la tasca d'institucions rellevants en el finançament de la investigació s'està posicionant clarament a favor de l'OA i recomanen encaridament introduir en dipòsits d'accés obert la investigació produïda amb fons públics.30 El moviment sembla que està adquirint certa força a Europa els darrers mesos.31

Durant dècades, els investigadors s'han acostumat a "descobrir" els documents que els podien ajudar en la feina en dos instruments: en les bibliografies o les bases de dades de resums i índexs, i en els catàlegs de les biblioteques. Però les possibilitats de descobrir materials rellevants per a una investigació s'han incrementat enormement els últims anys: els cercadors a Internet (siguin Google o Scopus), els "paquets" de revistes contractats conjuntament de manera consorciada, les cerques federades a múltiples instruments, etc. En aquest nou context, on se situen els dipòsits institucionals? Hem d'incorporar les metadades dels documents dels dipòsits en els catàlegs actuals o fer cerques federades entre aquests i els dipòsits? La diferència de granularitat no conduirà en aquest cas a la desorientació de l'usuari?32

Finalment, amb els dipòsits hem pogut constatar la contradicció que es produeix entre els desitjos legítims d'una universitat o institució d'investigació de fer aparèixer els resultats de la investigació produïda en el seu si sota la seva "marca", i les necessitats igualment legítimes de la comunitat investigadora de prescindir de les cerques múltiples i de les fronteres institucionals per accedir a la globalitat de la producció d'investigació classificada en qualsevol cas només per criteris de qualitat. Per ser eficaços, els dipòsits nascuts com a dipòsits locals cerquen ser consultats conjuntament, com indiquen les iniciatives italiana (PLEIADI),33 holandesa (DAREnet),34 australiana (ARROW)35 o el projecte europeu DART-Europe36, que té com a objectiu recollir les metadades de tesis doctorals europees.

En el context internacional i vistos aquests últims anys amb certa distància, l'element diferencial de la iniciativa de les biblioteques del Consorci respecte als dipòsits ha estat l'elecció conscient de fer el camí de manera conjunta i cooperativa (en la selecció de programari, en l'establiment d'un servidor, en la fixació del conjunt de metadades i dels processos de captació, etc.). Quins avantatges ens ha comportat fer conjuntament el que majoritàriament ha fet individualment? Al nostre entendre els beneficis específics han estat els d'haver aconseguit més resultats amb més facilitat, més visibilitat i més valor afegit.

El primer benefici per al sistema universitari català del treball col·lectiu en dipòsits ha estat la facilitat d'aconseguir resultats o, dit d'una altra manera, la maximització de resultats per l'esforç invertit. El treball conjunt és més lent que l'individual a l'hora de produir resultats, però és més efectiu. Els acords presos per més d'una universitat s'apliquen amb més facilitat que els específics, i l'adopció de procediments comuns permet a cada institució de concentrar-se en la captació de continguts sense haver de distreure's en el desenvolupament del dipòsit.

En segon lloc, els dipòsits cooperatius proporcionen més visibilitat als documents que recullen. Això és igualment cert tant per a les cerques "humanes" (qui escollirà repetir la mateixa cerca en diferents llocs si se'n pot fer una de sola en un mateix lloc?), com per a les dutes a terme a través de motors de cerca. Aquesta visibilitat més gran repercuteix en benefici dels autors, de les institucions específiques en el marc de les quals duen a terme específicament la investigació i, finalment, del sistema universitari de conjunt.

Per acabar, el tercer gran benefici és que conjuntament es poden aconseguir millors resultats de valor afegit. En alguns casos es deriva senzillament de la sinergia del treball conjunt. Per exemple, algunes solucions a problemes de desenvolupament de distintes aplicacions (per exemple, el de la indexació de paraules amb signes gràfics) s'han trobat "a escala local" i més tard s'han depurat per incorporar-se als dipòsits i per a totes les institucions. En altres casos, és per economia d'escala. Per exemple, la preservació a llarg termini dels documents digitals dels dipòsits és una feina que té encara en l'àmbit internacional nombrosos interrogants, però sembla clar que no s'aconseguirà només amb la inclusió d'un document en un dipòsit. Seran necessàries operacions tedioses, emmagatzematges redundants i operacions sofisticades. Sens dubte, totes poden fer-se a escala local, però amb menys probabilitat d'èxit que si es fan a escala massiva.




Notes

1 Crow, Raym. "The case for institutional repositories: a SPARC position paper. Release 1.0". Washington: Scholarly Publishing & Academic Resources Coalition, 2002. <http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf>. [Accessed: 26/02/08].

2 Anglada i de Ferrer, Lluís M. "Vint-i-cinc anys d'automatització de biblioteques a Catalunya". BiD: textos universitaris de biblioteconomia i documentació, núm. 16 (juny 2006). <http://www.raco.cat/index.php/BiD/article/view/40499/41021>. [Consulta: 13/02/08].

3 Dijkstra, J. M. M. "Towards storage and access of electronic theses: a proposal of its organisation for the Consortium of Catalan Libraries". Barcelona, 1999. [Not published manuscript].

4 Crow, Raym. A guide to institutional repository software. 3rd. ed. New York: Open Society Institute, August 2004. <http://www.soros.org/openaccess/software>. [Accessed: 26/02/08].

5 No obstant això, hi ha diverses experiències de revistes electròniques implementades en el DSpace, per exemple el dipòsit de revistes i congressos de la Universitat Politècnica de Catalunya <https://upcommons.upc.edu/revistes>, universitat membre del CBUC.

6 http://etd.vt.edu. [Consulta: 26/02/08].

7 http://www.dspace.org. [Consulta: 26/02/08].

8 http://pkp.sfu.ca/?q=ojs. [Consulta: 26/02/08].

9 http://www.contentdm.com. [Consulta: 26/02/08].

10 http://www.openarchives.org. [Consulta: 26/02/08].

11 http://www.oaister.org. [Consulta: 26/02/08].

12 http://global.tesisenred.net. [Consulta: 28/02/08].

13 http://www.tesisenxarxa.net. [Consulta: 26/02/08].

14 http://www.recercat.net. [Consulta: 26/02/08].

15 http://www.raco.cat. [Consulta: 26/02/08].

16 http://www.cbuc.cat/mdc. [Consulta: 26/02/08].

17 http://www.cbuc.cat/metalib. [Consulta: 28/02/08].

18 Per exemple, les del TDX: http://www.tesisenxarxa.net/pmf.html. [Consulta: 05/09/07].

19 http://www.cbuc.cat/ccuc. [Consulta: 28/02/08].

20 "Estàndards de digitalització. Elements mínims. Proposta del CBUC (actualitzat el juliol de 2005)". http://docs.cbuc.cat/fitxers/5digital/Public0507Minims.pdf. [Consulta: 28/02/08].

21 De la Secretaria de Telecomunicacions i de la Societat de la Informació fins al 2007 i de la Direcció General de Cooperació Cultural del Departament de Cultura i Mitjans de Comunicació per al 2008.

22 Gallart Marsillas, Núria; Keefer, Alice. "Preservació de dipòsits digitals". Barcelona: Consorci de Biblioteques Universitàries de Catalunya, 2007. <http://hdl.handle.net/2072/4078>. [Consulta: 28/02/2008].

23 Vegeu la situació a escala mundial en els articles de Clifford A. Lynch; Joan K. Lippincott. "Institutional repository deployment in the United States as of early 2005". D-lib magazine, vol. 11, no. 9 (2005). <http://www.dlib.org/dlib/september05/lynch/09lynch.html>. [Accessed: 04/09/07], i de Gerard van Westrienen; Clifford A. Lynch. "Academic institutional repositories: deployment status in 13 nations as of mid 2005". D-lib magazine, vol. 11, no. 9 (2005). <http://www.dlib.org/dlib/september05/westrienen/09westrienen.html>. [Accessed: 04/09/07].

24 http://arxiv.org. [Consulta: 28/02/08].

25 Guédon, Jean-Claude. "The "Green" and "Gold" Roads to Open Access: the case for mixing and matching". Serials Review, vol. 30, no. 4, (2004), p. 315-328. Disponible la versió en català a: http://hdl.handle.net/2072/3726.

26 Davis, Philip M.; Connolly, Matthew J. L. "Evaluating the reasons for non-use of Cornell University's installation of DSpace". D-lib magazine, vol. 13, no. 3–4 (2007). <http://www.dlib.org/dlib/march07/davis/03davis.html>. [Accessed: 31/07/07].

27 Gierveld, Heleen. "Considering a marketing and communications approach for an institutional repository".
Ariadne, issue 49 (October 2006). <http://www.ariadne.ac.uk/issue49/gierveld>. [Accessed: 02/01/07].

28 Henty, Margaret. "Ten major issues in providing a repository service in Australian universities". D-lib magazine, vol. 13, no. 5–6 (May-June 2007). <http://www.dlib.org/dlib/may07/henty/05henty.html>. [Accessed: 05/07/07].

29 Ferreira, Miguel; Baptista, Ana Alice; Rodrigues, Eloy; Saraiva, Ricardo. "Carrots and sticks: some ideas on how to create a successful institutional repository". D-lib magazine, vol. 14, no. 1/2 (2008). <http://www.dlib.org/dlib/january08/ferreira/01ferreira.html>. [Accessed: 22.01.08].

30 Vegeu, per exemple: "European Research Advisory Board. Final report. Scientific publication: policy on open access". EURAB, 2006. <http://ec.europa.eu/research/eurab/pdf/eurab_scipub_report_recomm_dec06_en.pdf>. [Accessed: 28/02/08].

31 "L'Open Access a Europa". Bdig (biblioteques digitals i cooperació), 15.02.08. <http://bdig.blogspot.com/2008/02/lopen-access-europa.html>. [Consulta: 26/02/08].

32 Dempsey, Lorcan. "The library catalogue in the new discovery environment: some thoughts". Ariadne, issue 48 (July 2006). <http://www.ariadne.ac.uk/issue48/dempsey>. [Accessed: 14/07/07].

33 http://www.openarchives.it/pleiadi. [Consulta 28/02/08].

34 http://www.darenet.nl. [Consulta 28/02/08].

35 http://search.arrow.edu.au. [Consulta 28/02/08].

36 http://elib-a.ucl.ac.uk. [Consulta 28/02/08].