[Versión castellana]

Josep-Manuel Rodríguez-Gairín , Andreu Sulé Duesa

Professors de la Facultat de Biblioteconomia i Documentació
Universitat de Barcelona

rodriguez.gairin@ub.edu, sule@ub.edu



Resum [Resumen] [Abstract]

DSpace és un dels programes de codi obert preferits per les institucions acadèmiques per gestionar dipòsits de fitxers (textuals, àudio, vídeo, etc.), que en faciliten el dipòsit, els organitzen en comunitats, els assignen metadades i en permeten la difusió a recol·lectors o agregadors. El manual que presentem no és el típic manual genèric sobre el funcionament (com es consulta, com s'hi dipositen documents, com es revisen, etc.), sinó un d'específic per a gestors de la informació i la documentació, centrat en les funcions del programa que es troben més directament relacionades amb la nostra professió (esquema de metadades, vocabularis controlats, interfícies de consulta, eines de difusió, estadístiques, etc.).


1 Introducció

DSpace és un programari de codi obert dissenyat pel Massachusetts Institute of Technology (MIT) i els laboratoris de HP per gestionar dipòsits de fitxers (textuals, àudio, vídeo, etc.), que en facilita el dipòsit, els organitza en comunitats, els assigna metadades i en permeten la difusió a recol·lectors o agregadors. Aquestes característiques han fet que, juntament amb l'EPrints, sigui un dels programes preferits per les institucions acadèmiques per gestionar els dipòsits en què els investigadors inclouen les publicacions i els materials de recerca a fi de donar-los una visibilitat més gran.1

El manual que tot seguit presentem del DSpace no és el típic manual genèric sobre el funcionament (com es consulta, com s'hi dipositen documents, com es revisen, etc.),2 sinó que la nostra intenció ha estat elaborar un manual específic per a gestors de la informació i la documentació. En què consisteix aquesta especificitat? Doncs que en comptes de centrar-nos en allò que DSpace pot fer un cop instal·lat, ho fem en allò que es pot parametritzar, i més concretament en les funcions que es troben més directament relacionades amb la nostra professió. Com definir un nou esquema de metadades? Es poden emprar vocabularis controlats? Fins a quin punt es poden personalitzar les interfícies de consulta? I les de visualització de resultats i de registres? És possible incorporar noves eines de difusió com ara la sindicació de continguts RSS? Es pot millorar l'avaluació del rendiment del dipòsit amb estadístiques diferents de les que incorpora per defecte el programa?

Val a dir que la major part de les respostes a aquestes preguntes ja es troben en altres manuals i fòrums, però molt sovint sense l'orientació documentalista que nosaltres els hem volgut donar. Ha estat la nostra intenció recopilar-les, reformular-les i exposar-les d'una manera ordenada, perquè puguin ser d'utilitat per a qualsevol professional de la informació i la documentació que vulgui posar en marxa i optimitzar un sistema de gestió de dipòsits basat en DSpace.

Per no caure en un manual per a informàtics (cosa que passa sovint quan es parla de parametritzar un programa), hem defugit d'explicacions tècniques molt detallades sobre els processos de configuració, per centrar-nos més en les possibilitats que ofereix DSpace per adaptar-ne o millorar-ne les prestacions. Això vol dir que en molts casos, un cop es conegui la millora i es vulgui implementar, cal recórrer a altres recursos (DSpace how-to Guide, Category:Howto-DSpace Wiki, etc.), o fins i tot al suport de personal informàtic, per a la configuració del sistema.


2 Instal·lació

El codi font del programa pot obtenir-se del web que el projecte té a SourceForge. L'abril del 2008 la versió estable és la 1.4.2 tot i que ja es troba accessible una versió beta de la 1.5.

DSpace és una aplicació client/servidor que es gestiona via web, és a dir, que la major part de processos poden dur-se a terme amb un navegador estàndard com Internet Explorer, Firefox u Opera.

Des del punt de vista del servidor, DSpace pot instal·lar-se tant en entorns Linux com en un servidor Windows, sempre que reuneixi una sèrie de prerequisits:

A diferència d'altres aplicacions basades en AMP (Apache-MySQL-PHP), la veritat és que la instal·lació del DSpace no és pas una tasca senzilla i requereix uns certs coneixements d'informàtica per configurar la base de dades i l'entorn de desenvolupament.

De la mateixa manera, quan a posteriori es fan canvis en la configuració del DSpace, en especial als fitxers JSP, moltes vegades és necessari recompilar l'aplicació amb l'ordre "ant" per tal de fer-los operatius.

A part d'aquestes aplicacions base, cal configurar una sèrie d'activitats programades (cron jobs) que permetin informar periòdicament als usuaris dels nous documents dipositats (sistema d'alertes), indexar el text complet dels documents afegits i generar les miniatures dels gràfics i informar l'administrador del funcionament correcte del sistema.


3 Adaptacions generals del sistema al nostre entorn

Amb els passos anteriors tindrem instal·lat un sistema DSpace net preparat per començar a treballar. A continuació cal parametritzar-lo per ajustar-lo a les necessitats del nostre centre tant visualment com funcionalment.


3.1 Canviar l'idioma del programa

Com que el sistema s'instal·la per defecte en anglès, sens dubte el primer pas consisteix a canviar l'idioma en la configuració perquè els textos es mostrin en la nostra llengua. S'aconsegueix instal·lant els paquets de llenguatge. La versió 1.4.2 disposa de traduccions per a sis idiomes, entre els quals hi ha el català i el castellà.

Aquesta configuració és relativament senzilla, ja que tots els missatges es troben independents del codi informàtic en un fitxer "messages_xx.properties"(on xx és l'idioma de la traducció: es, ca, fr, de…). Només cal copiar els fitxers que es poden descarregar de SourceForge en el directori "config/language_packs", tornar a compilar l'aplicació amb l'ordre "ant" i copiar els fitxers ".war" que es generaran en el directori webapps del Tomcat. D'aquesta manera, DSpace farà servir l'idioma definit al navegador si està a la llista de disponibles.


3.2 Canviar la presentació

També podem adaptar l'aspecte en què es presenta el sistema tant pel que fa a l'estructura com a l'estil. En tots dos casos, els fitxers que es poden modificar es troben en el directori "jsp", però cal deixar els originals i copiar-los a "jsp/local/layout"per modificar-los i treballar-hi.

Pel que fa a l'estil, les modificacions es faran en el fitxer "jsp/local/layout/styles.css.jsp". L'estructura es reparteix de la manera següent:

Il·lustració 1. Estructura del programa

Il·lustració 1. Estructura del programa


Cal recordar que sempre que es facin modificacions en fitxers cal recompilar l'aplicatiu amb l'ordre "ant", esborrar el directori "dspace" del Tomcat i copiar el nou "dspace.war" generat.

Una excepció al punt anterior són l'espai central de notícies i la barra lateral dreta que són fitxers HTML modificables directament, en aquest cas en el directori d'instal·lació (normalment, "opt/dspace"), i que no requereixen recompilar ni reiniciar el Tomcat. També es poden modificar aquests textos des de l'administrador del sistema <http://web-address-to-my-dspace/dspace-admin> a l'opció "Editarnotícies".


3.3 Canviar el contingut dels missatges de correu electrònic

El sistema envia missatges de correu electrònic a l'administrador i als usuaris quan se subscriuen o es generen alertes. Aquests missatges no es troben en els fitxers d'internacionalització descrits abans sinó que els hem de modificar en el directori "config/emails".En aquest cas no podem tenir fitxers diferents segons els idiomes.


4 Creació de comunitats i de col·leccions

DSpace estructura els dipòsits en comunitats i col·leccions: les comunitats contenen subcomunitats i/o col·leccions, i les col·leccions, documents.

La definició d'aquestes seccions jeràrquiques es pot fer des de la interfície d'administració del sistema <http://web-address-to-my-dspace/dspace-admin >:

Il·lustració 2. Comunitats i col·leccions

Il·lustració 2. Comunitats i col·leccions


5 Gestió d'usuaris

DSpace és un sistema col·laboratiu que requereix una bona planificació prèvia de les persones que hi interactuaran. Globalment, podem parlar d'un accés públic, que no requereix cap registre i permet la consulta de les col·leccions i dels documents públics, i d'un accés registrat, que permet la consulta de col·leccions restringides, com també interactuar amb el sistema per gestionar els documents dipositats.

Els usuaris poden crear-se de diferents maneres:

Una vegada creats, l'administrador del sistema pot assignar-los a grups i a cadascun d'aquests grups se'ls poden atorgar privilegis (lectura, escriptura, afegir, esborrar i administrar) per comunitats, col·leccions o ítems concrets. Les combinacions possibles són moltes; difícilment s'assignen privilegis concrets a un document i normalment el que es fa és crear un grup per comunitat o col·lecció.


6 Representació de la informació (metadades)

Per defecte, DSpace està configurat amb l'esquema de metadades del Dublin Core, però potser, segons els documents que volem dipositar, ens serà molt útil disposar altres esquemes per definir-los millor (PRISM, MODS, METS, etc.). Així, per exemple, en el cas d'articles de revista o d'actes de congressos, pot ser útil registrar les dades bibliogràfiques, com ara el volum, el número, les pàgines, l'ISSN o el DOI que trobem al PRISM però no al DC. Això es pot fer des de la interfície web, entrant com a administrador <http://web-address-to-my-dspace/dspace-admin> i escollint l'opció "Registre metadades".

Il·lustració 3. Esquema de registre de metadades

Il·lustració 3. Esquema de registre de metadades


Una vegada incorporat el nou esquema, es fa clic sobre el "Namespace" i s'afegeixen els camps de les metadades corresponents.

Il·lustració 4. Registre de camp de metadades

Il·lustració 4. Registre de camp de metadades


7 Vocabularis controlats

De sèrie, DSpace té desactivada la funcionalitat de l'ús de vocabularis controlats en el procés de descripció dels documents, ja que no és compatible amb les normes d'accessibilitat establertes per la Web Accessibility Initiative (WAI). Malgrat tot, si es vol emprar aquesta opció només cal activar la línia "webui.controlledvocabulary.enable = true" del fitxer "dspace.cfg". 

En DSpace els vocabularis controlats consisteixen bàsicament en una llista de termes ordenats jeràrquicament i orientats a la classificació temàtica dels documents. Per exemple:

Tesaurus de biblioteconomia
Arxivística
Biblioteconomia
Accés al document bibliotecari
Automatització de biblioteques
Ciències i tècniques auxiliars
Estudis mètrics de la informació
Fonts d'informació

L'assignació d'un terme a un recurs en suposa la vinculació a l'agregació de tots els termes jeràrquicament superiors. Per exemple, si s'assignés com a matèria el terme "Automatització de biblioteques", el document recurs restaria vinculat a l'agregació "Tesaurus de biblioteconomia::Biblioteconomia::Automatització de biblioteques".

Aquests vocabularis tenen una estructura XML i, de sèrie, DSpace només té llicència per redistribuir els vocabularis Norwegian Science Index i Swedish Research Subject Categories. Ara bé, l'administrador del sistema pot crear d'altres vocabularis amb el suport d'una plantilla que es troba en el fitxer "controlledvocabulary.xsd". El resultat final és un fitxer XML com el que es mostra en la figura següent:

Il·lustració 5. Fitxer "tesaurus_bd.xml"

Il·lustració 5. Fitxer "tesaurus_bd.xml"


Aquest fitxer cal copiar-lo en el directori "config/controlled-vocabularies/", editar el fitxer "config/input-forms.xml", cercar el camp a què volem associar-lo (per exemple, el "Subject") i afegir-hi "<vocabulary>tesaurus_bd</vocabulary>".

Com a resultat, quan un usuari diposita i descriu un document, en el camp "Matèria" el programa li permet escollir el terme del tesaurus.

Il·lustració 6. Visualització del tesaurus en el  procés de descripció

Il·lustració 6. Visualització del tesaurus en el procés de descripció


8 Publicació

Com en la majoria dels dipòsits institucionals, en DSpace el procés de publicació de documents corre en gran part a càrrec dels mateixos autors. És el mateix autor el que penja el document en el dipòsit, el que el descriu (metadades) i el que li assigna uns drets d'explotació. Opcionalment, el programa permet establir un pas previ a la publicació definitiva que consisteix en la revisió del document i de la descripció feta per altres membres de la comunitat.

En definitiva, el procés de publicació d'un document en DSpace seguiria els passos següents:

  1. Identificació de l'autor.
  2. Tria de la col·lecció en la qual es vol publicar el document.
  3. Descripció del document (metadades).
  4. Assignació del fitxer corresponent al document (preferentment en formats oberts com ara PDF, XML, TXT, HTM, HTML, JPG, etc.).
  5. Tria de la llicència de drets d'autor (habitualment, Creative Commons).
  6. Revisió del document i de la descripció d'altres membres (opcional).
  7. Publicació definitiva del document.

Per defecte, els formularis que s'utilitzen per descriure els documents són iguals per a totes les col·leccions i estan basats en l'esquema Dublin Core. No obstant això, si s'edita el fitxer "input-forms.xml" es poden crear formularis específics per a col·leccions, com també assignar un nou esquema de metadades per a la descripció del recurs (vegeu 6 Representació de la informació (metadades)). També des d'aquest fitxer es pot especificar per a cada camp si és obligatori o no, si és repetible o no i assignar-li un llenguatge controlat per a la introducció dels valors (vegeu 7 Vocabularis controlats).


9 El flux de treball

El procés de dipòsit d'un document en DSpace preveu un flux de treball amb un màxim de tres passos. Cada pas pot estar assignat a una persona o a un grup de persones que reben una notificació quan un document arriba a aquest pas. Si no està assignat a ningú, aquest pas s'omet.

Quan una persona d'un grup del flux de treball agafa el document pot rebutjar-lo, modificar-ne les metadades i/o acceptar-lo, amb la qual cosa passarà automàticament al pas següent i, en última instància, el document es col·locarà al dipòsit.

Il·lustració 7. Flux de treball

Il·lustració 7. Flux de treball
Font: http://www.dspace.org/index.php?option=com_content&task=view&id=149#ingest


10 Consulta

DSpace permet configurar els criteris de fer cerques per defecte de tres maneres diferents: navegació, consulta simple i consulta avançada.


10.1 Navegació

Il·lustració 8. Navegació

Il·lustració 8. Navegació

El programa permet navegar alfabèticament pels elements següents: "Comunitats i col·leccions", "Títol", "Autor", "Matèries" i "Data de publicació" (en aquest cas, per ordre cronològic invers). Es pot escollir parametritzar aquests elements de navegació modificant el fitxer "dspace.cfg".


10.2 Consulta simple

Il·lustració 9. Consulta simple

Il·lustració 9. Consulta simple


Per defecte, el DSapce pot cercar de manera simultània en els camps "Títol", "Autor", "Matèria", "Resum", "Número de classificació interna" (series), "Patrocinador",3 "Identificador" (ISBN, ISSN, URI, etc.) i "Llengua". Des del fitxer "dspace.cfg" es pot modificar aquest criteri afegint o esborrant camps de cerca.

En cas de cerques per més d'un terme, DSpace empra per defecte l'operador OR. Aquest criteri també es pot modificar des del fitxer "dspace.cfg" on es pot triar un nou operador de cerca ("and" o "not").

Per últim, s'ha d'esmentar que també es pot configurar el sistema perquè indexi a text complet el contingut dels documents publicats. Per això cal parametritzar el directori "/bin/filter-media" (on es defineixen els formats susceptibles de ser indexats)4 i el fitxer "dspace.cfg". Un cop activada aquesta funcionalitat, la cerca per text complet es pot fer tant des de la casella única de la consulta simple com des de l'opció "Paraula clau" de la consulta avançada.


10.3 Consulta avançada

Il·lustració 10. Consulta avançada

Il·lustració 10. Consulta avançada


En aquest cas, des del fitxer "dspace.cfg"es poden afegir nous camps de cerca o esborrar-ne alguns dels ja existents.


11 Visualització de resultats i de registres

11.1 Visualització de resultats

Il·lustració 11. Visualització de resultats

Il·lustració 11. Visualització de resultats


Un cop duta a terme la consulta, els resultats es mostren, per defecte, amb els camps "Fecha de publicación", "Título"i "Autor(es)". Des del fitxer "dspace.cfg" es poden afegir nous camps, esborrar els ja existents o moure'n la posició dins de la taula.


11.2 Visualització de registres

Il·lustració 12. Visualització de registres

Il·lustració 12. Visualització de registres


La visualització dels registres també té un format per defecte i, també com en el cas anterior, editant el fitxer "dspace.cfg" es pot afegir o esborrar camps, canviar el nom de les etiquetes i modificar l'ordre de presentació.

En el cas que la nostra institució disposi del programari SFX i activem en el "dspace.cfg" l'adreça del nostre servidor d'enllaços (per exemple, "sfx.server.url = http://sfx.ub.edu/ub?"), el sistema mostrarà una icona que permet la localització del document tot i que normalment ja en tenim una còpia arxivada en el nostre dipòsit.

Il·lustració 13.  Visualització de la icona SFX

Il·lustració 13. Visualització de la icona SFX


12 Difusió

A més de la difusió a través de la mateixa interfície de consulta, DSpace disposa de tres eines més per donar a conèixer els documents dipositats:


12.1 Les alertes

Permet de rebre per correu electrònic una notificació amb els registres que s'han donat d'alta d'una col·lecció determinada. Per activar aquesta opció, només cal anar a la pàgina de la col·lecció i subscriure-s'hi. 

Il·lustració 14. Alertes

Il·lustració 14. Alertes


12.2 La sindicació de continguts RSS

Mitjançant la configuració del fitxer "dspace.cfg" es pot habilitar la funcionalitat de difondre mitjançant RSS les actualitzacions que es fan en una determinada comunitat i/o col·lecció ("webui.feed.enable = true"). El programa permet de parametritzar, entre altres elements, el nombre màxim de notícies visualitzades, el format RSS (es recomana 1.0 i/o 2.0) i els camps que es mostraran.

Il·lustració 15. RSS

Il·lustració 15. RSS


12.3 OAI

DSpace suporta Open Archives Initiative's Protocol for Metadata Harvesting (OAI-PMH) com a proveïdor de dades. D'aquesta manera, els registres estan disponibles perquè les metadades associades als objectes les puguin recopilar (harvesting) tota mena de recol·lectors, com ara el servei ROAI del Ministeri de Cultura o el portal OAIster de la Universitat de Michigan.

Per habilitar aquesta funcionalitat només cal copiar el fitxer "dspace-oai.war" en el directori "[Tomcat]/webapps/". Un cop fet això, és convenient registrar l'URL base <http://web-address-to-my-dspace/dspace-oai> en el nombre més gran de serveis de recol·lecció possible (OaiInstallations–DSpace Wiki, Open Archives Initiative-Data Provider RegistrationDirectory of Open Access Repositories–OpenDOAR, Registry of Open Access Repositories (ROAR), etc.).


13 La preservació

A més de la difusió de la informació, un dels objectius principals dels dipòsits és la preservació dels continguts.

En primer lloc, cal verificar que el contingut dels fitxers no s'alteri quant a bits, ja sigui per corrupció física dels suports magnètics o per virus informàtics. En aquest aspecte, DSpace utilitza una aplicació anomenada Checksum Checkerque s'executa dins d'una tasca programada (cada dia, per exemple) a fi de detectar canvis en els fitxers.

Un segon aspecte de la preservació fa referència al fet que, encara que els fitxers siguin inalterats en el temps, determinats formats, en especial els propietaris de no gaire difusió, poden ser inaccessibles en el pas del temps. A aquest efecte, cal identificar clarament els formats dels documents, establir eines de conversió i altres aspectes en estudi continu per la comunitat d'usuaris del DSpace i especialistes en el tema.


14 Les estadístiques

El paquet d'estadístiques que ofereix DSpace per defecte no és gaire complet: les dades sobre la visualització de les pàgines, les cerques dutes a terme, els logins, els errors, etc. Per tal d'habilitar aquesta funcionalitat, cal retocar algunes línies del fitxer "dstat.cfg" que és l'arxiu del programa que permet configurar les estadístiques. Es pot trobar informació dels canvis que s'han de fer a <http://wiki.dspace.org/index.php/Use_DSpace_Statistics>.

Si en el fitxer "dspace.cfg" es defineix que els informes estadístics siguin accessibles públicament ("report.public = true"), es poden consultar des de l'adreça <http://web-address-to-my-dspace/statistics>, com per exemple en el dipòsit de les University of Oregon Libraries

Si el que es vol és obtenir uns altres tipus de dades estadístiques (per exemple, sobre la descàrrega de fitxers), cal recórrer a l'ús d'eines complementàries com Webalizer, tal com ha fet la Università degli Studi di Parma, o Tasmania Statistics, emprat per la Universitat d'Alacant.

Il·lustració 16. Estadístiques del DSpaceUnipr  elaborades amb Webalizer

Il·lustració 16. Estadístiques del DSpaceUnipr elaborades amb Webalizer


Il·lustració 17. Estadístiques del RUA elaborades amb  Tsamania Statistics

Il·lustració 17. Estadístiques del RUA elaborades amb Tsamania Statistics


15 Altres aspectes de la personalització

Podem trobar una àmplia informació sobre altres aspectes més específics de la personalització del programa en el document DSpace how-to guide (Donohue; Phillips; Salo, 2007), del qual hi ha una traducció al castellà feta per la Universidad de León i consultable a <http://sod.upc.es/gude/images/f/f8/HowTov2.pdf>.


Bibliografia

Donohue, Tim; Phillips, Scott; Salo, Dorothea (2007). DSpace how-to Guide: tips and tricks for managing common DSpace chores: now serving DSpace 1.4.2 and Manakin 1.1. <http://hdl.handle.net/2142/1043 >. [Consulta: 25/03/2008]. Hi ha una traducció al castellà feta per Luis Tijera (Universidad de León) a <http://sod.upc.es/gude/images/f/f8/HowTov2.pdf >. [Consulta: 25/03/2008].

DSpace Wilki! <http://wiki.dspace.org/ >. [Consulta: 25/03/2008].

DSpace.org  <http://www.dspace.org >. [Consulta: 25/03/2008].

Grupo de Usuarios de DSpace de España. GUDE: Grupo de Usuarios de DSpace de España <http://sod.upc.es/gude/index.php/Portada >. [Consulta: 25/03/2008].

METS: Metadata Enconding & Transmission Standard. <http://www.loc.gov/standards/mets/ >.[Consulta: 25/03/2008].

MODS: Metadata Object Description Schema. <http://www.loc.gov/standards/mods/ >. [Consulta: 25/03/2008].

PRISM: Publishing Requirements for Industry Standard Metadata. <http://www.prismstandard.org/>. [Consulta: 25/03/2008].



Notes

1 El Grupo de Usuarios DSpace de España manté una llista de casos d'èxit a <http://sod.upc.es/gude/index.php/Instalaciones_de_DSpace>. [Consulta: 25/03/2008].

2 Com a manual genèric, val l'ajuda (DSpace help) del mateix programa, molt clara i ben estructurada.

3 Per exemple, els patrocinadors de projectes de recerca.

4 Únicament vàlid per als formats Adobe PDF (basat en text o OCRed), Microsoft Word, text pla i HTML.