[Versió catalana]

Armando Alonso Peri, Alejandra Galán Palacio, Purificación Penín González

Documentalistas
Gobierno del Principado de Asturias

armandap@princast.es, alejangp@princast.es, purifpg@princast.es


Raquel Lavandera Fernández

Documentalista
Oficina de Investigación Biosanitaria (OIB-FICYT)

raquellf@princast.es


Juana Roldán Rodríguez

Documentalista
Ente Público de Servicios Tributarios del Gobierno del Principado de Asturias

juana.roldan@tributas.es



Resumen [Resum] [Abstract]

Se expone la experiencia de la creación de la plataforma digital RIA (Repositorio Institucional de Asturias). Esta plataforma se enmarca en el movimiento por el acceso abierto, y constituye la primera iniciativa desarrollada en Asturias en este ámbito. Se describe el proyecto desde sus comienzos hasta su puesta en marcha, haciendo especial referencia a la metodología aplicada, los objetivos, los organismos participantes, los componentes del sistema y las políticas adoptadas en materia de acceso abierto por parte del Gobierno del Principado de Asturias.


1 Introducción

El RIA es la iniciativa de la Dirección General de Modernización, Telecomunicaciones y Sociedad de la Información del Gobierno del Principado de Asturias, impulsada por el Servicio de Publicaciones, Archivos Administrativos y Documentación, para la creación de un repositorio digital institucional. Su finalidad es recoger los contenidos digitales generados por la actividad investigadora de sus miembros y facilitar la gestión y difusión de dichos contenidos, incluyendo su preservación, organización, acceso y distribución.

Este repositorio se enmarca en el movimiento internacional conocido como Open Access Initiative (OAI), que durante los últimos años ha intentado promover el acceso libre y sin restricciones a la literatura científica y académica, favoreciendo el aumento del impacto del trabajo desarrollado por los investigadores y las instituciones científicas, y contribuyendo a la reforma del sistema de comunicación científica tradicional que tiene como finalidad la interoperabilidad (o compatibilidad) entre archivos, la preservación a largo plazo y el acceso universal a la información.

La Iniciativa de Budapest1 recomienda dos estrategias para promover el acceso abierto al conocimiento científico, generalmente se consideran dos vías paralelas y no antagónicas: la publicación en revistas de acceso abierto o "ruta dorada", donde los artículos quedan disponibles sin restricciones desde su publicación, y el autoarchivo o "ruta verde" por parte de los autores de sus trabajos de investigación en repositorios institucionales de libre acceso.

Con la creación del RIA, el Gobierno del Principado de Asturias pretende contribuir al desarrollo del movimiento por el acceso abierto a través del autoarchivo o "ruta verde", y de esta forma situar a nuestra comunidad autónoma en el mapa de los recursos de acceso abierto a la literatura científica y académica. Hasta el momento no se ha llevado a cabo ninguna iniciativa de este tipo en Asturias lo que convierte al RIA el primer intento de acceso abierto a la información.

El RIA no es únicamente un repositorio institucional, con este proyecto hemos dado un paso más creando también un proveedor de servicios, el buscaRIA. Este buscador nos permitirá indexar otros repositorios institucionales y proporcionar servicios centralizados de búsqueda. Por otra parte, se ha implementado un proveedor de datos OAI-PMH sobre la aplicación de gestión documental DOGMA (Document Gallery Management) de nuestra red SIDRA (Sistema de Información Documental en Red de Asturias), que permite publicar documentos en acceso abierto desde la misma. RIA es en definitiva una plataforma digital de acceso abierto a la que se podrán incorporar otros repositorios que se creen en nuestra comunidad.


2 Justificación

Son varios los motivos que nos han llevado a plantearnos la idea de crear un repositorio institucional. A la ya mencionada inexistencia de herramientas de este tipo en nuestra comunidad, habría que añadir:


3 Objetivos

Con la creación del RIA nos hemos planteado alcanzar estos objetivos:


4 Participantes

En el proyecto han participado los principales organismos de investigación del Principado de Asturias. La respuesta ha sido muy positiva, y cabe destacar el gran interés y conocimiento que hay del movimiento por el acceso abierto por parte de los mismos:

Nuestra plataforma está abierta a colaborar con otros organismos e investigadores de nuestro entorno que deseen incorporarse a esta iniciativa en el futuro.


5 Metodología

No existe una metodología definitiva de implantación de repositorios. En nuestro caso el proyecto comenzó con la creación de un grupo de trabajo de repositorios, integrado por representantes de los diferentes organismos participantes en el proyecto. Se trata de un grupo de trabajo interdisciplinario que cuenta con documentalistas, bibliotecarios, informáticos e investigadores. En una primera fase se revisó la bibliografía existente sobre el tema y se analizaron experiencias similares a nivel nacional e internacional. Una vez establecido el marco teórico, en la segunda fase se procedió al análisis del software necesario para la creación del RIA. La tercera fase consistió en la programación y configuración del sistema, así como la adaptación de las herramientas al diseño del portal <http://www.asturias.es>. Finalmente, en una cuarta fase, se validó e implementó la plataforma en un entorno de producción.


5.1 Investigación y análisis. Fase 1

Se realizó un análisis exhaustivo de los siguientes temas:


5.2 Software. Fase 2

La elección de software se basó en un análisis de las características funcionales y de rendimiento de las aplicaciones de software libre disponibles para la creación de repositorios. Se eligió la solución más adecuada a la arquitectura operativa que buscábamos.


5.3 Programación y configuración del sistema. Fase 3

Una vez elegido el software, del que hablaremos más adelante, se procedió a la configuración y parametrización de los tres componentes fundamentales de la plataforma:


5.4 Validación e implementación. Fase 4

Esta fue la última fase del proyecto. Después de la configuración de los componentes en un entorno de desarrollo, se procedió a su validación, mediante la realización de pruebas de rendimiento y consistencia:

Finalmente la plataforma se implementó en un entorno de producción.


6 Software

A la hora de seleccionar el software que se utilizará para la creación del repositorio institucional nos planteamos los requisitos imprescindibles que debía cumplir la aplicación.

El nuevo desarrollo se debería caracterizar por:

Además la plataforma debería cumplir los siguientes requisitos de funcionamiento:

La mayoría de los repositorios institucionales están soportados por software libre, elegidos tras la evaluación de sus prestaciones. En nuestro caso se han evaluado las siguientes aplicaciones: Eprints 2, DSpace y Fedora. Se ha elegido DSpace (Versión 1.4.2), ya que gracias a su versatilidad es la solución más adecuada cuando se necesita disponer de un repositorio que va a dar soporte a diferentes tipos de documentos y atender a diversas comunidades de usuarios como es nuestro caso.

Las características técnicas de este software se adaptan al modelo de referencia Open Archival Information System (OAIS) ISO 14721:2003 y su concreción a través del Diccionario de datos de PREMIS sobre asignación de metadatos de preservación.

Otras características de este software son las siguientes:

Por otra parte, se llevó a cabo un importante trabajo de adaptación de la aplicación DSpace al diseño del portal <http://www.asturias.es>, lo que implicó la modificación de 127 páginas JSP diferentes. Los estilos han sido definidos directamente en cada página, no se ha hecho un uso estricto de CSS.


Adaptación del DSpace al portal <http://www.asturias.es>

Figura 1. Adaptación de Dspace al portal <http://www.asturias.es>


7 Componentes del RIA

La plataforma digital RIA se estructura como una plataforma digital de acceso a la literatura científica compuesta por un repositorio institucional (RIA), un proveedor de datos OAI-PMH (DOGMA) y un proveedor de servicios (buscaRIA), que recolecta archivos abiertos de diferentes repositorios institucionales y proveedores de datos OAI-PMH.

Funciona según el siguiente esquema: los proveedores de datos (RIA y DOGMA) ponen su información a disposición del proveedor de servicios (buscaRIA), que localiza los metadatos por medio del protocolo OAI-PMH y construye servicios de búsqueda.

En la arquitectura básica de la OAI el proveedor de servicios hace una petición al proveedor de datos mediante HTTP, el cual le responde enviándole los metadatos en XML gracias al protocolo OAI-PMH.

Según esto, los tres componentes principales de OAI son:


Componentes

Figura 2. Componentes


7.1 El repositorio institucional RIA

El RIA es el componente principal de nuestra plataforma de acceso abierto. Este repositorio se ha creado para organizar, gestionar, preservar y ofrecer acceso libre a la producción científica, académica o de cualquier otra naturaleza cultural, en soporte digital. Permite la coordinación del trabajo de los distintos colectivos que hacen uso del mismo (entorno universitario, personal de la administración, colectivos ciudadanos, etc.), para ello dispone de un conjunto de mecanismos de agrupación de contenidos en comunidades y colecciones.


Repositorio Institucional de Asturias (RIA)

Figura 3. Repositorio Institucional de Asturias (RIA)


7.2 El proveedor de servicios buscaRIA

Una vez definido el repositorio institucional se decidió dar un paso más y crear un proveedor de servicios que potenciase las funcionalidades del RIA. BuscaRIA es capaz de indexar y recopilar los metadatos de cualquier repositorio que los ofrezca a través del protocolo OAI-PMH. Utiliza para ello el API de código abierto Lucene de Apache. Este API de recuperación de información de código abierto sirve para cualquier aplicación que requiera indexado y búsqueda a texto completo. La flexibilidad de esta herramienta le permite ser independiente del formato del fichero, textos que se encuentran en formato PDF, páginas HTML, documentos Word, así como muchos otros, pueden ser indexados mientras que se pueda extraer información de ellos. Mediante esta herramienta se indexan periódicamente los metadatos de los repositorios, metadatos que gracias al protocolo OAI-PMH se envían con un formato XML determinado, así, cuando el usuario hace sus búsquedas, las realizará sobre esos índices. Una vez conectados a las URL de los proveedores de datos de los repositorios, obtenemos documentos XML con todos los metadatos. Estos metadatos pasan a Lucene para su indexación, guardándose los índices generados en las carpetas del sistema de ficheros.


BuscaRIA

Figura 4. BuscaRIA


7.3 El proveedor de datos OAI-PMH DOGMA

Este proveedor de datos se ha implementado sobre la herramienta de gestión documental DOGMA (Document Gallery Management) del Sistema de Información Documental en Red de Asturias (SIDRA). Esto permite a DOGMA publicar documentos digitales en acceso abierto. La aplicación DOGMA incorpora un modelo de descripción de documentos mixto (ISBD, MARC y Dublin Core), lo que nos ha obligado a adaptar este formato a las necesidades de un proveedor de datos OAI-PMH, para lo que se ha llevado a cabo un importante trabajo de mapeo de campos del modelo de datos de la aplicación DOGMA al modelo de datos Dublin Core, estándar requerido para la publicación en acceso abierto.


DOGMA

Figura 5. DOGMA


8 Políticas

Cuando adoptamos una política de acceso abierto necesitamos una estrategia económica y tecnológica, pero también una estrategia legal. En la actualidad no existe un marco normativo consolidado, las políticas legales y normativas de acceso abierto a los resultados de investigación son escasas. Estudios realizados sobre el tema demuestran que las políticas basadas en la "voluntariedad" no tienen la efectividad deseada, dada la reticencia por parte de los investigadores a depositar sus trabajos en repositorios institucionales. Sin embargo, el acceso abierto da a los investigadores una audiencia mucho mayor que la que obtienen mediante la publicación de sus artículos en revistas de suscripción, aún en las más prestigiosas o populares. Varios estudios apuntan hacia el incremento de la visibilidad e impacto de los trabajos, medidos típicamente por las citas recibidas.2 Cuando los autores han autoarchivado en un repositorio de acceso abierto una versión de un artículo publicado en una revista por suscripción, estos trabajos se descargan y citan dos veces más que antes.

Esta es una de las bazas fundamentales con que cuenta el movimiento por el acceso abierto para convencer a los investigadores de los beneficios que esta política les reportaría. En cualquier caso, las políticas basadas en la recomendación no han tenido el éxito deseado y se están imponiendo las políticas de mandato.

Recientemente la Faculty of Arts and Sciences de la Harvard University ha sometido a votación de sus miembros la política de acceso abierto3 a sus publicaciones. La propuesta fue votada y aprobada por unanimidad el 13 de febrero pasado. Reseñamos este hecho ya que significa un importante empujón para el movimiento de acceso abierto en el mundo, dada la influencia de esta facultad y universidad en el sector educativo. Es la primera universidad del mundo en donde todas las publicaciones de investigación de su facultad serán libre y gratuitamente accesibles a todos.


8.1 Directrices sobre Open Access del European Research Council (ERC)

El Consejo Europeo de Investigación publicó el 10 de enero de este mismo año sus directrices sobre Open Access (OA). Su política de OA se puede resumir en los siguientes apartados de dichas directrices:

"The ERC requires that all peer-reviewed publications from ERC-funded research projects be deposited on publication into an appropriate research repository where available, such as PubMed Central, ArXiv or an institutional repository, and subsequently made Open Access within 6 months of publication".

"The ERC considers essential that primary data - which in the life sciences for example could comprise data such as nucleotide/protein sequences, macromolecular atomic coordinates and anonymized epidemiological data - are deposited to the relevant databases as soon as possible, preferably immediately after publication and in any case not later than 6 months after the date of publication".4

Podemos decir que es una buena política, un paso importante de cara a promover el acceso abierto en Europa. En primer lugar, no se trata de una recomendación, si no que obliga a facilitar el acceso abierto a través de los repositorios, al tiempo que se publica en una revista. El tiempo de embargo es relativamente corto y el depósito en el repositorio se deberá realizar en el mismo momento de la publicación, sin esperar a que se termine dicho tiempo de embargo, esto asegura que el artículo ya está depositado para el momento en el que sea accesible.

Se trata de la primera política de mandato de ámbito europeo, y ha sido promovida por uno de los organismos con mayor presupuesto para la financiación de la investigación en Europa.


8.2 Política de acceso abierto del Gobierno del Principado de Asturias

El Gobierno del Principado de Asturias está trabajando en la elaboración de su política de acceso abierto que esperamos quede definida en su totalidad a lo largo del 2008. Se han celebrado reuniones de trabajo con los distintos responsables del gobierno asturiano en materia de investigación. La política de acceso abierto que se propone estará en la siguiente línea: Todos los trabajos científicos elaborados por el personal del Gobierno del Principado o derivados de proyectos de investigación financiados por el mismo deberán ser depositados en el RIA, en el momento de aceptación para su publicación. El Gobierno del Principado de Asturias respetará, siempre que sea necesario, un periodo de embargo no superior a los doce meses. Este periodo de embargo se intentará reducir progresivamente.

Se trata de una política de mandato que está en la línea de las últimas directrices adoptadas a nivel europeo por los organismos representativos como es el caso del ERC, de cuya política hemos hablado anteriormente. Esta política aumentará la visibilidad de los trabajos de investigación realizados con fondos públicos y garantizará el retorno de la inversión realizada en ellos.

Las políticas de acceso abierto no pueden ser vistas, por nuestros investigadores, como enemigas, tenemos que recordar que el fin último de un investigador no es recibir una recompensa económica por su publicación; lo que ellos buscan es "impacto de investigación" (Harnad y Brody, 2004).


8.3 Directrices DRIVER (Digital Repository Infrastructure Vision for European Research)5

Actualmente estamos inmersos en una nueva fase, la adaptación del RIA a las Directrices DRIVER. Estas directrices guían a los administradores de los nuevos repositorios en la definición de las políticas de administración de datos, y a los administradores de los repositorios existentes en los pasos que se deben seguir para conseguir servicios mejorados, y también a los desarrolladores de plataformas de repositorios para la incorporación de funciones adicionales en versiones futuras.

La adaptación a las Directrices DRIVER, aumentará la interoperabilidad de nuestro repositorio y mejorará la calidad del mismo.

Las directrices contemplan tres niveles de conformidad: proveedor DRIVER sin validar, validado y con futuro. Se clasifican en obligatorias, recomendadas y optativas y afectan al protocolos OAI-PMH, al estándar de metadatos Dublin Core y al estándar de metadatos DIDL. Una vez superados estos pasos, nuestro repositorio será recolectado pro el proveedor de servicios de DRIVER.


9 Formación

Es evidente que además del establecimiento de políticas, hay que realizar un importante trabajo de difusión de las iniciativas OA y de formación en el procedimiento de autoarchivo, intentando persuadir a los investigadores para que depositen sus trabajos en el repositorio institucional. En este sentido se ha diseñado un plan de formación y difusión que abarca las siguientes acciones:

Una parte crucial en el éxito de cualquier implementación de software es la previsión de una formación efectiva y eficiente. Un plan de formación adecuado es aquel que consiga los objetivos deseados y la máxima productividad de los sistemas que abarcan este proyecto.

La formación tendrá los siguientes objetivos:


10 Conclusiones

Somos conscientes de que uno de los mayores problemas a los que nos enfrentamos es conseguir por parte de los investigadores un grado de implicación y participación aceptable. Sin su colaboración resulta imposible, por un lado, alcanzar los objetivos del OA y, por otro, justificar la creación y el mantenimiento de la plataforma digital.

En este sentido, es muy importante mostrar a los investigadores las ventajas que proporciona el acceso abierto, ventajas que van desde el aumento de la visibilidad de sus trabajos (con el consiguiente incremento del número de citas) hasta el acceso a una mayor cantidad de trabajos científicos sin barreras económicas.

Sin embargo este colectivo continúa ofreciendo resistencia a publicar sus trabajos en repositorios institucionales por diferentes motivos:

Abordaremos esta tarea desde las dos líneas estratégicas expuestas anteriormente: el establecimiento de una política clara de acceso abierto por parte del Gobierno del Principado de Asturias, y el desarrollo de un plan de formación y difusión de la plataforma y del movimiento OA. Esperamos que estas medidas sirvan para concienciar a los investigadores de las ventajas de publicar en acceso abierto.

Por otra parte nos enfrentamos a corto plazo a otro reto no menos difícil, la adaptación a las directrices del proyecto europeo DRIVER, que nos aportará mayor calidad e interoperabilidad.


11 Bibliografía

Bailey, C. W. (2005). Open access bibliography: liberating scholarly literature with e-prints and open access journal. Annapolis: Association for Research Libraries. <http://info.lib.uh.edu/cwb/oab.pdf>. [Consulta: 30/01/2008].

Committee for Economic Development. Harnessing openness to transform American health care.
<http://www.ced.org/docs/report/report_healthcare2007dcc.pdf>. [Consulta: 25/02/2008].

Creative Commons. <http://creativecommons.org>. [Consulta: 31/01/2008].

Dublin Core. <http://dublincore.org>. [Consulta: 31/01/2008].

European Research Council. <http://erc.europa.eu>. [Consulta: 31/01/2008].

Eysenbach, G. (2006). "Citation advantage of open access articles". PLOS biology, vol. 4, no. 5, p. 692–698.

Harnad, S.; Brody, T. (2004). "Comparing the impact of open access (OA) vs. non-OA articles in the same journals". D-lib magazine, vol. 10, no. 6. <http://www.dlib.org/dlib/june04/harnad/06harnad.html>. [Consulta: 25/02/2008].

Jacobs, N. (2006). Open access: key strategic, technical and economic aspects. Oxford: Chandos.

Keefer, A. (2007). "Los repositorios digitales universitarios y los autores". Anales de documentación, nº. 10, p. 205–214. <http://www.um.es/fccd/anales/ad10/ad1011.pdf>. [Consulta: 04/02/2008].

Keefer, A. (2005). "Aproximació al moviment open access". BiD, núm. 15. <http://bid.ub.edu/15keefer.htm>. [Consulta: 11/02/2008].

McVeigh, M. E. (2004). Open access journals in the ISI citation databases: analysis of impact factors and citation patterns: a citation study from Thomson Scientific. Thomson Corporation.
<http://www.isinet.com/media/presentrep/essayspdf/openaccesscitations2.pdf>. [Consulta 28/02/2008].

Melero, R. (2005). "Acceso abierto a las publicaciones científicas: definición, recursos, copyright e impacto". El profesional de la información, vol. 15, nº. 4, p. 255–266.

Melero, R. (2007). "Políticas sobre el libre acceso a la producción científica y la respuesta de los autores". En: IV Congreso de Comunicación Social de la Ciencia, Madrid. <http://digital.csic.es/bitstream/10261/1492/1/OA5rm.pdf>. [Consulta: 05/02/2008].

Open archives initiative. <http://www.openarchives.org>. [Consulta: 13/02/2008].

OpenDOAR. The directory of open access repositories. <http://www.opendoa.org>. [Consulta: 13/02/2008].

Rovira, C.; Marcos, M. C.; Codina, L. (2007). "Repositorios de publicaciones digitales de libre acceso en Europa: análisis y valoración de la accesibilidad, posicionamiento web y calidad del código". El profesional de la información, vol. 16, n.º 1, p. 24–38.

Silió, T. (2005). "Fundamentos tecnológicos del acceso abierto: Open archives initiative y open archival information system". El profesional de la información, vol. 14, n.º 5, p. 365–380.

Suber, P. (2008). Open access in 2007. Ann Arbor, MI: Scholarly Publishing Office, University of Michigan, University Library. Vol. 1, no. 1. <http://hdl.handle.net/2027/spo.3336451.0011.110>. [Consulta: 06/02/2008].

Thomson Corporation (2004). The impact of open access journals: a citation study from Thomson ISI. <http://www.isinet.com/media/presentrep/acropdf/impact-oa-journals.pdf>. [Consulta: 28/02/2008].

Tramullas, J.; Garrido Picazo, P. (2006). "Software libre para repositorios institucionales: propuestas para un modelo de evaluación de prestaciones". El profesional de la información, vol. 15, n.º 3, p. 171–181.

Vives i Gràcia, J. (2005). "Aspectos de propiedad intelectual en la creación y gestión de repositorios institucionales". El profesional de la información, vol. 14, n.º 4, p. 267–278.




Notas

1 Iniciativa de Budapest <http://www.soros.org/openaccess/esp/read.shtml>.

2 El sitio web del Open Citation Project recoge los estudios bibliométricos que se han desarrollado hasta el momento <http://opcit.eprints.org>.

3 Políticas de acceso abierto de la Faculty of Arts and Sciences de la Harvard University.
<http://lawprofessors.typepad.com/law_librarian_blog/2008/02/harvard-faculty.html>.

4 Directrices sobre Open Access del ERC <http://erc.europa.eu/pdf/ScC_Guidelines_Open_Access_revised_Dec07_FINAL.pdf>.

5 Directrices para proveedores de contenido DRIVER (Digital Repository Infrastructure Vision for European Research) <http://www.driver-support.eu/en/guidelines.html>.