[Versió catalana]

José Antonio Frías , Críspulo Travieso Rodríguez

Departamento de Biblioteconomía y Documentación
Universidad de Salamanca

frias@usal.es, ctravieso@usal.es




Resumen [Resum] [Abstract]

El objetivo de este trabajo es estudiar el acceso abierto, su generalización y su impacto en el caso de la investigación en Documentación en España. Se realizó un estudio exploratorio, tomando datos del repositorio E-LIS y de la fuente de datos bibliométricos IN-RECS. Se identificaron aquellos artículos publicados durante el período 1991-2002 en revistas que no ofrecían acceso abierto y se comprobó si habían sido depositados en E-LIS, cotejando luego el impacto de esos artículos en función del número de citas recibidas. Por último, se observó qué porcentaje de los artículos más citados según esta fuente estaban disponibles en acceso abierto. Los resultados reflejan en el caso español y en nuestra disciplina un estadio aún incipiente del uso de los repositorios y el autoarchivo, lo que no permite establecer en ese periodo una correspondencia positiva directa entre acceso abierto e impacto de la investigación.


1 Introducción

1.1 Implicación de los autores

Una de las estrategias que se distinguen en el movimiento open access es el depósito de los artículos por parte de los propios autores o self-archiving, la conocida como "ruta verde". Ésta además es la tendencia que mayor desarrollo ha experimentado en los últimos años, con la progresiva creación de repositorios temáticos y, sobre todo, con los repositorios institucionales que diversas universidades y centros de investigación se van encargando de poner en marcha y promover.

También es un hecho patente el creciente interés por conocer la percepción que tienen los autores sobre el movimiento open access.  Varios estudios se han propuesto últimamente analizar la predisposición, razones y prejuicios por las que los autores pueden verse inclinados a exponer sus trabajos de forma accesible para todos.

Frente a algunas dificultades existentes para su desarrollo (especialmente relacionadas con aspectos de propiedad intelectual, calidad de los trabajos depositados y la preservación de los documentos una vez almacenados) es conveniente tener en cuenta lo que para algunos es el verdadero obstáculo: mejorar la percepción de los autores de estos repositorios y acercarlos a esta nueva vía de difusión científica. Alice Keefer (2005) ha sistematizado las razones de esta resistencia de los autores en función de varias encuestas, y ha destacado las siguientes:

En las encuestas publicadas hasta la fecha sobre la predisposición de los autores a depositar sus trabajos en plataformas de acceso abierto los datos muestran una aceptación relativamente alta por parte de éstos a cumplir un hipotético mandato de sus instituciones a observar este procedimiento de comunicación científica. Y, sin embargo, algunos estudios cifran en sólo un 15 % el autoarchivo de forma espontánea (Harnard, 2006). Ello ha llevado a varias instituciones a crear sus propios repositorios y plantear el imperativo de que sus investigadores pongan a disposición sus trabajos. Esta decisión efectivamente parece haber dado sus frutos en determinados repositorios en lo que se refiere a porcentaje de trabajos disponibles; es el caso de instituciones como European Organization for Nuclear Research (CERN), Queensland University of Technology en Australia, o Universidade do Minho en Portugal, por ejemplo.

En cualquier caso, otros autores no descartan la posibilidad de que la mayor o menor costumbre de alimentar repositorios institucionales no pueda relacionarse directamente con una adhesión o rechazo a los principios del movimiento open access, sino simplemente con el cumplimiento de la realidad digital de intercambio de recursos. Según Antelman (2006), el grado en que se involucran tiene más que ver con las características de investigación de cada una de las disciplinas científicas. En concreto, en las ramas de ciencias sociales, donde se enmarca la Información y Documentación, se tiende a desarrollar un nivel menor de dependencia mutua entre los distintos investigadores que el que se da en las ciencias básicas, lo que también implicaría una menor disposición o una rutina menos extendida del  intercambio de los artículos previos a su publicación.

A pesar de ello, esta misma autora señala que precisamente en estas ramas del conocimiento con un marcado carácter interdisciplinar, "los autores tienen ―y desean tener— lectores procedentes de otros dominios de la ciencia, lo que puede funcionar como un incentivo para que autoarchiven sus trabajos en repositorios" (Antelman, 2006).

En este escenario no parece probable que las distintas materias vayan a estar cubiertas de igual modo por los archivos de acceso abierto. Por tanto, será especialmente complejo y revelador establecer comparaciones discriminando qué punto exacto de protagonismo tienen los autores y qué papel cumplen la naturaleza de cada disciplina y la realidad editorial de cada una de ellas.  


1.2 Acceso abierto e impacto de la investigación

Desde un punto de vista teórico, uno de los principales fines o efectos que se busca con la extensión de los archivos abiertos es el demandado abaratamiento de la publicación y consulta de las revistas científicas; la otra gran meta es el consecuente aumento de la visibilidad e impacto inherentes al propio hecho de que los artículos estén más accesibles.

Con respecto a la relación entre archivo abierto y aumento del impacto de las investigaciones cabe señalar que varias investigaciones apuntan que esta relación directa se produce efectivamente en la práctica. Según Melero (2005) "de acuerdo con los todavía pocos trabajos sobre el impacto de recursos OA, se ha puesto de manifiesto que el libre acceso a través de internet a los artículos científicos aumenta el número de citas que reciben frente a los que su acceso es restringido". En esa misma línea, otros autores también han identificado una relación directa entre ambos conceptos (Antelman, 2004; Lawrence, 2001; Harnard & Brody, 2004, etc.).

Con todo, existen particularidades del modo de citación de recursos digitales que han de ser consideradas para establecer una correspondencia entre acceso abierto y aumento del impacto. Según Craig (2007), varios elementos han conducido a sobredimensionar el efecto real del acceso abierto en el impacto de las publicaciones. Uno de ellos es el llamado selection bias  o "sesgo selectivo", esto es, que los mejores artículos tienen más probabilidad de ser puestos en línea. Dicho de un modo sencillo, hay determinados artículos que serán más citados que otros de forma natural, independientemente de cualquier atributo o condición de éstos referido a su soporte o a su medio de difusión. El sesgo en la selección puede darse tanto por parte de los autores (que preferirán poner en línea sus artículos de más calidad) como por parte de los editores (que pueden preferir poner en línea artículos que poseen una determinada cualidad, no necesariamente la calidad). A este sesgo hay que sumar, por ejemplo, que los artículos con mayor número de autores tendrán más posibilidades de ser depositados en repositorios.

Uno de los estudios pioneros que analizaba el efecto del depósito de artículos en repositorios digitales frente a la publicación convencional en revistas fue desarrollado por Harnard y Brody (2004). En este trabajo se establecía una relación causal positiva entre acceso abierto e impacto; sin embargo, otros autores (Craig, 2007) han tildado de poco sostenible esta conclusión, debido a la distorsión que se produce en la selección de las muestras de publicaciones y a la imposibilidad de controlar todas las variables que pueden entran en juego al citar un artículo. Afirman, por ejemplo, que los artículos que han sido puestos en acceso abierto en el mismo año pueden haber estado expuestos un intervalo de tiempo muy distinto —tanto como once meses— y figurar como depositados simultáneamente. Este efecto puede disminuirse si se amplia la cobertura temporal del experimento o si se cuenta con datos más precisos sobre su depósito, aspecto que muchos repositorios facilitan.

Otro factor importante en el estudio de esta relación es desde cuándo se debe empezar a contar las citas de los artículos que están en acceso abierto. En este sentido, parece haber cierto consenso en que se debe empezar antes para los artículos cuyo preprint se ha depositado en algún repositorio antes de aparecer en una revista.

En definitiva, desde diversos ámbitos se insta a que la cuestión del aumento del impacto de una investigación en función de su disponibilidad en repositorios se analice desde una perspectiva integral, de modo que queden contemplados y detallados los distintos elementos implicados en todo el proceso, entendido éste como un fenómeno complejo y multidimensional.

Sin duda, determinadas manifestaciones vertidas en algunos trabajos aparecen cargadas de escepticismo. Desde esa óptica, pretender comprobar que los artículos científicos que están en acceso abierto son más citados sería no sólo sobreestimar una intuición, sino negar la capacidad de los investigadores para distinguir la importancia real de un artículo en base a otros criterios de calidad más objetivos que, además, llevan mucho tiempo siendo la esencia misma del sistema de publicación de la ciencia.

Es preciso resaltar que algunas de las carencias que se le achacan a estudios anteriores parecen surgir de un análisis ajustado y coherente del objeto de estudio; pero es precisamente debido a ello por lo que, desde nuestra opinión, existe aún mucho lugar para el análisis de las distintas variables y para el desarrollo más preciso de las repercusiones reales que para el impacto de los trabajos de investigación tiene el acceso abierto.


2 Objetivos y alcance del estudio

El objetivo de este estudio es ofrecer un panorama exploratorio inicial del acceso abierto a la comunicación científica en la investigación sobre Información y Documentación. Los datos que se aportarán son los primeros de una investigación recientemente iniciada que pretende observar cómo se va introduciendo y qué cambios va generando este nuevo hábito de uso de la información científica en nuestro ámbito. En esta ocasión se van a abordar los siguientes puntos:


3 Metodología

Para llevar a cabo este estudio en la recogida de datos se han empleado básicamente dos recursos: un repositorio temático —E-LIS— y una fuente de datos bibliométricos —IN-RECS—. Ambos constituyen a pesar de su novedad dos puntos de referencia básicos en la disciplina de Información y Documentación.

El repositorio especializado E-LIS (E-prints in Library and Information Science) <http://eprints.rclis.org/> es un archivo abierto dedicado a este ámbito del conocimiento que forma parte del proyecto RCLIS (Research in Computing, Library and Information Science) (Subirats Coll; Barrueco, 2004). Fue el primero de su naturaleza en España y se creó en enero de 2003 para difundir la filosofía open access en esta disciplina. Posibilita el autoarchivado a todos los profesionales de la Documentación que quieran publicar o dar acceso libre en internet a sus documentos; el único requisito es registrarse.

Una de las señas de identidad que lo diferencian de otros recursos afines es que posee un equipo de personal especialista y universitario que lleva a cabo una primera revisión de los trabajos depositados, lo que redunda en la propia fiabilidad del repositorio. En los últimos años este archivo ha experimentado un importantísimo crecimiento y su vigencia como punto de referencia en la investigación en Información y Documentación lo hacía una fuente de datos muy fiable para los objetivos de este estudio.  

Por otro lado, IN-RECS (Índice de impacto de las revistas españolas de Ciencias Sociales) <http://ec3.ugr.es/in-recs/> fue la fuente de datos bibliométricos escogida para este estudio. Las razones para esta elección eran bastante claras, teniendo en cuenta el objeto que se pretendía estudiar y las conocidas limitaciones que para ello tendría el uso de las bases de datos de ISI Web of Knowledge —escasa presencia de la investigación publicada en España y en castellano y  menor representatividad de las revistas de nuestra disciplina—. Para un conjunto de ramas sociales entre las que se encuentra Biblioteconomía y Documentación, IN-RECS permite, conocer entre otras informaciones:

Varias cuestiones guiaron el desarrollo de esta investigación. En primer lugar, la implicación por parte de los autores de nuestra disciplina en la práctica de inclusión de sus trabajos en repositorios temáticos de acceso abierto. Se tomaron los datos de las revistas más citadas, según el ranking ofrecido por IN-RECS, que no ofrecían acceso abierto a los fondos publicados en el periodo comprendido entre 1991 y 2002. La exclusión para este estudio de las revistas que sí ponían directamente a disposición los artículos publicados en ese tiempo se justifica puesto que precisamente lo que se intentaba pulsar era el grado de aceptación de los autores de forma voluntaria de esta nueva vía de difusión de la información. Finalmente, las revistas incluidas como fuente de los artículos fueron las siguientes:

El profesional de la información
Revista española de documentación científica
Documentación de las ciencias de la información
Boletín de la ANABAD
Ítem. Revista de biblioteconomia i documentació
Revista general de información y documentación
Aabadom. Revista de la Asociación Asturiana de Bibliotecarios, Archiveros, Documentalistas y Museólogos
Bilduma. Revista del Servicio de Archivo del Ayuntamiento de Rentaría
Lligall. Revista catalana d'arxivística
Scire. Representación y organización del conocimiento
Tabula. Revista de archivos de Castilla y León

Tabla 1. Relación de revistas-fuente incluidas en el estudio

En segundo lugar, se extrajeron datos para sondear la posible influencia del acceso abierto en el factor de impacto de las publicaciones, traducido al análisis de las citas —número y fecha de citación— de los artículos de esas revistas que sí estaban volcados en E-LIS. Se tomaron los años 1991-2002 puesto que las citas en las disciplinas de ciencias sociales son menos inmediatas que en otras ciencias.

Por otro lado, y en parte debido al limitado número de artículos que cumplían la condición de ese subgrupo (sólo 38), se abordó la cuestión del impacto relacionado con el acceso abierto desde otra perspectiva. Se optó por analizar los 225 artículos más citados en Información y Documentación. Se pasó a comparar algunos parámetros de este subconjunto, como por ejemplo el porcentaje de estos artículos que había sido publicado por alguna de las revistas que habíamos seleccionado. Además se comprobó cuáles de esos 225 artículos estaban en E-LIS, desde cuándo y si las citas habían sido posteriores a esta inclusión.

En definitiva, se trataba de observar la cuestión en base a los datos disponibles en este momento, donde dado el relativo poco tiempo transcurrido desde la puesta en marcha de E-LIS aún parecía aventurado establecer conclusiones respecto a las variaciones de citación. Por tanto, además de comprobar si estar en E-LIS (circunstancia que se puede fechar) había repercutido en su citación, se planteó desde la otra orientación, esto es, si estar incluidos entre los más citados motiva o induce a su inclusión en archivo abierto, como se había sugerido al reseñar una mayor probabilidad de inclusión de los trabajos con más calidad en repositorios abiertos.

Por último, y para seguir estudiando esta circunstancia, se comprobó si esos 225 artículos estaban accesibles de forma libre, no sólo en el repositorio E-LIS. Ello se hizo adaptando la metodología del citado artículo de Antelman (2006), verificando su disponibilidad realizando búsquedas con el título completo como frase exacta en el buscador Google. Con la lista de resultados devuelta por este buscador, se tomaba como referencia el primero de ellos en el que se ofreciera el texto completo de los artículos en cualquier formato. Se trataba de desglosar las distintas posibilidades y características de acceso abierto mediante las que se podía tener acceso a un artículo, siendo ésta forma de consulta directa en Google una de las más empleadas en la búsqueda de artículos concretos.


4 Resultados

4.1 Artículos en E-LIS de las revistas seleccionadas

De los números publicados entre 1991 y 2002 de las once revistas referenciadas sólo se localizaron en E-LIS 38 artículos, que además sólo pertenecían a seis de esas once revistas: El Profesional de la información (15) Item (8), Documentación de las ciencias de la información (6), Revista general de información y documentación (4) Revista española de documentación científica (3), Boletín de la ANABAD (2).

Este dato da muestra de una escasa implicación, por el momento, de los autores en depositar sus trabajos pasados en el citado repositorio. El número de artículos recuperados fue muy inferior al esperado cuando se inició la investigación; respondía a un ínfimo porcentaje con respecto al total de artículos publicados por esas revistas en ese periodo: sólo el 1,62 %.

En lo que se refiere al año de publicación de los 38 artículos incluidos se observó un considerable aumento de los artículos publicados a partir de 1999. Y no se encontró ningún artículo perteneciente a esas revistas entre los años 1991 y 1995.

En cuanto al año de inclusión en E-LIS, se producía un salto cuantitativo a partir de 2006, que probablemente sea continuado en años posteriores dada la tendencia progresiva observada. Hay que señalar que estos datos fueron recogidos en los meses de septiembre y octubre de 2007. La práctica totalidad de los artículos (37 de ellos)  había sido incluida en E-LIS por sus propios autores.

Figura 1. Año de inclusión en E-LIS de los artículos publicados entre 1991-2002

Figura 1. Año de inclusión en E-LIS de los artículos publicados entre 1991-2002


El número de artículos del periodo seleccionado aparecidos en las revistas incluidas que habían recibido citas hasta la fecha (octubre de 2007) según IN-RECS era menos de la mitad (representaban un 44,7 %) y sólo uno de ellos había obtenido más de dos citas. Además sólo se pudo certificar que dos de ese número total de citas (28) habían sido emitidas con posterioridad a su inclusión en E-LIS, lo que impide establecer ninguna inferencia causal. Por último, sólo nueve de esos artículos (un 23,7 %) estaba incluido en la lista de los artículos más citados de la disciplina.  

Nº citas recibidasArtículos% de artículos
02155,3
1821,1
2821,1
312,6
 38100,0

Tabla 2. Citas en IN-RECS de los artículos seleccionados


4.2 Los artículos más citados en la disciplina y su presencia en E-LIS

A continuación se analizó el conjunto de los artículos más citados en  Biblioteconomía y Documentación en función de la lista ofrecida en IN-RECS. De este conjunto, 167 artículos (72,4 %) habían sido publicados en el grupo de once revistas seleccionadas para el estudio y en el período de tiempo analizado, lo que incide en la verificación de que la muestra de revistas escogida tenía una calidad muy representativa en cuanto a la investigación en la disciplina.

De estos 167 artículos, el 5,4 %, habían sido volcados en E-LIS, lo cual representa un  porcentaje ligeramente superior al de artículos totales publicados en esas revistas durante los años analizados (1,62 %). Este promedio aumentaba si no se tomaba en consideración el grupo de revistas fuente de este estudio, de modo que del total de 225 artículos más citados 27 de ellos (12 %) sí había sido incluido en E-LIS.

Dentro de éste último segmento, el 37 % de ellos había recibido citas con fecha posterior a su inclusión en E-LIS.


4.3 Los artículos más citados y su disponibilidad en acceso abierto

Según algunos estudios (Antelman 2006) el 75 % de los investigadores utilizan Google como primera vía para localizar artículos, lo que definitivamente conlleva a pensar que hay muchos más investigadores partidarios de la filosofía open access como consumidores de información que como productores de información. Para probar tanto la disponibilidad de los 225 artículos más citados como para analizar los medios en los que éstos son más visibles, se adaptó la metodología ya mencionada de búsqueda de los citados artículos en Google, tomando la referencia del primer resultado que devolvía el texto completo de los artículos. Hay que destacar que, salvo excepciones puntuales, todos los artículos que fueron localizados figuraban dentro de los primeros diez resultados que ofrecía el buscador.

Se comprobó que la gran mayoría (el 80 %) de los artículos más citados en Biblioteconomía y Documentación según IN-RECS está disponible en libre acceso de uno u otro modo, aunque no fuese necesariamente en repositorios o archivos abiertos como tales.

Se estableció una serie de categorías para clasificar los distintos tipos de fuentes, que más que ofrecer un censo o recuento, en realidad da pie a establecer relaciones con la visibilidad y el posicionamiento web de los recursos de información. En concreto se diferenció entre artículos encontrados en las propias revistas de publicación, en repositorios temáticos, en páginas institucionales y personales, acceso a través de recolectores, y acceso mediante otros sistemas (como sistemas de información referencial que ofrecían el enlace al texto completo desde otro recurso o de gestión de contenidos).

Otro de los datos más reseñables, junto con el ya comentado de que mayoritariamente es posible acceder a los artículos más citados de forma libre, es por tanto la heterogeneidad de las diversas fuentes posibles resultantes para localizar los artículos al margen de los que eran ofrecidos desde las páginas de las revistas.

Figura 2. Disponibilidad de los artículos más citados en función del tipo de recurso

Figura 2. Disponibilidad de los artículos más citados en función del tipo de recurso


5 Conclusiones

Como se ha comentado anteriormente, y especialmente tras los resultados obtenidos, el objetivo de este estudio no era establecer leyes de causalidad entre acceso abierto e impacto de la investigación. Se ha procurado, en todo caso, sondear el estado y ofrecer una fotografía de la situación actual en la disciplina de Información y Documentación, partiendo de la práctica real de los autores de archivar sus trabajos en repositorios institucionales y de la disponibilidad de los artículos de forma libre.

Este trabajo se enmarca por tanto como otro punto de contacto con la exploración de las consecuencias del acceso abierto. A priori, parece darse por sentado que a mayor facilidad de acceso, mayor visibilidad; que ello derive en mayor factor de impacto para las publicaciones que se acojan a esta modalidad es aún una cuestión por delimitar, no sólo debido a que en la propia esencia del conocimiento científico figura la relevancia imprescindible  de la excelencia de los resultados científicos, independientemente del formato o medio de las publicaciones. También porque supone nuevos retos, dadas las propias características del análisis de citas en este medio, donde hay que concretar las implicaciones de otros factores (particularidades de citación de cada disciplina, extensión y aceptación de los repositorios, nuevos indicadores de consulta de documentos y variables de acceso y citación, especialmente temporales, etc.). 

A todo ello en el caso de la investigación española en Información y Documentación hay que añadir que estamos en un momento de despegue del fenómeno y nos hemos encontrado con dificultades para encontrar aún datos suficientes para análisis más certeros.

En cuanto a los resultados obtenidos hay que señalar el escaso porcentaje de artículos depositados en E-LIS del total de revistas fuente consultadas, aspecto que también puede experimentar mejoras con una mayor información sobre el copyright de los artículos y con actividades encaminadas a extender y familiarizar a los autores con este hábito.

Sin embargo, era considerable el aumento de ese porcentaje de artículos volcados de los 225 más citados (12 %); este aspecto puede incitar a pensar que efectivamente, los artículos de mayor relevancia tienen más posibilidades de ser incluidos en archivos abiertos, lo que por un lado, redunda en la calidad de éstos; pero, por otro lado, será una cuestión a tener en cuenta a la hora de establecer relaciones de dependencia entre acceso abierto y mayor impacto. En definitiva, sería conveniente estudiar si existe de hecho un sesgo de selección en los recursos.

Por último, también nos parece destacable el elevado grado de accesibilidad de los artículos más citados en la especialidad (80 %) y la importancia y vinculación de este aspecto con las técnicas de posicionamiento web, donde los repositorios temáticos e institucionales han de tomar partido frente a la existencia de otro tipo de herramientas de recuperación de información.


6 Bibliografía

Abad García, M. F.; González Teruel, A.; Martínez Catalán, C. (2006). "Acceso abierto y revistas médicas españolas". Medicina clínica, vol. 127, n.º 12, p. 456–464.

Antelman, K. (2004). "Do open-access articles have a greater research impact?". College & research libraries, vol. 65, no. 3, p. 372–382.

Antelman, K. (2006). "Self-archiving practice and the influence of publisher policies in the social sciences". Learned publishing, vol. 19, no. 2, p. 85–95.

Craig, I. D. et al. (2007). "Do open access articles have greater citation impact? A critical review of the literature". Journal of informetrics, vol. 1, no. 3, p. 239–248.

Harnad, S.; Brody, T. (2004). "Comparing the impact of open access (OA) vs. non-OA articles in the same journals". D-lib magazine, vol. 10, no. 6. <http://www.dlib.org/dlib/june04/harnad/06harnad.html>. [Consulta: 28/02/2008].

Harnard, S. (2006). "Maximizing research impact through institutional and national open-access self archiving mandates". Current research information systems. <http://eprints.ecs.soton.ac.uk/12093/2/harnad-crisrev.pdf>. [Consulta: 28/02/2008].

Keefer, Alice (2005). "Aproximació al moviment 'open access'". BiD: textos universitaris de biblioteconomia i documentació, núm. 15 (desembre 2005). <http://bid.ub.edu/15keefer.htm>. [Consulta: 28/02/2008].

Lawrence, S. (2001). "Free online availability substantially increases a paper's impact". Nature, vol. 411, no. 6837, p. 521.

Medeiros, N. (2004). "A repository of our own: the E-LIS e-prints archive". OCLC systems & services: international digital library perspective, vol. 20, no. 2, p. 58–60.

Melero, Remedios (2005). "Acceso abierto a las publicaciones científicas: definición, recursos, copyright e impacto". El profesional de la información, vol. 15, n.º 4, p. 255–266.

Subirats Coll, I.; Barrueco, J. M. (2004). "Un archivo abierto en ciencias de la documentación e información". El profesional de la información, vol. 13, n.º 5, p. 346–352.


Fecha de recepción: 28/01/2008. Fecha de aceptación: 04/03/2008.