[Versión castellana]

José Antonio Frías , Críspulo Travieso Rodríguez

Departamento de Biblioteconomía y Documentación
Universidad de Salamanca

frias@usal.es, ctravieso@usal.es




Resum [Resumen] [Abstract]

L'objectiu d'aquest treball és estudiar l'accés obert, la generalització i l'impacte de la recerca en documentació a Espanya. S'ha dut a terme un estudi exploratori, a partir de les dades del dipòsit E-LIS i de la font de dades bibliomètriques IN-RECS. S'han identificat els articles publicats durant el període 1991–2002 en revistes que no oferien accés obert i s'ha comprovat si havien estat dipositats en l'E-LIS. Després, s'ha comparat l'impacte d'aquests articles segons el nombre de citacions rebudes. Finalment, s'ha observat quin percentatge dels articles més citats segons aquesta font estaven disponibles en accés obert. Els resultats reflecteixen en el cas espanyol i en la nostra disciplina un estadi encara incipient de l'ús dels dipòsits i de l'autoarxivament, la qual cosa no permet d'establir per al període analitzat una correspondència positiva directa entre l'accés obert i l'impacte de la recerca.


1 Introducció

1.1 Implicació dels autors

Una de les estratègies que es distingeixen en el moviment d'accés obert és el dipòsit dels articles per part dels mateixos autors (o self-archiving), estratègia coneguda com a ruta verda. Aquesta tendència és la que ha experimentat un creixement més gran en els últims anys, amb la progressiva creació de dipòsits temàtics i, sobretot, dipòsits institucionals, que diverses universitats i centres de recerca s'han encarregat d'anar posant en marxa i de promoure.

També és un fet patent l'interès creixent per conèixer la percepció que tenen els autors sobre el moviment d'accés obert. Diversos estudis s'han proposat, últimament, analitzar la predisposició, les raons i els prejudicis que tenen els autors a l'hora que els seus treballs siguin accessibles per a tothom.

Davant les dificultats existents per al seu desenvolupament (especialment relacionades amb aspectes de propietat intel·lectual, de qualitat dels treballs dipositats i de preservació dels documents una vegada emmagatzemats), és convenient tenir en compte el que per a alguns és el verdader obstacle: millorar la percepció que tenen els autors sobre els dipòsits i apropar-los a aquesta nova via de difusió científica.

Alice Keefer (2005) ha sistematitzat les raons que, segons diverses enquestes, propicien aquesta resistència dels autors, i n'ha destacat les següents:

Les dades de les enquestes publicades fins avui sobre la predisposició dels autors a dipositar els treballs en plataformes d'accés obert, mostren una acceptació relativament alta dels autors a complir el mandat hipotètic de les seves institucions d'observar aquest procediment de comunicació científica. Tanmateix, alguns estudis xifren en només un 15 % l'autoarxivament de manera espontània (Harnard, 2006). Aquest fet ha portat diverses institucions a crear els propis dipòsits i plantejar l'imperatiu que els seus investigadors hi posin a disposició els treballs. Aquesta decisió, efectivament, sembla haver donat els seus fruits en determinats dipòsits, quant a percentatge de treballs disponibles; és el cas d'institucions com ara l'European Organization for Nuclear Research (CERN), la Queensland University of Technology a Austràlia o la Universidade do Minho a Portugal.

En qualsevol cas, altres autors no descarten la possibilitat que el costum més o menys gran d'alimentar dipòsits institucionals no pugui relacionar-se directament amb una adhesió o un rebuig als principis del moviment d'accés obert, sinó simplement amb el compliment de la realitat digital d'intercanvi de recursos. Segons Antelman (2006), el grau en què s'involucren té més a veure amb les característiques d'investigació de cada una de les disciplines científiques. En concret, en les branques de ciències socials, en què s'emmarca la informació i documentació, es tendeix a establir-se un grau de dependència mútua entre els diferents investigadors menor que el que es dóna en les ciències bàsiques, cosa que també implica una disposició menor o una rutina menys estesa de l'intercanvi dels articles previs a la publicació.

Malgrat això, aquesta mateixa autora assenyala que, precisament en aquestes branques del coneixement amb un caràcter interdisciplinari marcat, "authors have —and desire to have— readers from related disciplines […]. This pursuit of a broad audience could be an incentive for some authors to self-archive" (Antelman, 2006).

En aquest escenari no sembla probable que els arxius d'accés obert hagin de cobrir de la mateixa manera les diferents matèries. Per tant, és especialment complex, però revelador, establir comparacions que determinin el punt exacte de protagonisme que tenen els autors i el paper que tenen la naturalesa de cada disciplina i la realitat editorial de cada una.


1.2 Accés obert i impacte de la investigació

Des d'un punt de vista teòric, una de les finalitats o efectes principals que es busca amb l'extensió dels arxius oberts és l'abaratiment demanat de la publicació i la consulta de les revistes científiques. L'altra gran meta és l'augment consegüent de la visibilitat i l'impacte inherents al fet que els articles siguin més accessibles.

Pel que fa a la relació entre arxiu obert i augment de l'impacte de la recerca, es pot assenyalar que diverses investigacions apunten que aquesta relació directa es produeix, efectivament, a la pràctica. Segons Melero (2005), "de acuerdo con los todavía pocos trabajos sobre el impacto de recursos OA, se ha puesto de manifiesto que el libre acceso a través de Internet a los artículos científicos aumenta el número de citas que reciben frente a los que su acceso es restringido". En aquesta mateixa línia, altres autors també han identificat una relació directa entre els dos conceptes (Antelman, 2004; Lawrence, 2001; Harnard; Brody, 2004; etc.).

Amb tot, per establir una correspondència entre l'accés obert i l'augment de l'impacte, cal considerar les particularitats de la manera de citar els recursos digitals. Segons Craig (2007), diversos elements han conduït a sobredimensionar l'efecte real de l'accés obert en l'impacte de les publicacions. Un d'aquests elements és l'anomenat biaix de selecció (o selection bias), és a dir, que els millors articles tenen més probabilitat de posar-se en línia. Dit d'una manera senzilla, hi ha determinats articles que se citaran més que d'altres de manera natural, independentment de qualsevol atribut o condició que presentin pel que fa al suport o al mitjà de difusió. El biaix de selecció pot donar-se tant pels autors (que prefereixen oferir en línia els articles de més qualitat) com pels editors (que poden preferir oferir en línia articles amb una qualitat determinada, no necessàriament la qualitat màxima). A aquest biaix, cal sumar-hi, per exemple, que els articles amb un nombre d'autors més gran tindran més possibilitats de ser arxivats en dipòsits.

Harnard i Brody (2004) van desenvolupar un dels estudis pioners que analitzava l'efecte de l'arxivament d'articles en dipòsits digitals davant la publicació convencional en revistes. Aquest treball establia una relació causal positiva entre l'accés obert i l'impacte; tanmateix, altres autors (Craig, 2007) han titllat de poc sostenible aquesta conclusió, a causa de la distorsió que es produeix en la selecció de les mostres de publicacions i de la impossibilitat de controlar totes les variables que poden entrar en joc en citar un article. Afirmen, per exemple, que els articles que s'ofereixen en accés obert el mateix any poden haver estat exposats durant un interval de temps molt diferent —tant com onze mesos— i figurar com a dipositats simultàniament. Aquest efecte pot disminuir-se si s'amplia la cobertura temporal de l'experiment o si es tenen dades més precises sobre l'arxivament, aspecte que molts dipòsits faciliten.

Un altre factor important en l'estudi d'aquesta relació és des de quan s'han de començar a comptar les citacions dels articles que s'ofereixen en accés obert. En aquest sentit, sembla que hi ha un cert consens sobre el fet que s'ha de començar abans pels articles l'edició preliminar (o preprint) dels quals s'ha arxivat en algun dipòsit abans d'aparèixer en una revista.

En definitiva, des de diversos àmbits s'insta que la qüestió de l'augment de l'impacte d'una investigació segons la disponibilitat en dipòsits s'analitzi des d'una perspectiva integral, de manera que quedin previstos i detallats els diversos elements implicats en tot el procés, entès com un fenomen complex i multidimensional.

Sens dubte, determinades manifestacions recollides en alguns treballs apareixen carregades d'escepticisme. Des d'aquesta òptica, pretendre comprovar que els articles científics que hi ha en accés obert són més citats implica no només sobreestimar una intuïció, sinó negar la capacitat dels investigadors per distingir la importància real d'un article a partir d'altres criteris de qualitat més objectius que, a més, fa molt temps que són l'essència mateixa del sistema de publicació de la ciència.

S'ha de destacar que algunes de les mancances que se li atribueixen en estudis anteriors semblen sorgir d'una anàlisi ajustada i coherent de l'objecte d'estudi; però, precisament a causa d'això, som de l'opinió que encara hi ha molt espai per a l'anàlisi de les diferents variables i per al desenvolupament més precís de les repercussions reals que l'accés obert té en l'impacte dels treballs d'investigació.


2 Objectius i abast de l'estudi

L'objectiu d'aquest estudi és oferir un panorama exploratori inicial de l'accés obert a la comunicació científica en la recerca sobre informació i documentació. Les dades que s'aporten són les primeres d'una investigació iniciada recentment que pretén d'observar com es va introduint i quins canvis va generant aquest nou hàbit d'ús de la informació científica en el nostre àmbit. En aquesta ocasió, s'aborden els punts següents:


3 Metodologia

Per dur a terme aquest estudi, s'han emprat bàsicament dos recursos en la recollida de dades: un dipòsit temàtic —E-LIS— i una font de dades bibliomètriques —IN-RECS. Els dos recursos constitueixen, malgrat la novetat, dos punts de referència bàsics en la disciplina d'informació i documentació.

El dipòsit especialitzat E-LIS (E-prints in library and information science) <http://eprints.rclis.org> és un arxiu obert dedicat a aquest àmbit del coneixement que forma part del projecte RCLIS (Research in Computing, Library and Information Science). Va ser el primer d'aquesta naturalesa a Espanya i es va crear el gener de 2003 per difondre la filosofia d'accés obert en aquesta disciplina (Subirats Coll; Barrueco, 2004). Possibilita l'autoarxivament a tots els professionals de la documentació que vulguin publicar o alliberar a Internet els seus documents; l'únic requisit és registrar-se.

Un dels signes d'identitat que el diferencien d'altres recursos afins és que té un equip de personal especialista i universitari al darrere que duu a terme una primera revisió dels treballs dipositats, cosa que redunda en benefici de la mateixa fiabilitat del dipòsit. Els últims anys, aquest arxiu ha experimentat un creixement importantíssim, i la vigència com a punt de referència de la recerca en informació i documentació el fa una font de dades molt fiable per als objectius d'aquest estudi.

D'altra banda, IN-RECS (Índice de impacto de las revistas españolas de ciencias sociales) <http://ec3.ugr.es/in-recs> és la font de dades bibliomètriques escollida per a aquest estudi. Les raons per a aquesta elecció són prou clares, tenint en compte l'objecte d'estudi i les limitacions conegudes que, a aquest efecte, té l'ús de les bases de dades de l'ISI web of knowledge <http://www.accesowok.fecyt.es/login>, que són la presència escassa de la investigació publicada a Espanya i en castellà, i la poca representativitat de les revistes de la nostra disciplina. Per a un conjunt de branques socials entre les quals hi ha biblioteconomia i documentació, l'IN-RECS permet de conèixer, entre altres informacions, les següents:

Diverses qüestions han guiat el desenvolupament d'aquesta investigació. En primer lloc, la implicació dels autors de la nostra disciplina a la pràctica d'incloure els treballs en dipòsits temàtics d'accés obert. S'han pres les dades de les revistes més citades, segons el rànquing de l'IN-RECS, que no oferien accés obert als fons publicats en el període comprès entre 1991 i 2002. L'exclusió d'aquest estudi de les revistes que sí que posaven directament a disposició els articles publicats en aquell període està justificada, ja que precisament el que s'intenta detectar és el grau d'acceptació voluntària que tenen dels autors pel que fa a aquesta nova via de difusió de la informació. Finalment, les revistes incloses com a font dels articles són les següents:

El profesional de la información
Revista española de documentación científica
Documentación de las ciencias de la información
Boletín de la ANABAD
Ítem. Revista de biblioteconomia i documentació
Revista general de información y documentación
Aabadom. Revista de la Asociación Asturiana de Bibliotecarios, Archiveros, Documentalistas y Museólogos
Bilduma. Revista del Servicio de Archivo del Ayuntamiento de Rentaría
Lligall. Revista catalana d'arxivística
Scire. Representación y organización del conocimiento
Tabula. Revista de archivos de Castilla y León

Taula 1. Relació de revistes font incloses en l'estudi

En segon lloc, s'han extret dades per sondejar la possible influència de l'accés obert en el factor d'impacte de les publicacions, traduït a l'anàlisi de les citacions —número i data de citació— dels articles d'aquestes revistes que sí que s'havien bolcat en l'E-LIS. S'han triat els anys 1991–2002 ja que les citacions en les disciplines de ciències socials són menys immediates que en altres ciències.

D'altra banda, en part a causa del nombre limitat d'articles que compleixen la condició d'aquest subgrup (només 38), s'ha abordat la qüestió de l'impacte relacionat amb l'accés obert des d'una altra perspectiva. S'ha optat per analitzar els 225 articles més citats en informació i documentació. S'han comparat alguns paràmetres d'aquest subconjunt, per exemple, el percentatge d'articles que havia publicat alguna de les revistes seleccionades. A més, s'han comprovat quins dels 225 articles s'havien dipositat en l'E-LIS, des de quan i si les citacions havien estat posteriors a aquesta inclusió.

En definitiva, es tracta d'observar la qüestió a partir de les dades disponibles en aquest moment, i atès el relatiu poc temps transcorregut des de la posada en marxa de l'E-LIS encara sembla arriscat d'establir conclusions respecte a les variacions de citació. Per tant, a més de comprovar si el fet que un treball estigui dipositat en l'E-LIS (circumstància que es pot datar) repercuteix en la citació, el plantejament es fa també des de l'altra orientació, és a dir, si el fet que el treball estigui inclòs entre els més citats en motiva o indueix la inclusió en un arxiu obert, com s'havia suggerit en ressenyar una probabilitat més gran d'incloure en dipòsits oberts els treballs amb més qualitat.

Finalment, i per continuar estudiant aquesta circumstància, s'ha comprovat si aquests 225 articles eren accessibles de manera lliure, no només al dipòsit E-LIS. Això s'ha fet adaptant la metodologia de l'article d'Antelman (2006), verificant-ne la disponibilitat i duent a terme cerques amb el títol complet com a frase exacta al cercador Google. Amb la llista de resultats que retorna aquest cercador, s'ha pres com a referència el primer resultat que ofereix el text complet dels articles, en qualsevol format. Es tracta de desglossar les diverses possibilitats i característiques d'accés obert mitjançant les quals es pot accedir a un article. De fet, aquesta manera de consultar la informació directament a través del Google és una de les més emprades en la cerca d'articles concrets.


4 Resultats

4.1 Articles en l'E-LIS de les revistes seleccionades

Dels números publicats entre 1991 i 2002 de les onze revistes referenciades, en l'E-LIS només es localitzen 38 articles, que a més només pertanyen a sis d'aquestes revistes: El profesional de la información (15), Ítem (8), Documentación de las ciencias de la información (6), Revista general de información y documentación (4), Revista española de documentación científica (3) i Boletín de la ANABAD (2).

Aquesta dada mostra una implicació escassa, de moment, dels autors a dipositar els treballs antics en el dipòsit esmentat. El nombre d'articles recuperats era molt inferior a l'esperat quan es va iniciar la investigació; responia a un percentatge ínfim respecte al total d'articles publicats per aquestes revistes en aquell període: només l'1,62 %.

Pel que fa a l'any de publicació dels 38 articles inclosos, s'observa un augment considerable dels articles publicats a partir de 1999. D'altra banda, no es troba cap article en aquestes revistes entre els anys 1991 i 1995.

Quant a l'any d'inclusió en l'E-LIS, es produeix un salt quantitatiu a partir de 2006, que probablement sigui continuat en anys posteriors atesa la tendència progressiva observada. Cal assenyalar que aquestes dades es van recollir els mesos de setembre i octubre de 2007. Quasi la totalitat dels articles (37) els havien inclòs en l'E-LIS els mateixos autors.

Figura 1. Any d'inclusió en l'E-LIS dels articles publicats entre 1991 i 2002

Figura 1. Any d'inclusió en l'E-LIS dels articles publicats entre 1991 i 2002


El nombre d'articles del període seleccionat apareguts en les revistes incloses que havien rebut citacions fins a la data (octubre de 2007), segons l'IN-RECS era menys de la meitat (representava un 44,7 %) i només un dels articles havia obtingut més de dues citacions. A més, només es pot certificar que dues citacions (d'un total de 28) s'han emès posteriorment a la inclusió en l'E-LIS, cosa que impedeix d'establir cap inferència causal. Finalment, només nou d'aquests articles (un 23,7 %) s'havien inclòs en la llista d'articles més citats de la disciplina.

Nre. de citacions rebudesArticlesPercentatge d'articles
02155,3
1821,1
2821,1
312,6
 38100,0

Taula 2. Citacions en l'IN-RECS dels articles seleccionats


4.2 Els articles més citats en la disciplina i la presència en l'E-LIS

A continuació s'analitza el conjunt dels articles més citats en biblioteconomia i documentació segons la llista de l'IN-RECS. Del conjunt total, 167 articles (72,4 %) s'havien publicat al grup d'onze revistes seleccionades per a l'estudi i en el període de temps analitzat, cosa que incideix en la verificació que la mostra de revistes escollida tenia una qualitat molt representativa quant a la recerca en la disciplina.

D'aquests 167 articles, el 5,4 % s'havia bolcat en l'E-LIS, cosa que representa un percentatge lleugerament superior al d'articles totals publicats en aquestes revistes durant els anys analitzats (1,62 %). Aquesta mitjana augmenta si no es pren en consideració el grup de revistes font d'aquest estudi, de manera que, del total de 225 articles més citats, 27 (12 %) sí que s'havia inclòs en l'E-LIS.

En aquest últim segment, el 37 % havia rebut citacions amb data posterior a la inclusió en l'E-LIS.


4.3 Els articles més citats i la disponibilitat en accés obert

Segons alguns estudis (Antelman, 2006), el 75 % dels investigadors utilitzen el Google com a primera via per localitzar articles, la qual cosa fa pensar que hi ha molts més investigadors partidaris de la filosofia d'accés obert com a consumidors d'informació que com a productors d'informació. Tant per provar la disponibilitat dels 225 articles més citats com per analitzar els mitjans en els quals són més visibles, s'adapta la metodologia ja esmentada de cerca dels articles citats al Google, prenent la referència del primer resultat que retorna el text complet dels articles. Cal destacar que, llevat d'excepcions puntuals, tots els articles localitzats figuraven entre els primers deu resultats del cercador.

Es comprova que la gran majoria dels articles més citats en biblioteconomia i documentació (el 80 %) segons l'IN-RECS està disponible en lliure accés d'una manera o una altra, encara que no sigui necessàriament en dipòsits o arxius oberts.

S'estableixen una sèrie de categories per classificar els diferents tipus de fonts, que més que oferir un cens o recompte, en realitat dóna peu a establir relacions amb la visibilitat i el posicionament web dels recursos d'informació. En concret, es diferencia entre articles trobats en les mateixes revistes de publicació, en dipòsits temàtics, en pàgines institucionals i personals, en directoris o en altres sistemes (com ara sistemes d'informació referencial, que ofereixen l'enllaç al text complet des d'un altre recurs, o de gestió de continguts).

Una altra dada de les més ressenyables, juntament amb el fet ja comentat que majoritàriament és possible accedir als articles més citats lliurement, és l'heterogeneïtat de les diverses fonts possibles resultants per localitzar els articles, al marge de les pàgines de les revistes.

Figura  2. Disponibilitat dels articles més citats segons el tipus de recurs

Figura 2. Disponibilitat dels articles més citats segons el tipus de recurs


5 Conclusions

Com s'ha comentat anteriorment, i especialment després dels resultats obtinguts, l'objectiu d'aquest estudi no era establir lleis de causalitat entre l'accés obert i l'impacte de la recerca. S'ha procurat, en tot cas, sondejar l'estat i oferir una fotografia de la situació actual en la disciplina d'informació i documentació, a partir de la pràctica real dels autors d'arxivar els treballs en dipòsits institucionals i de la disponibilitat lliure dels articles.

Aquest treball s'emmarca, per tant, com un altre punt de contacte, en l'exploració de les conseqüències de l'accés obert. A priori, sembla donar-se per fet que, com més facilitat d'accés, més visibilitat. Que això derivi en un augment del factor d'impacte per a les publicacions que s'acullen a aquesta modalitat és encara una qüestió pendent de delimitar, no només a causa que, en la mateixa essència del coneixement científic, hi figura la rellevància imprescindible de l'excel·lència dels resultats científics, independentment del format o mitjà de les publicacions, sinó també perquè suposa reptes nous, ateses les característiques de l'anàlisi de citacions en aquest mitjà, que exigeix concretar les implicacions d'altres factors (particularitats de citació de cada disciplina, extensió i acceptació dels dipòsits, nous indicadors de consulta de documents, i variables d'accés i de citació, especialment temporals).

A tot això, en el cas de la investigació espanyola en informació i documentació, cal afegir-hi que estem en un moment d'enlairament del fenomen i hem topat amb dificultats per trobar dades suficients per a anàlisis més precises.

Quant als resultats obtinguts, cal assenyalar l'escàs percentatge d'articles dipositats en l'E-LIS del total de revistes font consultades, aspecte que també pot experimentar millores amb una major informació sobre el copyright dels articles i amb activitats encaminades a estendre aquest hàbit i familiaritzar-hi els autors.

Tanmateix, és considerable l'augment del percentatge d'articles bolcats dels 225 més citats (12 %). Això pot incitar a pensar que, efectivament, els articles de rellevància més gran tenen més possibilitats de ser inclosos en arxius oberts, cosa que, d'una banda, redunda en benefici de la seva qualitat; però, de l'altra, és una qüestió que s'ha de tenir en compte a l'hora d'establir relacions de dependència entre l'accés obert i un impacte més gran. En definitiva, és convenient estudiar si, de fet, hi ha un biaix de selecció en els recursos.

Finalment, també és destacable el grau elevat d'accessibilitat dels articles més citats en l'especialitat (80 %), i també la importància i la vinculació d'aquest aspecte amb les tècniques de posicionament web, en què els dipòsits temàtics i institucionals han de prendre partit davant d'altres tipus d'eines de recuperació d'informació.


6 Bibliografia

Abad García, M. F.; González Teruel, A.; Martínez Catalán, C. (2006). "Acceso abierto y revistas médicas españolas". Medicina clínica, vol. 127, n.º 12, p. 456–464.

Antelman, K. (2004). "Do open-access articles have a greater research impact?". College & research libraries, vol. 65, no. 3, p. 372–382.

Antelman, K. (2006). "Self-archiving practice and the influence of publisher policies in the social sciences". Learned publishing, vol. 19, no. 2, p. 85–95.

Craig, I. D. et al. (2007). "Do open access articles have greater citation impact? A critical review of the literature". Journal of informetrics, vol. 1, no. 3, p. 239–248.

Harnad, S.; Brody, T. (2004). "Comparing the impact of open access (OA) vs. non-OA articles in the same journals". D-lib magazine, vol. 10, no. 6. <http://www.dlib.org/dlib/june04/harnad/06harnad.html>. [Consulta: 28/02/2008].

Harnard, S. (2006). "Maximizing research impact through institutional and national open-access self archiving mandates". Current research information systems. <http://eprints.ecs.soton.ac.uk/12093/2/harnad-crisrev.pdf>. [Consulta: 28/02/2008].

Keefer, Alice (2005). "Aproximació al moviment 'open access'". BiD: textos universitaris de biblioteconomia i documentació, núm. 15 (desembre 2005). <http://bid.ub.edu/15keefer.htm>. [Consulta: 28/02/2008].

Lawrence, S. (2001). "Free online availability substantially increases a paper's impact". Nature, vol. 411, no. 6837, p. 521.

Medeiros, N. (2004). "A repository of our own: the E-LIS e-prints archive". OCLC systems & services: international digital library perspective, vol. 20, no. 2, p. 58–60.

Melero, Remedios (2005). "Acceso abierto a las publicaciones científicas: definición, recursos, copyright e impacto". El profesional de la información, vol. 15, n.º 4, p. 255–266.

Subirats Coll, I.; Barrueco, J. M. (2004). "Un archivo abierto en ciencias de la documentación e información". El profesional de la información, vol. 13, n.º 5, p. 346–352.


Data de recepció: 28/01/2008. Data d'acceptació: 04/03/2008.