Blok de BiD

Reseñas de Biblioteconomía y Documentación
Subscriure a Canal Blok de BiD

Ignasi Labastida
CRAI
Universitat de Barcelona

Implementation roadmap for the European Open Science Cloud (2018). 33 p. Brussels: European Commission. (Staff Working Document). Disponible a: <http://ec.europa.eu/research/openscience/pdf/swd_2018_83_f1_staff_workin.... [Consulta: 11.12.2018].

Prompting an EOSC in practice: final report and recommendations of the Commission 2nd High Level Expert Group (2017-2018) on the European Open Science Cloud (EOSC) (2018). Brussels: European Commission. 40 p. Disponible a: https://publications.europa.eu/en/web/eu-law-and-publications/publicatio.... [Consulta: 11.12.2018]. 

L’any 2015, la Comissió Europea va tenir la idea de construir una infraestructura federada per donar suport a la ciència en obert i poder-la desenvolupar, prioritzant l’intercanvi de dades sorgides de l’activitat investigadora i la generació de serveis a partir d’aquestes dades. Aquesta infraestructura va rebre el nom de Núvol Europeu per a la Ciència en Obert (European Open Science Cloud o EOSC). La Comissió va constituir un primer grup d’experts que va elaborar el document Realising the European Open Science Cloud, on es proposaven una sèrie de recomanacions per crear aquest núvol i després ha anat finançant diferents projectes com l’EOSCPilot o l’EOSCHub fins arribar al divendres 23 de novembre quan es va presentar la primera versió de la infraestructura, el portal de l’EOSC.

Al mateix temps que s’obria l’esperat portal, es feia públic un nou document elaborat per un segon grup d’experts, nomenat per la Comissió, que duia per títol Prompting an EOSC in practice. En aquest document es recullen unes noves recomanacions per implementar l’EOSC a partir del full de ruta descrit en el document de treball de la Comissió publicat el març del 2018, i que va ser enviat al Parlament Europeu i al Consell de la Unió Europea.

Aquest document de treball és el resultat d’un procés de consulta entre totes les parts implicades en el desenvolupament d’aquesta infraestructura incloent-hi, entre d’altres, conclusions del Consell Europeu o opinions del Comitè de les Regions respecte de la ciència en obert. A més, també es recullen resolucions del Parlament Europeu respecte l’EOSC i les dades de la recerca on es demana que s’elabori un pla d’acció i es creïn els mecanismes de finançament per fer sostenible aquesta infraestructura. Aquests mecanismes i un model de governança és el que ofereix el document de treball publicat el març, que també va ser elaborat per discutir amb els estats membres la implementació de l’EOSC. Per aquesta raó, a l’annex del document s’inclouen algunes infraestructures de dades ja creades com a iniciatives nacionals.

Per fer realitat el núvol de la ciència en obert es proposen sis nivells de treball: l’arquitectura, la gestió de les dades, els serveis a oferir a l’usuari, els mecanismes d’accés, les regles de participació i la governança de la infraestructura.

Respecte l’arquitectura es proposa crear una federació d’infraestructures de dades de recerca existents o ja planificades, és a dir, no es pretén construir una infraestructura nova on dipositar dades sinó treballar amb projectes que ja funcionen o s’estan posant en marxa. L’EOSC no vol ser una nova estructura sinó una federació d’estructures per evitar la fragmentació actual.

Respecte la gestió de les dades de la recerca es fa palès que hi ha una manca de cultura per compartir-les i, per tant, el primer que cal fer és promoure un canvi cultural entre els investigadors a l’hora que es potencien les habilitats per gestionar les dades i es creen incentius per a una bona gestió. A més, si l’objectiu és tenir les dades disponibles segons els principis FAIR (findable, accessible, interoperable and reusable), cal continuar treballant per crear estàndards, especificacions i eines.

Pel que fa als serveis que ha d’oferir l’EOSC, se’n proposen cinc: un servei d’identificació i autenticació; un espai protegit i personalitzat; accés a la informació dels serveis disponibles i a guies específiques, com per exemple indicacions per fer les dades FAIR; un servei per trobar les dades d’altres; i, finalment, un servei perquè l’usuari pugui fer les dades FAIR i pugui preservar-les. En el document es proposa que els tres primers serveis siguin gratuïts i els dos últims es puguin cobrar, en part, per fer sostenible la infraestructura.

Pel que fa al quart nivell de treball, l’accés a la infraestructura, s’hi proposen diferents punts d’entrada a l’EOSC entre els quals hi ha el portal que es va presentar a Viena el 23 de novembre, i no es descarta la creació de punts d’entrada específics per a comunitats científiques ja establertes en alguna infraestructura existent que formarà part de l’EOSC.

Les normes de participació inclouran els drets i les obligacions de totes les persones implicades com a usuàries, proveïdores de dades, o prestadores de serveis tenint en compte algunes de les pràctiques ja establertes entre algunes comunitats d’investigadors i els proveïdors de serveis.

Finalment, es considera que la governança de l’EOSC és primordial perquè cal establir els mecanismes per decidir l’estratègia, per fer-ne la implementació i el seguiment, i retre comptes. El model plantejat es detalla en el darrer annex del document i ha estat la base del que s’ha aprovat en la primera fase d’implementació amb la posada en funcionament del portal. Es proposa una estructura executiva que s’encarregui de la implementació i de la rendició de comptes davant de totes les parts i del Consell de l’EOSC. Aquest consell institucional hauria d’estar format per representats dels estats membres i de la Comissió i hauria de vetllar per fer efectiva la implementació. I, finalment, hauria d’existir un fòrum de participació on totes les parts implicades puguin tenir veu.

Pel que fa al finançament de la infraestructura, el document recull unes reflexions preliminars on s’indica que el principal cost serà més administratiu que el de creació de recursos ja que l’EOSC es nodrirà d’infraestructures ja existents que ja tenen els seus propis mecanismes de finançament. S’espera que els estats membres i els finançadors continuïn implicant-se en les infraestructures que es federaran dins l’EOSC. També es reconeix que la Comissió ja té compromesos, fins al 2020, 300 milions d’euros per posar en funcionament tota la infraestructura mitjançant diferents iniciatives del programa marc Horizon 2020.

En el document de treball també es detalla un calendari d’actuacions fins al 2020 quan es vol tenir en ple funcionament l’EOSC. Algunes d’aquestes actuacions ja s’han posat en marxa com per exemple la creació d’un primer catàleg de dades o l’elecció del primer consell executiu de l’EOSC.

Al document publicat al novembre, vuit mesos després del full de ruta, el segon grup d’experts recull la proposta d’implementació de la Comissió i enumera una sèrie de recomanacions per fer-la efectiva. La principal proposta és la de crear un prototipus inicial que anomenen «ecosistema viable mínim». En aquest ecosistema han de conviure els investigadors, els desenvolupadors de programari i els gestors de les infraestructures. Els serveis mínims que s’han d’oferir són els de registre, descoberta, anàlisi, publicació i hostatge de dades. Pel que fa a la governança, el segon grup d’experts dona suport a la proposta del document de treball que estableix tres capes, l’estratègica, l’executiva i la participativa. L’estratègia la d’establir el Consell de l’EOSC, que haurà de demanar al Consell Executiu que la desenvolupi. El nivell participatiu vindrà determinat per un fòrum on els participants podran fer arribar les seves opinions. A més, es proposa una estructura de suport al Consell Executiu per coordinar les infraestructures i els projectes ja existents i per posar en marxa la primera fase de l’EOSC. Aquesta estructura de suport es finançarà mitjançant un projecte específic en el marc del Programa Horizon 2020. El grup d’experts també proposa la creació de grups de treball temporals per treballar en diferents àrees com, per exemple: les regles de participació, els estàndards oberts, els incentius i els models de negoci o les polítiques de gestió de les dades. La creació d’aquests grups es pot determinar a partir de les propostes que sorgeixin en el fòrum de participants.

Un altre aspecte rellevant que apareix en el document és la proposta de models de finançament de l’EOSC. El grup d’experts proposa un accés ampli a l’EOSC descartant altres opcions com un accés basat en l’excel·lència o un accés determinat per una quota. L’accés ampli permet més visibilitat i disponibilitat de les dades i els serveis que es puguin oferir. Però cal determinar com es finançarà aquesta infraestructura. Es pot utilitzar un sistema directe on les agències de finançament paguin determinats elements de l’EOSC, un sistema de cupons que els investigadors poden utilitzar quan emprin els serveis del núvol o bé una combinació dels dos sistemes. Els experts no aposten clarament per cap dels tres sistemes però ofereixen arguments a favor i en contra de cadascun d’ells. També proposen una diferenciació entre usuaris comercials i no comercials a l’hora de contribuir en la sostenibilitat de l‘EOSC.

Pel que fa a la participació, en el document es proposen uns criteris per determinar l'elegibilitat dels usuaris. Per exemple, quina disponibilitat i quina qualitat tindran els serveis o les dades ofertes, com es compliran altres regulacions com ara la protecció de les dades personals o la protecció de la propietat intel·lectual, o quines seran les metadades i els identificadors que caldrà utilitzar.

Caldrà veure com es desenvolupa el full de ruta en els propers mesos i, en especial, com es posa en funcionament aquest mínim ecosistema viable durant l’any 2019. En el proper any es detallaran les regles de participació i els models de negoci que faran sostenible l’EOSC a partir de l’any 2020 quan es posi en funcionament a ple rendiment.
Sembla ser que aquella idea de la Comissió de fa tres anys comença a ser una realitat i caldrà veure com hi podrem formar part de manera activa com a individus i com a institucions.

 

Candela Ollé
Estudis de Ciències de la Informació i la Comunicació
Universitat Oberta de Catalunya (UOC)

Marsh, Jackie; Kumpulainen, Kristiina; Nisha, Bobby; [et al.] (2017) Makerspaces in the early years: a literature review. [Sheffield ]: University of Sheffield: MakEY Project. 139 p. Disponible a: <http://makeyproject.eu/wp-content/uploads/2017/02/Makey_Literature_Revie... >. [Consulta: 11.12.2018].

Lahmar, Jamal; Taylor, Mark; Marsh, Jackie (2017). Makerspaces in the early years: current perceptions and practices of early years practitioners, library and museum educators and makerspace staff. [Sheffield ]: University of Sheffield: MakEY Project. 55 p. Disponible a: <http://makeyproject.eu/wp-content/uploads/2018/01/MakEY_Survey.pdf>. [Consulta: 11.12.2018].

Què són els makerspaces? Una definició planera podria ser: un espai col·laboratiu, un entorn d’aprenentatge i d'experimentació que combina elements de taller, laboratori i estudi d'art per desenvolupar i crear (projectes innovadors, per exemple). A la ciutat de Barcelona trobem dos espais makers de referència, com el Made o el FabLab Barcelona que compta amb Fab Kids i, recentment, s’ha creat a la Universitat de Barcelona (UB), en concret al CRAI Biblioteca del Campus Clínic un nou espai anomenat EspaiCREA. Per a més context, a Madrid, al MediaLab-Prado es va organitzar l’any passat la jornada: Makerspaces en bibliotecas públicas: sesión de trabajo abierta ja que la cultura maker cal que s’incorpori a les biblioteques (ja siguin escolars, públiques o acadèmiques), als museus o qualsevol institució que tingui com a servei la formació i l’aprenentatge.

Els informes que analitzem (que formen part del projecte MakEY i ha rebut finançament del programa de recerca i innovació Horizon 2020 de la Unió Europea) ofereixen un bon context per tal de conèixer totes les variables implicades amb el moviment. El primer text (Marsh, Jackie; et al.; 2017) és una àmplia revisió bibliogràfica que analitza la cultura maker i la pràctica educativa; els espais makers dins dels espais d’aprenentatge formals i informals (biblioteques, museus, laboratoris oberts, etc.); les disciplines d’aprenentatge vinculades (Science, Technology, Engineering, Maths –STEM–; art; habilitats digitals; Design thinking, entre d’altres). A més, en el quart apartat, revisa les variables que hi intervenen: el gènere, la família, la classe social, el factor lingüístic i, en el cinquè, presenta les conclusions orientades al futur que sintetizem amb:

  • «el potencial dels espais makers [són cabdals] per desenvolupar els tipus d'habilitats i coneixements necessaris per permetre a Europa competir globalment en futurs mercats d'ocupació [...] on les tecnologies digitals conformaran diversos camins d'ocupació en els propers anys».
     
  • i la importància de la contribució del moviment maker al coneixement.

Per altra banda, el segon informe (Lahmar, Jamal; et al., 2017) és una continuació del primer, ja que després d’una extensa revisió bibliogràfica es volen conèixer les percepcions i punts de vista dels professionals amb una metodologia qualitativa com és l’enquesta. Aquesta ha estat portada a terme a set països de la Unió Europea (Alemanya, Dinamarca, Finlàndia, Islàndia, Noruega, Regne Unit i Romania) i als Estats Units, per tal d’identificar els beneficis i reptes dels espais de treball makers focalitzats en els infants d’edats compreses entre tres i vuit anys, tant en l’entorn formal (com escoles bressol i escoles) i informal (com museus i biblioteques).

Els perfils que han estat enquestats són: professorat d’infantil, personal dels museus i biblioteques, com també personal dels makerspaces. D’un total de 881 respostes obtingudes, 633 han completat satisfactòriament tot el qüestionari i com a punt de partida trobem que el concepte makerspaces no és conegut pel 63 % dels que responen, ja que no hi estan familiaritzats.

Els resultats de l’enquesta han estan agrupats en funció dels tres targets mencionats en el paràgraf anterior; el capítol 2 analitza les respostes dels early years practitioners que tot i no conèixer el moviment veuen que tindria valor incorporar-lo a l’educació infantil; el capítol 3 posa el focus en els resultats procedents del personal de biblioteques i museus i expressen entusiasme amb el potencial que suposaria la incorporació dels espais makers per a les seves institucions i hi identifiquen un ventall de beneficis; el capítol 4 se centra en el personal dels espais makers que tenen un elevat interès a treballar amb infants i desenvolupar-los equipaments.

Algunes de les conclusions globals apunten que hi ha clares diferències en relació a l’experiència dels professionals enquestats i respecte a la procedència geogràfica. Als Estats Units, per exemple, els espais de creació estan fortament promocionats a les biblioteques i als museus. Per altra banda, hi ha divergència d’opinions sobre el valor que aquests espais poden tenir amb els infants. S’ha detectat també una falta de recursos (l’enquesta menciona i demana l’opinió sobre eines com ara: talladores làser; impressores 3D; equipaments per codificar; creació digital amb tauletes, càmeres; eines electròniques per activitats STEM) i la necessitat de formació, com també orientacions en relació al tipus d’activitats i l’avaluació de l’aprenentatge adquirit. Per tant, l’enquesta ha estat d’utilitat per confirmar que la línia i direcció iniciada pel projecte MakEY encaixa amb els objectius, però queda molta feina per fer.

Fent un punt i a part dels informes i en un intent d’apropar-nos a la realitat de casa nostra, on l'adquisició de les competències en l'educació infantil ha fet un gir i cada vegada més les escoles canvien el model tradicional pel learning by doing. Alguns exemples d'aquesta nova realitat: el traç, l’aprenentatge de la lectura i l’escriptura ja no es delimita al paper i a la taula, si no que és el pati que es transforma en una gran pissarra; les matemàtiques ja no són aquells exercicis repetitius i mecànics a la llibreta, si no que l’ambient del supermercat i la classe de cuina els serveixen per fer els càlculs bàsics tot comprant i calculant els ingredients per fer pastissos, per posar dos exemples que veig a P5.

Més enllà de l’escola, les biblioteques necessiten també incorporar bibliolabs –denominació dels makerspaces a les biblioteques– (mireu el projecte de la Diputació de Barcelona) ja que són una via d’atracció de nous perfils d’usuaris i la biblioteca pot ser entesa també com un espai d’aprenentatge, creació, així com d'accés a la informació. 

Per saber-ne més:

González-Fernández-Villavicencio, Nieves (2013). «El movimiento "Maker" en bibliotecas». Bibliotecarios 2020, enero 01.

Marquina, Julián (2017). «Makerspaces en bibliotecas: el fenómeno Bibliomakers». Julián Marquina, abril 18.

 

Rafael Aleixandre Benavent
Científic titular d'OPI. UISYS, Unidad mixta de Investigación
(CSIC-Universitat de València). Ingenio (CSIC-UPV)

Open access to data: it’s not that simple (2017). Copenhagen K: Danish National Research Foundation. 27 p. Disponible a: http://dg.dk/wp-content/uploads/2017/11/Open-Access-to-Data-%E2%80%93-It.... [Consulta: 05/11/2018].

Per dilucidar els avantatges i els reptes de l’obertura de dades en la ciència, la Danish National Research Foundation (DNRF) va dur a terme una enquesta entre els seus investigadors sobre l’accés obert a les dades. Aquest informe, que presenta els principals resultats i un capítol de suggeriments, també vol donar resposta a algunes preguntes clau com ara: què són «dades de recerca»?, quines dades són rellevants per compartir?, a qui pertanyen les dades?, per què la gent comparteix voluntàriament aquesta matèria primera tan valuosa? i qui hauria de cobrir les despeses de manteniment dels grans bancs de dades?

L’estudi parteix de la premissa que les millors pràctiques es dedueixen escoltant els investigadors i, per aquesta raó, la DNRF va realitzar una enquesta entre investigadors de tots els seus centres d’excel·lència. Dels 1.175 investigadors que van ser convidats a participar, 474 van contestar l’enquesta, el  que suposa una taxa de resposta del 40 %. El propòsit de l’enquesta era aclarir com i quant els investigadors estan emprant dades obertes i també il·luminar les fortaleses, barreres, oportunitats i desafiaments de les dades obertes. L’informe s’acompanya de les experiències que narren cinc centres danesos que mostren com treballar amb dades obertes pot potenciar la recerca i quins són els desafiaments a cinc àrees de recerca diferents.

  1. The Center for Permafrost (CENPERM), que treballa amb les interaccions entre el sòl, les plantes i els microbis, i els processos de retroalimentació dels ecosistemes associats al clima.
     
  2. iCourts Database on International Court Decisions, la base de dades més gran de decisions judicials de tribunals internacionals existent actualment.
     
  3. The Centre for Urban Network Evolutions (UrbNet), un centre interdisciplinari amb una gran base de dades en humanitats.
     
  4. The Stellar Astrophysics Centre’s (SAC), especialitzat en astrofísica.
     
  5. Center for Personalized Medicine in Immune Deficiency (PERSIMUNE), que explica com amb un únic número identificador és possible utilitzar les dades generades pel sistema de salut complint els principis de legalitat i confidencialitat.

Resultats de l’enquesta

Els resultats de l’enquesta van mostrar que és més comú que les dades estiguin disponibles en ciències naturals i en humanitats que en ciències socials, ciències de la vida i ciències tecnològiques. Aproximadament el 32 % dels investigadors van indicar que les seves dades estan disponibles com a dades suplementàries acompanyant els articles de revista, aproximadament el 20 % els dipositen en un repositori, el 17 % en memòries i el 8 % en el lloc web del projecte.

En relació amb les raons per posar a disposició les dades, les més importants són: a) permet la validació o replicació de dades (el 81 % les troba molt o extremadament importants); b) és una bona pràctica compartir les dades de la recerca (el 77 % les troba molt o extremadament importants); c) permet la contribució dels altres i fomenta la col·laboració (el 73 % ho troba molt o extremadament important).

Entre les barreres per compartir, les dues més importants són: a) «requereix temps i esforç per preparar les dades» (el 46 % troba aquesta raó molt o extremadament important); b) «pèrdua d’oportunitats de publicació de l’estudi» (el 41 % troba aquesta raó molt o extremadament important); c) «les dades contenen informació confidencial o sensible» (el 35 % les troba molt o extremadament importants); d) «d’altres poden fer un mal ús o mal interpretar les meves dades» (el 30 % les troba molt o extremadament importants).

La distribució de les motivacions per dipositar les dades va donar els següents resultats: a) finançament addicional per cobrir el cost de l’estudi (35 %); b) possibilitat de ser coautor en el treball subsegüent després de la reutilització (32 %); c) saber com els altres utilitzen les dades (32 %); d) citació de les dades (32 %); e) millor reputació acadèmica (31 %).

Pel que fa a què consideren important els investigadors quan utilitzen dades d’altri, les raons més importants van ser; a) que les dades siguin d’alta qualitat (45 %); b) que estiguin ben documentades (42 %); c) que s’hagin obtingut de fonts fiables (38 %).

Comentaris i suggeriments

Atès que la recerca es du a terme, en gran mesura, a les universitats, aquestes juguen un paper molt important en la promoció de l’accés obert a les dades. Poden fomentar la conscienciació sobre la importància del procés, promovent una cultura de ciència oberta i desenvolupant polítiques a les diferents àrees de recerca. Les polítiques de dades obertes han de ser dinàmiques i reflectir contínuament les necessitats dels investigadors i el desenvolupament tecnològic. També han de conèixer les limitacions que envolten les dades obertes i trobar possibles solucions. Les universitats podrien adoptar l’accés obert a les dades de la recerca com un criteri, entre d’altres, per a la promoció professional.

Les institucions individuals cal que treballin per a l’establiment d’infraestructures i un desenvolupament sostenible a llarg termini que garanteixi la conservació i preservació de les dades. Les dades són, en molts casos, molt diverses i requereixen una gran coordinació en l’àmbit nacional per aprofitar les oportunitats que ofereixen.

Per tal que la recerca pugui aprofitar al màxim els beneficis de les dades obertes, és essencial la col·laboració intra i interinstitucional. També és important disposar d’un òrgan centralitzat que s’ocupi sistemàticament de les qüestions jurídiques i ètiques que planteja l’accés obert a les dades. D’altra banda, les institucions podrien implantar programes de formació sobre com fer que les dades estiguin disponibles, com reutilitzar-les, com adquirir habilitats per a la seva gestió de dades, etc.

Jesús Tramullas
Departamento de Ciencias de la Documentación
Universidad de Zaragoza

Merlo Vega, José Antonio (ed.) (2018). Ecosistemas del acceso abierto. Salamanca: Ediciones Universidad de Salamanca. 391 p. (Aquilafuente; 228). Disponible a: <https://gredos.usal.es/jspui/bitstream/10366/138566/8/978-84-9012-774-2.pdf>. [Consulta: 26.11.2018].

He de reconèixer que, d’un temps ençà, cada cop que sento o em parlen d’accés obert, immediatament desconnecto i m’oriento a d’altres tasques acadèmicament més interessants. Es tracta d’un d’aquells temes sobre els quals la comunitat professional i investigadora porta insistint-hi de forma reiterada bastants anys, i sobre la qual s’amunteguen periòdicament un bon nombre de treballs, la major part dels quals no aporten res de nou al coneixement ja disponible.

Tècnicament, un repositori no es més que un tipus especialitzat de sistema de gestió de documents, els fluxos de treball del qual són molt limitats, i el producte final del qual és sempre el mateix. Teòricament, poc es pot aprofundir sobre un servei tan limitat, amb un concepte bàsic i sense gairebé possibilitat de desenvolupament. Políticament i social, no hi ha molt a tractar, més enllà dels compromisos i polítiques institucionals, dels esquemes de llicències, i de la percepció i ús que puguin fer-ne les comunitats d’usuaris. En aquest context, es pot plantejar quin interès pot tenir un altre treball col·lectiu sobre accés obert. A priori, sembla que aquest pot ser escàs.

Sorgeix aleshores la necessitat de plantejar alguna cosa més, aproximacions que permetin aprofitar el patrimoni documental que s’ha anat conformant en els repositoris. Amb una perspectiva més avançada, podria dir-se que es tracta de generar valor afegit amb i en el repositori. Es tracta de creativitat. I en una part de les aportacions de l’obra que ens ocupa s’aplica aquest principi, basat simplement en la superació del model tradicional de repositori i en l’aplicació del sentit comú, aportant nous serveis i funcionalitats que enriqueixen l’àrid món dels repositoris.

José Antonio Merlo-Vega ha desenvolupat una notable activitat de coordinació per aconseguir que Ecosistemas del acceso abierto tiri endavant, i proveeixi al lector d’un panorama actualitzat de les perspectives de l’accés obert. La major part del contingut procedeix de les presentacions realitzades a les jornades Ecosistemas del Conocimiento Abierto (ECA 2017), celebrades a Salamanca entre els dies 25 i 27 d’octubre de 2017. Donada la quantitat de treballs presentats en el complet programa de les jornades, resulta lloable que les seves actes hagin estat publicades en un termini de temps tan curt, cosa que demostra que les llargues latències en processos d’edició acadèmica no tenen justificació avui dia.

Merlo-Vega assenyala en la introducció al volum que «El libro que presentamos refleja de manera determinante las diferentes caras del conocimiento abierto, ya que en sus distintos capítulos se pueden observar tanto enfoques teóricos, como tecnológicos, de procedimientos y de servicio.» (p. 11). Es tracta, al meu entendre, d’una aproximació i estructura organitzativa més que encertada, que pretén establir quasi un estat de la qüestió. No obstant, aquest afany només s’ha aconseguit parcialment, per raó dels diversos enfocaments i els diferents nivells de qualitat que ofereixen els textos reunits a l’obra.

El volum s’organitza realment en quatre blocs, si s’exclou el text inicial, que detallo en el següent paràgraf. En primer lloc, un bloc sobre Contexto, format per dos treballs, al qual segueixen blocs més amplis sobre Investigación i sobre Servicio. El bloc dedicat a Innovación ha estat el que m’ha semblat més interessant, perquè obre noves perspectives basades en productes o serveis d’ús immediat pels usuaris. El volum acaba amb un bloc sobre Desarrollo, que recull experiències de creació i implementació de repositoris institucionals. Sis és el número màgic de l’obra, atès que tots aquests apartats recullen aquell nombre de treballs.

El primer text, redactat per M. L. Kennedy, citant un bon elenc de fonts, incideix en la necessitat de superar les aproximacions tradicionals de dipòsit, per incidir en la creació d’entorns d’informació per a investigadors: «the use of digital evidence and method, digital authoring, digital publishing, digital curation and preservation, and digital use and reuse of scholarship» (p. 19), per a continuació cridar l’atenció sobre quatre àrees: descobriment, integració, aplicació i ensenyament. És un text que paga la pena llegir, donat que emfasitza el que està evolucionant en els processos d’edició col·laborativa en l’entorn acadèmic, que no acostuma a ser el que molts bibliotecaris creuen que passa.

Pel que fa a la resta del volum, el nivell de contingut i qualitat és desigual. Podem trobar capítols que són meres posades al dia de l’estat de la qüestió, de caire generalista, algunes amb grandiloqüents afirmacions sense més suport que el discurs mateix. En d’altres casos, hi ha investigacions la metodologia de les quals és manifestament millorable, quant als objectius plantejats no coincideixen amb les conclusions obtingudes, o bé aquestes conclusions són generalistes i no estan argumentades en profunditat. El lector també pot trobar estudis de cas, alguns dels quals aporten idees interessants, mentre que d’altres es queden en la mera descripció de repositoris de tipus tradicional, sense cap altre interès que documentar el cas de torn. Si em veiés obligat a recomanar algun dels treballs recollits, m’inclinaria per:

  • El text de Ferreras Fernández sobre repositoris institucionals a España (p. 39-84), perquè delinea aspectes sobre evolució i estat actual, i és imprescindible per comprendre els processos de la darrera dècada.
     
  • El text de García-Hidalgo i García-Peñalbo sobre gestió de coneixement obert amb open source (p. 147-160), que planteja un model d’avaluació per a les eines de programari. Per bé que considero que li manquen paràmetres d’avaluació més funcionals, ofereix una aproximació interessant.
     
  • Els textos de Ribes-Llopes, Pardo-Gómez i Martínez-Galindo sobre accés obert (p. 213-228) i de Martínez-Galindo, Pérez García i Ribelles Aguilar (p. 285-297), sobre integració de publicacions, ambdós a la Universitat Politècnica de València (UPV), atès que mostren bons exemples d’integració dinàmica de publicació acadèmica i gestió del repositori.
  • El text de Mañez Sánchez, Prats Prat, Prieto Jiménez i García Martínez, de la Universitat Politècnica de Catalunya (UPC) sobre la combinació amb geolocalització (p. 243-253).
     
  • I, finalment, el text de Malo de Molina, Fernández del Pino i Rasero sobre l’UC3M Research Portal (p. 299-310), que integra el contingut del repositori en un portal sobre recerca.

Des d’una perspectiva metodològica, i personal, sens dubte, una de les conclusions que en trec de la revisió del text és que resulta necessari aprofundir en els mètodes i tècniques de recerca en repositoris, i aplicar-les amb una aproximació més propera a les ciències experimentals que a les humanístiques. Una altra qüestió no tractada seria la predilecció de diferents grups d’investigadors pels repositoris temàtics internacionals davant dels institucionals, el que sembla ser un tema que pocs estan disposats a abordar. Tampoc s’ha entrat en els models emergents de xarxes socials acadèmiques, que permeten desenvolupar treball col·laboratiu, incloent integració amb repositoris, i gestió de documents de treball. Una reflexió final: no deixa de resultar curiós que diversos dels treballs del volum, que han recopilat i organitzat volums de dades, no hagin predicat amb l’exemple i dipositat aquells conjunts com a dades obertes per al seu ús i comprovació per d’altres investigadors...

Luis Fernando Ramos-Simón
Departamento de Biblioteconomía y Documentación
Universidad Complutense de Madrid

Gran Bretanya. Cabinet Office. Government Digital Service (2017). Government transformation strategy. (Policy paper). Disponible en: https://www.gov.uk/government/publications/government-transformation-str.... [Consulta: 02.11.2018].

El Govern britànic es proposa, els propers anys, aprofitar la seva excel·lent infraestructura digital per aconseguir que tots els serveis públics siguin digitals per defecte l’any 2020. Així es recull en un document, elaborat el 2017, pel Govern britànic titulat Government transformation strategy i l’última actualització del qual porta data de setembre de 2018. El document forma part d’un programa de transformació impulsat per un grup de directors generals del Govern britànic, orientat a crear nous serveis, fer una gestió més eficient i implementar polítiques a llarg termini. En aquest informe es plantegen fites com que la recollida de dades per al cens de 2021 sigui digital per defecte, l’objectiu és que el 75 % de les respostes siguin en línia (enfront del 16,7 % el 2011, la xifra més alta de qualsevol país al món). En aquell darrer cens es va enviar el full del cens en paper, però el 2021, els ciutadans rebran prèviament una invitació per omplir les dades en línia.

El Govern britànic gaudeix de gran prestigi en el desenvolupament de la seva administració electrònica, moltes de les seves iniciatives han estat preses com a model arreu del món. Va ser la primera a plantejar iniciatives com l’accés a informació pública mitjançant llicències digitals o a aplicar una estratègia de govern i dades obertes. Iniciatives que li han valgut figurar entre els primers en un bon nombre de rànquings internacionals, com ara l’Enquesta de les Nacions Unides sobre el govern electrònic 2018 o el Baròmetre de dades obertes.

Per aconseguir aquests serveis digitals per defecte, el Govern es proposa aplicar una estratègia de serveis multicanal per als seus usuaris, millorar la capacitació dels empleats públics, configurar les eines i processos necessaris per convertir l’organització en digital per defecte, gestionar millor les dades per posar-les a disposició dels usuaris, compartir-les de manera efectiva i evitar la duplicació de serveis per reduir costos i augmentar l’eficàcia administrativa.

La idea bàsica d’aquesta proposta és transformar la relació entre els ciutadans i el Govern, és a dir, més poder a mans dels ciutadans i respondre millor les seves necessitats. Les tecnologies d’Internet faciliten conèixer les expectatives dels ciutadans, adequar els serveis i millorar-los contínuament, per això es plantegen cinc objectius:

  1. Oferir serveis digitals de gran qualitat en totes les seves fases, de forma moderna i eficient, no limitar-se a substituir el paper amb versions en línia del mateix formulari. Aquesta transformació de serveis ha de portar a un nou disseny, com també a una ampliació del concepte d’usuari per reflectir que alguns usuaris interactuen a través de serveis de tercers que utilitzen API (application programming interface) governamentals. En aquest objectiu, el Govern compta amb millorar radicalment l’experiència de l’usuari mitjançant la creació de serveis digitals que compleixin amb l’estàndard de servei digital.
     
  2. Desenvolupar una cultura de servei públic entre els funcionaris que afavoreixi el desenvolupament d’habilitats en un entorn d’aprenentatge, centrat en els resultats per als ciutadans. El repte és atraure i retenir especialistes qualificats en un mercat molt competitiu. A més, han d’entendre la forma d’actuar dels serveis públics i enfortir les habilitats de lideratge. L’aposta és comptar el 2020 amb els funcionaris més capacitats digitalment del món. Per aconseguir l’objectiu s’hauran d’establir els principis d’organització de les dades digitals als organismes públics, inclòs el desenvolupament de carreres professionals i oportunitats d’aprenentatge, com també atraure personal divers per ocupar rols digitals de dades i tecnologia.
     
  3. Crear millors eines digitals i gestionar els recursos humans per facilitar el treball dels funcionaris. El Govern ha de crear un entorn adequat per prestar serveis públics de primer nivell mundial, tant en tecnologies com programes de treball, formulació àgil de polítiques, control de qualitat i garantia dels serveis. En la consecució d’aquests objectius, és essencial disposar d’una tecnologia comuna i interoperable on el disseny de l’espai proporcioni eines digitals adequades per poder governar, finançar i operar serveis amb enfocaments oberts centrats en l’usuari.
     
  4. Fer un millor ús de les dades, tant per al procés de transparència com per facilitar la seva reutilització pel sector privat. El document reconeix la importància de les dades com a recurs crític per a la prestació de serveis, fins al punt d’afirmar que «les dades actuen com la base sobre la qual descansa tota la resta». Es necessita millorar l’intercanvi de dades de manera que responguin les necessitats dels ciutadans i evitar duplicitats i contradiccions entre conjunts de dades. Per al 2020, el Govern es proposa millorar l’ús de les dades –fent menció especial a l’alta qualitat de les seves dades geoespacials– i obrir-les a través de l’ús d’API per donar suport a la presa de decisions, al mateix temps que es construeix una infraestructura nacional de dades amb les adequades mesures de seguretat.
     
  5. Crear plataformes compartides, com també introduir en els organismes públics productes i serveis del sector privat que operen amb estàndards oberts per poder interactuar en aquelles grans plataformes de serveis intergovernamentals, de manera que els organismes públics es beneficiïn de la combinació de tecnologia, processos i persones per aconseguir resultats compartits i reutilitzables per ser utilitzats pel sector públic i per tercers. La idea és construir serveis específics per als organismes públics només quan sigui necessari. Per aquesta raó, les prioritats per al 2020 són construir components, plataformes compartides amb el sector empresarial, orientades a la reutilització conjunta, eliminant barreres. Una de les propostes clares de l’estratègia del Govern és aconseguir que els organismes públics abandonin els contractes amb les grans companyies de tecnologies de la informació. A més, el document proposa publicar estàndards i desenvolupar directrius per tal que el sector públic utilitzi processos i plataformes compartides, sense perdre de vista la seguretat d’aquests sistemes. Finalment, es proposa fer un millor ús del domini únic «Gov.uk» per facilitar la navegació dels usuaris i donar un major valor als continguts, de forma que puguin trobar millor el que estan cercant (hi ha més de 300.000 documents i creix a un ritme de 2.500 pàgines al mes).

A la part final, el document conté algunes reflexions interessants. Per bé que el 2020 no és lluny, ningú no pot predir com serà el món, encara que es pot esperar que el «digital» sigui més comú. Per estar preparats, es proposen un sèrie d’orientacions a seguir, creiem que molt encertades, entre les quals cal destacar: un enfocament cap a la personalització dels serveis, augmentar la confiança en la protecció i seguretat de les dades –especialment les personals–, major ús de les dades per a la presa de decisions, com també flexibilitzar l’organització per respondre a un món que canvia. També hi ha algunes tendències macro a les quals els governs necessitaran respondre, tals com donar un servei conjunt i al mateix temps delegar cada cop més el poder en les regions, entendre el potencial de la intel·ligència artificial, vigilar l’ús de dades sanitàries i «wearables», com també atendre el desafiament que suposen la Internet de les coses, la millora de les auditories públiques o una millor utilització de dades geoespacials.

Business models for sustainable research data repositories (2017). [Paris]: OECD. 80 p. (OECD science, technology and innovation policy papers; 47). Disponible a: <http://dx.doi.org/10.1787/302b12bb-en>. [Consulta: 05/11/2018].

Rafael Aleixandre Benavent Científic titular d'OPI. UISYS, Unidad mixta de Investigación (CSIC-Universitat de València). Ingenio (CSIC-UPV)

Dins de la sèrie OECD science, technology and innovation policy papers, l’Organització per a la Cooperació i el Desenvolupament Econòmic (OCDE) va publicar el desembre de 2017 el seu número 47, titulat: Business models for sustainable research data repositories. Aquest projecte s’ha dut a terme en col·laboració amb el Committee on Data for Science and Technology of the International Council for Science (ICSU-CODATA) i Research Data Alliance (RDA), i també amb experts de molts repositoris de dades que van compartir les seves experiències.

L’informe parteix de la idea que per tal que els beneficis de la ciència oberta es facin realitat, les dades s’han de gestionar de forma curosa i sostenible perquè puguin ser enteses i utilitzades tant en el present com per les generacions futures d'investigadors. No obstant, una bona administració de dades és costosa i els pressupostos de recerca són limitats, raó per la qual el desenvolupament de models empresarials sostenibles per gestionar els dipòsits de dades de recerca ha de ser una de les principals prioritats a tots els països. Sorprenentment, s’han fet poques anàlisis sistemàtiques dels fluxos d’ingressos, costos, valor i models de negoci per als repositoris de dades, i aquesta és la llacuna que aquest informe intenta abordar des de la perspectiva de la política científica.

El projecte va analitzar una àmplia varietat de repositoris de dades i es va dur a terme de conformitat amb la següent declaració de tasques:

1ª. Identificar i descriure les fonts d’ingressos existents, com també els negocis emergents i innovadors, incloent-hi els mètodes d’optimització i reducció de costos;

2ª. Provar amb major rigor els possibles models de negoci amb els diferents grups d’interès;

3ª. Sobre la base d’aquests descobriments, fer recomanacions de política per promoure models de repositoris de dades de recerca sostenibles.

L’informe explora, al llarg de quatre capítols, les fonts d’ingressos, els costos, les propostes de valor i els models de negoci de 48 repositoris de dades de recerca. Inclou un conjunt de recomanacions dissenyades per desenvolupar models de negoci sostenibles i ajudar els responsables polítics i els finançadors a donar suport als repositoris. La informació necessària es va extreure de 48 entrevistes estructurades amb gestors de dipòsits de diversos camps de recerca de 18 països i un grup de treball sobre el tema.

Al capítol primer de l’informe s’analitzen els factors que influeixen en el disseny i la sostenibilitat dels models de negoci dels repositoris de dades de recerca: el paper del repositori, els contextos nacionals, l’etapa en la qual es troba el repositori, les característiques de la comunitat d’usuaris i el tipus de dades que gestiona. Totes aquestes qüestions s’ha de tenir en compte a l’hora d’escollir i desenvolupar models de negoci adequats per als repositoris de dades de recerca, i s’han de revisar periòdicament al llarg del cicle de vida.

Les recomanacions van adreçades, principalment, als responsables de la formulació de polítiques científiques, entitats finançadores i gestors dels repositoris i es resumeixen en les cinc següents:

  • Totes les parts interessades haurien de reconèixer que els repositoris de dades de recerca són una part essencial de la infraestructura per a la ciència oberta.
     
  • Tots els repositoris de dades de recerca han de tenir un model de negoci clarament articulat.
     
  • Els responsables de la formulació de polítiques, els finançadors de la recerca i d’altres parts interessades han de considerar els avantatges i desavantatges dels diferents models de negoci en diferents circumstàncies.
     
  • Els models de negoci dels repositoris de dades de recerca estan condicionats i han d’estar d’acord amb les polítiques, mandats i incentius.
     
  • En el context de la sostenibilitat financera, s’haurien d’explorar les oportunitats d’optimització de costos per poder gestionar eficaçment els actius digitals al llarg del temps.

El capítol 2, titulat Panorama dels repositoris de dades de recerca, explora l’abast i les característiques dels repositoris analitzats i examina les seves fonts d’ingressos, com també les expectatives sobre la seva futura adequació, possibles fonts alternatives d’ingressos i l’optimització de costos. Dels 48 repositoris analitzats, al voltant de la meitat se centren en ciències exactes i naturals, un terç eren mixtos i prop del 15 % se centraven en ciències socials i humanitats.

Al capítol 3, Models de negoci dels repositoris en context, s’esbossen alguns dels elements importants del context en el qual operen els repositoris de dades de recerca. Proporciona una visió general de les influències contextuals i estructurals que cal tenir en compte en la selecció i desenvolupament dels models de negoci dels repositoris i dels incentius per a l’optimització de costos.

El capítol 4, Models de negoci sostenibles, explora la sostenibilitat dels models de negoci dels repositoris de dades de recerca, analitzant la seva sostenibilitat financera, els pros i els contres de diversos models de negoci i els possibles efectes dels incentius en l’optimització de costos.

 

 

 

 

 

 

 

 

 

 

 

 

 

Lluís Anglada
Director de l’Àrea de Ciència Oberta
Consorci de Serveis Universitaris de Catalunya (CSUC)

L’associació: https://libereurope.eu/about-us/  
El pla estratègic de la LIBER: https://libereurope.eu/strategy/
48th LIBER Conference: https://liberconference.eu/
LIBER quarterly: https://www.liberquarterly.eu/
LIBER Open Science Roadmap: https://zenodo.org/record/1303002#.W9yANGj0mUl

Malgrat que al Blok de BiD s’hi ressenyin majoritàriament informes, de tant en tant val la pena parlar també d’associacions o de serveis. És el que farem avui amb la LIBER. Que les sigles desenvolupades siguin Ligue des Bibliothèques Européennes de Recherche indica que es va fundar en aquells temps no tan remots quan l’anglès encara no era el llatí de la comunitat científica, concretament les primeres reunions van ser el 1968 i el primer congrés el 1971. Esko Häkli, que va ser president de la LIBER, ha escrit una història de l’associació1.

La LIBER es va crear amb l’objectiu de donar una veu pròpia a les biblioteques europees de recerca, nacionals i universitàries, és a dir, crear una associació especialitzada i similar a la ja existent per a les biblioteques dels Estats Units d’Amèrica i el Canadà, l’Association of Research Libraries (ARL). Val a dir que el terme de biblioteques de recerca s’ha d’interpretar de forma àmplia, és a dir, incloent totes les biblioteques que proporcionen serveis a la investigació (per aclarir: algunes biblioteques universitàries poden no ser de recerca i moltes biblioteques especialitzades ho són). Avui formen part de la LIBER més de 400 biblioteques.

Els objectius de l’associació són els de proporcionar serveis als seus associats, donar-los un fòrum d’intercanvi i debat (les conferències anuals), fer de lobby a les institucions europees i ajudar les biblioteques de recerca a definir bé els seus posicionaments de futur. En aquest darrer sentit, val la pena de parlar dels plans estratègics de la LIBER2. Aquests han servit per orientar les tasques de l’associació, però –al meu entendre– cal veure’ls de forma més propera i operativa, com punts de partida per a l’establiment de plans o posicionaments estratègics de qualsevol biblioteca de recerca o per a associacions com Rebiun, per exemple.

El pla estratègic actual va tenir un llarg, planificat i participatiu procés de gestació que va durar tres anys. El pla actual (per al quinquenni 2018-2022) preveu grans canvis en la forma com s’està fent la recerca i, per tant, per a les biblioteques que hi donen suport. El pla parteix de la visió que el 2022 l’accés obert serà la forma predominant de publicació de revistes, que les dades de recerca seran en obert de forma FAIR (findable, accessible, interoperable and reusable), que la recerca «digital» serà més oberta, transparent, col·laborativa i participativa, i que el patrimoni cultural de demà és la informació digital d'avui.

Les direccions estratègiques del pla, que serveixen a la LIBER per organitzar-se en comitès i grups de treball, són tres:

  • Comunicació acadèmica innovadora, que inclou els subàmbits del copyright i altres temes legals, de l’Accés Obert i de les noves mètriques innovadores.
     
  • Habilitats i serveis digitals, que inclourien les Humanitats Digitals així com els programes de formació (tant els genèrics com els adreçats a directors i a futurs líders).
     
  • Infraestructures de recerca, que engloba les activitats del Fòrum de la LIBER dedicat a Arquitectura i les que es fan per explorar els serveis que les biblioteques han de crear per donar suport a la gestió de dades de recerca (RDM-Research Data Management).

Els congressos anuals (el proper serà a Dublín) són una bona ocasió per posar-se al dia dels temes que l’associació considera més candents. Això es fa amb conferències generals i ponències. Per descomptat, hi ha també una interessant fira i moltes reunions de grups de treball i d’altres. Els congressos de la LIBER són, doncs, una gran ocasió per posar-se al dia i fer «networking». És de lamentar que, malgrat el posicionament cap a l’obert de la LIBER, no tinguin un lloc a la seva web des d’on poder consultar les presentacions dels congressos. Respecte el passat, celebrat a Lille se’n poden consultar algunes presentacions i els vídeos de les principals sessions.

La LIBER publica (en obert) la revista LIBER quarterly que té dues seccions: la d’articles i la de casos d’estudi. Els articles que es publiquen reben la revisió de «parells» (de fet, hauríem de parlar bé d’avaluació d’experts) i tracten de forma «acadèmica» els temes que preocupen avui als professionals. Els casos d’estudi volen fer de pont entre les aproximacions més teòriques als problemes i les seves solucions pràctiques a un lloc donat (al darrer número, del Politècnic de Zuric i de la Universitat de Vilnius, per exemple).

En aquests moments (i per acabar), comentar que la LIBER publica de tant en tant informes i preses de posició que poden ser molt útils tant per informar-se com per ajudar a posicionar-nos en temes clau però nous i complexos. Aquest seria el cas del recent LIBER Open Science Roadmap. Ara que la Ciència Oberta està irrompent amb força en les «agendes» dels estats i dels organismes finançadors de la recerca, és molt bo i d’agrair que la nostra associació professional procuri orientar les biblioteques per evitar-les «ché la diritta via era smarrita».3

L’Open Science Roadmap de la LIBER és posterior (i deutor) de les recomanacions, de l’Open Science Policy Platform de la Comissió Europea. La LIBER veu en la ciència oberta una enorme oportunitat per a les biblioteques de recerca que, creant serveis que li donin suport, poden guanyar influència i valor. Més que no pas respondre la pregunta que hom pot fer-se respecte què és això de la Ciència Oberta4, el que fa la LIBER és analitzar les oportunitats i reptes que presenta la ciència oberta a les biblioteques i fa recomanacions sobre què fer. Això està dividit en les següents àrees: comunicació acadèmica, dades FAIR, infraestructures de recerca i l’EOSC (European Open Science Cloud), mètriques i reconeixements, habilitats digitals, integritat de la recerca, i ciència ciutadana.

Insistint en l’enfocament pràctic que guia la seva activitat, la LIBER inclou en la seva agenda casos pràctics de com algunes institucions s’orienten cap a donar servei en el context de la ciència oberta. Els casos d’estudi inclosos es corresponen al Karlsruhe Institute of Technology, la biblioteca nacional de Finlàndia, l’Institut Ruder Bošković, el CSIC, i les universitats Svetozar Markovic, de Barcelona, University College London i Southern Denmark.

1 Häkli, Esko (2011). Innovation through co-operation: the history of LIBER 1971-2009. Copenhagen: Museum Tusculanum Press. ISBN 9788763537919.
2 Els anteriors a l’actual van ser per als períodes 2013-2017 i 2010-2012. Vegeu: https://libereurope.eu/strategy/previous/.
3 Dant. Divina comèdia. Cant 1r, vers 3r.
4 Anglada, Lluís; Abadal, Ernest (2018) «¿Qué es la ciencia abierta?». En: Anuario ThinkEPI, v. 12, p. 292-298.

 

Miguel Navas-Fernández
Centre de Documentació
Museu de Ciències Naturals de Barcelona

Crawford, Walt (2018). Gold open access journals 2012-2017: GOAJ 3. Livermore (California): Cites & Insights Books. 179 p. Disponible a: <https://waltcrawford.name/goaj3.pdf>. [Consulta: 22/10/2018].

Crawford, Walt (2018). Gold open access journals by country 2012-2017: a supplement to GOAJ 3. Livermore (California): Cites & Insights Books. 293 p. Disponible a: <https://waltcrawford.name/cntry1217.pdf>. [ Consulta: 22/10/2018].

Walt Crawford és un bibliotecari retirat amb una activitat incansable. Al seu blog Walt at Random va publicant els seus propis informes sobre revistes científiques i el seu butlletí Cites & Insights: Crawford at large que tracta sobre biblioteques, tecnologia, mitjans de comunicació i comunicació científica. Fa servir la seva pròpia editorial, Cites & Insights Books.

Els seus treballs sobre revistes en accés obert, titulats GOAJ: gold open access journals, són exhaustius i de molta qualitat. Els publica des de 2016 en accés obert amb llicència CC BY i amb el suport i finançament d’SPARC. Crawford recull les revistes incloses al DOAJ i després realitza una descomunal feina manual revista per revista, recollint el preu dels article processing charges o APC  (si n’hi ha) i el nombre d’articles per any.

Cadascun d’aquests informes GOAJ cobreix els sis anys anteriors a l’any de publicació. Així, GOAJ 3, que té una extensió de 179 pàgines, recull el període 2012-2017. A la pàgina del projecte es poden consultar els tres informes publicats fins ara, juntament amb els datasets. El darrer informe, objectiu d’aquesta ressenya, inclou també un annex de 293 pàgines, del qual només es comentarà la informació corresponent a Espanya.

El primer que ens crida l’atenció d’aquest informe és el títol, Gold open access journals. I ho fa perquè si l’accés obert es divideix en dues rutes, la daurada (gold) per a les revistes i la verda (green) per als repositoris, aleshores totes les revistes són gold. L’autor justifica aquesta nomenclatura per diferenciar les revistes indexades al DOAJ de les que no ho estan. A més, estableix la categoria gray per identificar les revistes (suposadament depredadores) que apareixien a la famosa i desapareguda llista de Jeffrey Beall.1

L’informe de Crawford recull 10.293 revistes, de les quals un 70 % van néixer després de l’any 2005. Del total de títols, el 69,7 % no cobra taxes de publicació APC. Això no obstant, una mica més de la meitat dels articles (56,3 %) provenen de revistes que sí cobren, perquè la ràtio d’articles per revista i any és molt més baixa per a les primeres (36) que per a les segones (110). El preu mitjà per article és de 1.557 $, amb un augment sostingut del 4 % anual durant els darrers quatre anys. Val a dir que més de 2/3 de tots els articles amb APC es concentren a les revistes més cares.

Una de les anàlisis estrella d’aquesta obra és la que apareix de manera gràfica a la seva coberta: els articles per any, dividits entre els que es paguen per publicar i els que no. El nombre d’articles ha crescut any rere any, però el factor diferenciat és que els articles amb APC han crescut més: un 84 % durant el total dels sis anys estudiats, davant del 58 % dels altres.
 
Crawford separa les revistes en dos grups ben diferenciats: «APC land» («la terra dels APC») i «OA world» («el món de l’accés obert»). El primer està constituït per 13 grans editorials, incloent Elsevier, Hindawi, Oxford University Press, PLoS, SAGE, Springer, Wiley i altres. BioMed Central i Nature també hi apareixen, ja que el DOAJ els considera com editorials separades d’Springer. Aquest grup va publicar quasi el 20 % del total de revistes al DOAJ, comptant amb el 43 % dels articles i el 84 % de tot el benefici potencial de cobrar per publicar, que l’autor estima en 413 milions de dòlars. No obstant, no totes les revistes publicades per aquestes editorials cobren APC: el 26 % de tots els articles de 2017 no en tenien, tot i que provenien de només el 13 % de les revistes. El preu mitjà de l’APC era de 1.955 $, superior al preu mitjà global del DOAJ que hem vist abans.

D’altra banda, «OA world» inclou més de 4.000 editorials, que són responsables del 80,5 % de les revistes actives el 2017 i el 57 % dels articles, però només del 16 % dels guanys de cobrar per publicar. El 81 % d’aquestes revistes ni tan sols cobraven APC, provocant que 2/3 parts de tots els articles d’aquest «món de l’accés obert» es publiquessin gratis. El preu mitjà d’APC en aquest grup va ser de 750 $, quasi tres vegades inferior al del grup de «la terra dels APC».

Quant a les editorials, l’autor n’estableix cinc tipus: universitats i centres de recerca; associacions, societats i ens governamentals; editorials «tradicionals» (comercials); editorials d’«accés obert» (comercials però especialitzades en revistes en obert); i d’altres. La primera tipologia d’editorial és la que publica el major nombre de revistes (51 %), i 3/4 parts de les quals no cobren APC. Això no obstant, les editorials especialitzades en accés obert, que estan en segon lloc amb el 20 % de títols, publiquen la majoria d’articles, 6/7 parts dels quals cobrant. Com s’ha vist, quants més articles publica una revista, més probable és que cobri per publicar. És més, les revistes amb APC més cars solen publicar més articles que les més barates.

La majoria de revistes sobre medicina les publiquen les editorials «especialitzades en accés obert», mentre que les editorials comercials tradicionals i les societats científiques, en canvi, publiquen més revistes sobre ciència, tecnologia, enginyeria i matemàtiques.

Quant al lloc de publicació, al grup «APC land» destaca el Regne Unit, responsable del 32 % dels títols, seguit d’Egipte (18 %) i Suïssa (11 %). Amb menys del 10 % podem destacar els Països Baixos, l’Índia i els EUA. El grup «OA world» està liderat clarament pel Brasil (13 %) i Indonèsia (12 %), que és el país que més ha crescut al DOAJ el 2017. L’autor destaca el creixement d’Espanya i Polònia i la baixada de l’Índia (3/4 parts de les seves revistes han desaparegut o han estat incloses a l’«APC land»). La distribució global de revistes per països es pot consultar en qualsevol moment al DOAJ (veure «country of publisher»), on es pot veure la preeminència del Regne Unit, Indonèsia, Brasil, Espanya, EUA, Polònia i Iran.

Una informació interessant que ofereix aquesta obra és el percentatge de revistes sense APC que publica cada país. Així, si considerem només aquells països que publiquen més de 50 revistes, tindríem Espanya en primer lloc amb el 96 %, seguit de l’Argentina amb el 95 %, Brasil amb el 92 %, i d’altres països de l’Amèrica Llatina o «perifèrics» (fora de l’òrbita anglosaxona i d’Europa occidental). A la cua d’aquesta llista tindríem Sudàfrica i el Regne Unit per sota del 40 %, i altres grans productors de revistes en obert com l’Índia (54 %), Indonèsia (70 %) i els EUA (74 %) per sota dels mencionats anteriorment.

Crawford estableix tres grans grups de matèries: biomedicina, «STEM» (ciència, tecnologia, enginyeria i matemàtiques) i humanitats i ciències socials. El grup «STEM» té més revistes i articles, però la biomedicina té més ingressos per APC, i és l’únic grup on les revistes que cobren APC són majoria. Finalment, les humanitats i les ciències socials són el grup amb més revistes (47 % de totes les que hi ha al DOAJ, amb un increment notable durant el 2017), però publiquen pocs articles i normalment no cobren per publicar (els ingressos són 1/15 part dels de biomedicina, per exemple).

Les editorials (comercials) d’accés obert publiquen el 39 % de les revistes sobre biomedicina, i les comercials «tradicionals» un altre 20 % més, arribant a quasi el 60 % dels títols en aquesta categoria, mentre que les universitats i centres de recerca només publiquen el 24 %. El preu mitjà de l’APC el 2017 és de 1.778 $, tot i que quasi la meitat dels articles són a les revistes més cares.

En el cas de la categoria «STEM», el 45 % de les revistes pertanyen a universitats, el 75 % de les quals no cobren cap APC. Les editorials comercials (tradicionals o no) publiquen en total un 36 % dels títols, i un 60 % dels quals sí que cobren per publicar. El preu mitjà de l’APC és de 1.507 $.

Quant a les revistes sobre humanitats i ciències socials, el 71 % són publicades per universitats i centres de recerca, i només el 13 % pertanyen a les comercials. Sobre el total de títols d’aquestes temàtiques, només 1/8 part cobren APC, i en el 60 % d’aquests casos és de menys de 200 $, amb un preu mitjà de 118 $.

L’autor dedica capítols sencers a analitzar tipologies de revistes, volums d’articles, anàlisis d’APC, etc. i dedica centenars de pàgines i de taules a estudiar grups de matèries i de regions, entre d’altres. La informació és abundant i precisa alhora, i per aquest motiu convidem el lector a consultar aquella part de l’estudi del seu interès, ja que resulta impossible encabir-la tota en aquesta ressenya.

L’esmentat annex Gold open access journals by country 2012-2017 proporciona informació sobre cada país. En el cas d’Espanya, consten 576 revistes que el 2017 havien publicat 16.332 articles, amb una mitjana de 29 articles per revista sense APC i de 45 articles per revista amb APC. El preu mitjà de l’APC és de 353 $. Les universitats publiquen 2/3 parts de les revistes. La tercera part restant queda repartida entre editorials comercials (10 % del total), societats i govern (9 %) i d’altres (14 %). El 74 % de totes les revistes són sobre matèries que entrarien dins el grup d’arts, humanitats i ciències socials.

Volem agrair l’atenció prestada per l’autor mateix, Walt Crawford, a l’hora de respondre les nostres qüestions sobre aspectes específics del seu estudi.

1 L'autor ha publicat una anàlisi exhaustiva, Gray OA 2012-2016: open access journals beyond DOAJ, el 2017, disponible a https://citesandinsights.info/civ17i1.pdf, així com un «seguiment parcial», disponible a https://citesandinsights.info/civ17i9.pdf, del mateix any.

Tony Hernández-Pérez
Departamento de Biblioteconomía y Documentación
Universidad Carlos III de Madrid

Google Dataset Seach: beta. Disponible a: <https://toolbox.google.com/datasetsearch>. [Consulta: 16/10/2018].

L’any 2018 està sent molt entretingut en el món de la comunicació científica. A la primera part de l’any es van presentar tres grans bases de dades acadèmiques 1Findr (de 1Science’s), Dimensions (de Digital Science) i Lens (de Cambia, una ONG australiana, que, a més d’articles científics, recull fins i tot patents). De sobte, tres grans bases de dades que aspiren a competir amb la capsa blanca, més aviat negra, de Google Scholar i de Microsoft Academic. I tornant de l’estiu, dues altres grans sorpreses: el controvertit Plan S, una iniciativa de 12 de les més importants agències nacionals de finançament de la recerca a Europa. Un pla la intenció del qual és obligar científics i investigadors beneficiaris de fons públics de recerca per tal que el 2020 publiquin els seus treballs de forma immediata només en repositoris o revistes d’accés obert, excloent fins i tot les revistes híbrides. Una iniciativa que ha enutjat molt, entre d’altres, gran part del sector editorial, que el perceben com una gran amenaça. I gairebé el mateix dia, el 5 de setembre de 2018, Google va fer públic el llançament d’un nou producte: Google Dataset Search, l’objectiu del qual és facilitar l’accés als milions de datasets existents en milers de repositoris a la web.

Google aspira a convertir el seu nou producte en «el Google Scholar de les dades»: el lloc on es poden descobrir els datasets de qualitat que serveixin als investigadors, als periodistes i a tots aquells ciutadans interessats a disposar de dades procedents de fonts de qualitat. La hipòtesi de treball de Google amb el nou producte ha estat «Construeix-lo i vindran» i no els ha faltat raó. El cercador, encara en fase beta i amb moltes limitacions, ha aixecat moltes expectatives, segurament, perquè contribueix a resoldre un greu problema: la dispersió de fonts en les quals es troben els conjunts de dades més rellevants, tant els produïts pels governs (dades obertes governamentals) com els produïts pels investigadors (dades obertes de recerca).

Actualment, cercar datasets resulta extremadament problemàtic, no tan sols pels múltiples esquemes de metadades que s’utilitzen per descriure els datasets sinó també per la multitud de repositoris de dades que existeixen. El directori de repositoris de dades científics més important, el Registry of Research Data Repositories recull ja més de 2.200 repositoris, 24 a Espanya, alguns especialitzats en un tema, d’altres, com Zenodo, Mendeley o Figshare, més generalistes, on es pot trobar gairebé qualsevol tema. Nature recomana dipositar les dades que serveixen de base a les seves publicacions en més de 50 repositoris diferents. I els repositoris de dades obertes governamentals es troben igualment dispersos. De vegades, accessibles a través d’un agregador i d’altres és necessari anar a buscar a cada ajuntament, ministeri o agència governamental. Un caos per a l’usuari final, que finalment no sap en quin dipòsit de dades buscar, que està obligat a utilitzar una interfície diferent per a cada lloc i a obtenir descripcions molt diverses d’aquests datasets.

Amb el seu nou producte, Google pretén contribuir a allò que ells anomenen un «fort ecosistema de dades obertes» mitjançant el foment d’estàndards oberts de metadades per descriure els datasets publicats. A les seves directrius, Google adverteix que només recol·lectarà datasets de pàgines web que continguin dades estructurades. I recomana l’ús del tipus de contingut Datasets, del consorci schema.org o estructures equivalents representades al Data Catalog Vocabulary (DCAT) del W3C, una bona notícia per a molts dels catàlegs de dades obertes governamentals, molts utilitzen aquest vocabulari, que podran veure un augment en l’accés als seus datasets si aquest producte de Google es popularitza. La idea és clara, si el robot de Google descobreix les teves pàgines web amb dades estructurades que continguin datasets, els recollirà, si no… les tractarà com una pàgina més però no entrarà en el seu índex de datasets i tindrà més risc de perdre’s en la llarga cua de resultats.

Google intenta, a més, fomentar la cultura de la citació de dades, de forma similar a com citem les publicacions, per reconèixer el mèrit a aquells que creen i publiquen dades. De fet, a les seves pàgines de resultats ja es poden apreciar missatges del tipus «4 articles acadèmics citen aquest conjunt de dades (Vegeu-ho a Google Acadèmic)», amb la qual cosa, al mateix temps, Google enllaça els datasets amb els treballs de recerca indexats a Google Scholar. Encara és aviat per saber si el sistema serà reversible. Des dels articles es podrà accedir als datasets indexats per Google? Està Google pensant a contribuir a aquesta cultura afegint un botó per citar les dades d’acord a l’esquema de metadades de Datacite o un altre de similar?

Google Dataset Search, a diferència del seu cercador general, treballarà exclusivament amb metadades. Així i tot, el repte no és menor: després que el robot descobreixi els datasets haurà de realitzar una operació de «neteja de dades», malgrat les dades estructurades, és necessari normalitzar dates, detectar diferents autors i assegurar-se que les metadades estan ben assignades perquè aquestes metadades acostumen a arribar amb dades incompletes, errònies o directament omeses; Google haurà d’identificar les rèpliques, donat que un mateix dataset pot estar dipositat en diversos repositoris al mateix temps, o ser un subconjunt d’un dataset amb un major nivell d’agregació. A continuació, passarà la informació pel seu gràfic de coneixement (Knowledge Graph), la base de dades de coneixement que utilitza Google per detectar entitats, llocs, etc. i entendre el context de la pàgina que està analitzant. I, finalment, intentarà enllaçar el dataset amb Google Scholar. El que construeix Google és, doncs, un gegantesc índex de metadades netes i enriquides que serà la base de dades on busquem els usuaris. Així, la qualitat de la base de dades serà major o menor en funció de la qualitat de les metadades que assignen els proveïdors dels datasets.

Esquema del funcionament de Google Dataset Search
Font: https://ai.googleblog.com/2018/09/building-google-dataset-search-and.html

El producte, com dèiem, està en fase beta. Google encara no sap com busquem els usuaris datasets i espera poder aprendre de l’ús que fem del cercador per poder millorar-lo. Per ara, no se saben els criteris amb els quals mostra el rànquing de resultats, no se sap si utilitza la fiabilitat de la font, el nombre de cites del dataset a Google Scholar, la data d’actualització o de cobertura temporal o qualsevol altre criteri. La interfície dels resultats és molt millorable: no ofereix ni tan sols els resultats aproximats a una cerca; les descripcions dels diferents datasets són molt dispars; amb prou feines es mostren de tres a cinc resultats; no permet filtrats de quasi cap tipus, encara que sembla que funciona l’operador site: xxx.xx per limitar les cerques; no hi ha cerca avançada ni cap ajuda de com buscar. I, com a Google Scholar, per desgràcia, no proporciona cap API (application programming interface). I, per ara, no resulta fàcil trobar una llista dels repositoris que estan indexant, més enllà d’alguns dels grans repositoris que d’alguna forma estan contribuint activament a l’arrencada de Google Dataset Search (NOAA, ICPSR, Dataverse…) complint amb les directrius de Google per publicar datasets.

La major part dels grans repositoris, com Zenodo, Dryad o Figshare suporten i descriuen en JSON-LD els seus datasets d’acord a schema.org. No obstant, molts repositoris que han estat emmagatzemant datasets dels seus investigadors no treballen encara amb schema.org, per la qual cosa, si es vol augmentar la visibilitat dels datasets per després intentar fer un seguiment de les seves citacions i del seu ús, caldrà anar preparant-se. En qualsevol cas, per a aquells datasets als quals vulguem donar visibilitat de forma immediata i fins a la implementació d’schema.org al nostre repositori, sempre es pot anar, com fins ara, a registrar el dataset en alguns dels hubs o agregadors que sí que el tinguin implementat, per exemple, a Datacite o a datos.gob.es per al cas de dades obertes governamentals.

L’aparició de Google Dataset Search produeix sensacions enfrontades. D’una banda, pot ajudar a simplificar la cerca de dades obertes, com ha succeït amb Google Scholar. Com que és conscient de la importància de les dades i, per fi, de les metadades, està construint un producte o servei capaç de connectar-se a diferents repositoris, biblioteques digitals, revistes i catàlegs de dades de les administracions i agències governamentals per facilitar a l’usuari final la cerca de dades obertes des d’un únic lloc. Per una altra, l’èxit del servei significarà una mena de punt únic d’accés a totes les dades obertes, una mena de jardí únic i privat de Google, gratis, sí, però privat, perquè serà Google l’únic que tindrà accés a tota la informació i les dades que aquell punt únic d’accés generi. Ara que gràcies als identificadors persistents veiem aparèixer noves bases de dades d’articles científics como Lens, Dimensions o 1Findr potser també veiem aparèixer altres cercadors de datasets alternatius. Tant de bo apareguin aquestes alternatives i tant de bo que Google no deixi morir la seva nova joguina, com tants altres productes.

Candela Ollé
Estudis de Ciències de la Informació i la Comunicació
Universitat Oberta de Catalunya (UOC)

Kaufman, Peter B. (2018). Towards a new audiovisual think tank for audiovisual archivists and cultural heritage professionals. Hilversum, NL: Netherlands Institute for Sound and Vision. Disponible a: <http://dx.doi.org/10.18146/2018thinktank01>. [Consulta: 15/10/18].

El Llibre Blanc dels arxius audiovisuals ha estat elaborat pel Netherlands Institute for Sound and Vision que, amb més de milions d'hores de material, experiència i organització d’activitats, actualment ofereix les seves participacions a la més àmplia varietat d'usuaris finals, inclosos periodistes, estudiants, investigadors, organitzacions del patrimoni i el públic en general.

El document que ressenyem identifica les prioritats estratègiques dels arxius audiovisuals a la propera dècada i presenta un decàleg de recomanacions concretes per a l'acció col·lectiva, impulsades i acompanyades pel corresponent grup de lideratge de pensament que vol articular la recerca internacional per al sector del patrimoni cultural audiovisual. Pretén ajudar els actors interessats a preservar el patrimoni audiovisual per identificar les seves prioritats futures. És un document breu i que demostra, tant pel format com pel vocabulari emprat, que vol avançar amb pas ràpid i ferm i per això elabora una agenda d’acció i recerca a desenvolupar en la propera dècada.

Es tracta d’un text esquemàtic, però és el primer pas fet (si voleu ampliar la informació podeu visitar el web) i posa de manifest la importància de quantificar la comunicació audiovisual en l’actualitat; de ser conscients del valor extraordinari dels actius audiovisuals; vol fer que el material audiovisual que es faci en aquests arxius sigui útil i accessible globalment; es comprometen a protegir i mantenir la llibertat i drets humans –especialment d’expressió– i, finalment, a facilitar el coneixement, la informació i l’educació a tot el planeta.

El Llibre Blanc proposa deu recomanacions com a prioritats estratègiques per als pròxims deu anys, al voltant de les quals s'organitzaran accions, recerca, desenvolupament i recursos. Cada recomanació inclou un cronograma de les primeres accions col·lectives a realitzar. A continuació, resumim les principals idees de les preguntes plantejades a les recomanacions:

  1. Hi hauria d'haver una millor manera, per exemple, un catàleg unificat, per tal que es conegui la disciplina, les seves participacions i el seu poder?
     
  2. Seria adient una guia de bones pràctiques escrites per a Google i altres tecnologies per optimitzar tant la recerca com els recursos audiovisuals?
     
  3. Cal un acord amb el sector privat (gegants del camp com Google, Facebook i Amazon)?
     
  4. Quin ha de ser el nostre propi compromís amb l'experimentació constant?
     
  5. Hem de llançar un esforç real per implicar-nos amb Wikipedia?
     
  6. S'hauria de plantejar que el treball de FIAT/IFTA, PrestoCentre i arxius individuals com Sound and Vision hauria de ser sempre obert, sense restriccions i lliure?
     
  7. Si el contingut digital és cada vegada més difícil de llicenciar, llogar i vendre en línia, la publicitat es convertirà en el principal mitjà de generar ingressos en el futur dels continguts d'imatges en moviment. Com hem de considerar aquest negoci des d'una perspectiva empresarial?
     
  8. Els arxivers haurien d’estar connectats amb més facilitat amb els productors i els creadors?
     
  9. Com definim els nostres rols com a educadors actuals, especialment quan tants joves veuen i escolten el món a través d'imatges i sons en moviment? Hem d’elaborar una declaració de principis?
     
  10. Quin paper, si n'hi ha algun, haurien de jugar els arxius en l'àmbit polític/mediàtic/cultural?

I després de llegir el Llibre Blanc, i ara què?

El grup d'investigació està compromès a seguir aquestes recomanacions mitjançant una sèrie d'activitats i grups de treball. Aquests grups duran a terme investigacions addicionals, elaboració de recomanacions de política i de pràctica a través de manuals, documents d'estratègia i d’altres publicacions; i desenvoluparan plans d'acció que connectin directament amb els interessos dels professionals de l'arxivística i del patrimoni cultural.

Sembla, a priori, molt ambiciós pels agents implicats, el cronograma marcat i l’abast global del projecte. N’haurem de fer seguiment per veure els següents passos.