Número 36 (juny 2016)

L'assignació de metadades a llibres digitals en el format EPUB3. Segona part. Ús i explotació de metadades de l'EPUB3

 

Miquel Centelles

Professor
Departament de Biblioteconomia i Documentació
Universitat de Barcelona

Mireia Ribera

Professora
Departament de Matemàtica Aplicada i Anàlisi
Universitat de Barcelona

 

Resum

Objectiu: analitzar i valorar les tendències actuals pel que fa a l'ús i explotació de les metadades en els mecanismes de cerca i organització dels llibres digitals, a les plataformes de distribució i en els dispositius o aplicacions de lectura. A partir de l'ús observat, extreure'n recomanacions per a l'assignació de metadades en el marc de l'estàndard de metadades EPUB3 però amb una visió pràctica i aplicada.

Metodologia: es revisen manualment les dades incorporades en les plataformes Amazon, iTunes Stores i Projecte Gutenberg. També es revisen manualment les dades usades en les aplicacions de lectura Adobe Digital Editions, Apple iBooks, Azardi, Calibre i Readium, tant els sistemes d'exploració com els sistemes de recuperació de llibres per paraules clau per ítem i per col·lecció (biblioteques personals o externes).

Resultat: les plataformes de distribució no tenen en compte les metadades previstes per l'estàndard EPUB3 incloses en el mateix document per tal d'alimentar la descripció del producte en la seva incorporació. Les aplicacions de lectura, en canvi, sí que importen aquestes dades, però en fan un ús mínim en la cerca i organització dels llibres. Com a conseqüència d'això es recomana als autors i editors incorporar les metadades obligatòries segons l'estàndard EPUB3 per permetre la validació  de publicacions, però evitar els mecanismes d'enriquiment i assignar valors únics a cada element.

Resumen

Objetivo: analizar y valorar las tendencias actuales en relación al uso y explotación de los metadatos en los mecanismos de búsqueda y organización de los libros digitales, en las plataformas de distribución y en los dispositivos o aplicaciones de lectura. A partir del uso observado, derivar recomendaciones para la asignación de metadatos en el marco del estándar de metadatos EPUB3 pero con una visión práctica y aplicada.

Metodología: se revisan manualmente los datos incorporados en las plataformas Amazon, iTunes Store y Proyecto Gutenberg. También se revisan manualmente los datos usados en las aplicaciones de lectura Adobe Digital Editions, Apple iBooks, Azardi, Calibre y Readium, tanto en los sistemas de exploración como en los sistemas de recuperación de libros por palabras clave a nivel de publicación y a nivel de colección (bibliotecas personales o externas).

Resultado: las plataformas de distribución no tienen en cuenta los metadatos previstos por el estándar EPUB3 incluidas en el propio documento para alimentar la descripción del producto en su incorporación. Las aplicaciones de lectura, por el contrario, sí que importan estos datos pero los usan a un nivel mínimo en la búsqueda y organización de libros. En consecuencia, se recomienda a los autores y editores incorporar los metadatos obligatorios según el estándar EPUB3 para permitir la validación de las publicaciones, pero obviar los mecanismos de enriquecimiento y asignar valores únicos a cada elemento.

Abstract

Objective: This paper analyses and assesses current trends in using and exploiting metadata in the search and organization mechanisms of digital books, on distribution platforms and in ebook devices or applications. On the basis of their findings, the writers make a series of recommendations for adopting a practical and flexible approach to assigning metadata in the framework of the EPUB3 metadata standard.

Methodology: The writers manually revised the data incorporated on the platforms Amazon, iTunes Store and Project Gutenberg and in the ebook applications Adobe Digital Editions, Apple's iBooks, AZARDI, Calibre and Readium, examining exploration systems and book retrieval systems by keyword, item and collection (personal or external libraries).

Results: The distribution platforms make no provision for the metadata defined by the EPUB3 standard and included in the same document in order to develop the description of the product. By contrast, ebook applications do take account of these data, even though they make minimal use of them in book search and organization functions. The writers therefore recommend authors and editors to incorporate the metadata that are obligatory according to the EPUB 3 standard, in order to allow files to be validated, but avoid using semantic enrichment mechanisms and assign single values to each element.

 

1 Introducció

Aquest article té per objectiu analitzar i valorar les tendències actuals pel que fa a l'ús i explotació de les metadades en processos d'organització i cerca de llibres digitals en les plataformes de distribució i en els dispositius de lectura de llibres digitals.

Primer de tot, cal dir que les metadades internes dels llibres digitals tenen un paper determinant en el procés de validació i actualització de les publicacions. En l'apartat "3.3 Reading System Conformance" de l'especificació EPUB Publications 3.0.1. es declaren els criteris de conformitat que han de complir els sistemes de lectura (EPUB).1 Entre aquests criteris es troba el compliment de les restriccions expressades en la definició del document "Package" (Centelles, Ribera 2015).

Ara bé, més enllà d'aquest rol de validació és possible albirar funcions de les metadades internes que aporten valors afegits als llibres digitals en diferents moments de la cadena de valor d'aquests productes. Entre aquestes funcions en podem destacar dues que aporten valor afegit a l'experiència dels usuaris dels llibres digitals: d'una banda, facilitar la cerca i selecció de llibres en les plataformes de distribució, amb independència que s'orientin a llibres venals o gratuïts, i, de l'altra, facilitar l'organització i cerca de llibres, en les biblioteques personals creades en les aplicacions de lectura de llibres digitals (ebook reader software).

 

2 Ús i explotació de metadades de l'EPUB3 en les plataformes de distribució

Actualment les plataformes de distribució són un agent clau en la cadena de valor dels llibres digitals. Aquestes empreses connecten els autors i editors dels llibres digitals amb els consumidors. En molts casos, integren els processos d'acceptació d'originals per a l'edició, quant als autors, amb els processos de cerca i selecció de llibres per adquirir-los i integrar-los en dispositius de lectura, pel que fa als consumidors.

Existeixen diferents criteris de classificació d'aquestes plataformes: generalistes o especialitzades; orientades al llibre gratuït o de pagament; vinculades a un dispositiu de lectura específic o obertes a múltiples dispositius, etc. En qualsevol cas, totes les plataformes de distribució, amb independència de la seva natura, són grans consumidors de metadades per facilitar la cerca (per exploració i per interrogació), la selecció i l'adquisició de llibres digitals. En la figura 1 es pot observar la diversitat de camps disponibles en la cerca avançada del Kindle eBooks per aplicar i combinar en la consulta del catàleg.

 
Figura 1. Camps de la cerca avançada de Kindle eBooks

Figura 1. Camps de la cerca avançada de Kindle eBooks

 

Ara bé, aquestes metadades són proporcionades en paral·lel als fitxers que constitueixen el contingut dels llibres, mitjançant formularis específics per a cada plataforma. En les figures 2 i 3 es presenten els formulari d'introducció de metadades per donar d'alta un llibre electrònic en les plataformes iTunes Store i Project Gutenberg, respectivament.

 

Figura 2. Camps del formulari d'incorporació de metadades aTrabajar con iTunes, per donar d'alta un llibre a l'iTunes Store

Figura 2. Camps del formulari d'incorporació de metadades a Trabajar con iTunes, per donar d'alta un llibre a l'iTunes Store

 
Figura 3. Camps del formulari d'incorporació de metadades en el Project Gutenberg

Figura 3. Camps del formulari d'incorporació de metadades en el Project Gutenberg

 

Cada plataforma estableix els seus propis requeriments pel que fa als elements de metadades amb què s'han de descriure els llibres digitals incorporats en els seus fons, així com també les regles catalogràfiques i/o vocabularis controlats aplicables als valors de les metadades. I aquests requeriments són coherents amb els interessos particulars de difusió dels seus productes editorials. Aquests factors dificulten la importació directa de les metadades internes de les publicacions EPUB per reutilitzar-les en els contextos d'organització i cerca de llibres digitals en les plataformes.

 

3 Ús i explotació de metadades de l'EPUB3 en les aplicacions de lectura de llibres digitals

En l'experiència d'usuari amb els llibres digitals tenen un paper fonamental les aplicacions de lectura, que són diverses pel que fa a les funcionalitats que proporcionen. En general, però, permeten:

  • El desplegament, la lectura i la navegació en diferents formats dels llibres electrònics.

  • L'obtenció de llibres des de diferents tipus de fonts: plataformes en línia (venals i/o gratuïtes), fonts pròpies dels lectors, en dispositius locals o en el núvol, etc.

  • La creació, l'organització i el manteniment de biblioteques personals i, sovint, compartides, de llibres digitals.

En general, aquestes aplicacions han esdevingut vehicles d'integració de tots els processos de construcció de biblioteques personals, obertes a diferents plataformes i canals de distribució de llibres digitals.

Les metadades internes de les publicacions EPUB poden tenir un paper clau en el desenvolupament d'aquestes funcionalitats per millorar-ne l'eficàcia i efectivitat quan les biblioteques que s'han de gestionar són voluminoses i multidisciplinàries. Més concretament, podem identificar tres contextos clau d'ús i explotació de metadades.

  • Sistemes d'exploració de les biblioteques personals (browsing). Les metadades, i els seus valors, poden esdevenir instruments d'agrupació, filtratge i ordenació dels llibres, per facilitar la navegació en les biblioteques personals.

  • Sistemes de recuperació dels llibres per paraules clau (searching). Les metadades, i els seus valors, poden esdevenir mecanismes auxiliars del plantejament de la consulta (principalment en les modalitats de cerca avançada), i mecanismes auxiliars per al refinament o filtratge dels resultats de les cerques, durant el procés de retroalimentació de rellevància.

  • Presentació d'informació sobre els llibres prèvia a la selecció i lectura d'un llibre concret, o d'un conjunt de llibres recuperats a partir dels dos contextos anteriors. Les metadades, i els seus valors, poden facilitar l'estructuració d'aquesta informació, basant-se en criteris de qualitat.

En conjunt, les metadades aplicables a aquests tres contextos han de donar cobertura tant als diferents tipus de necessitats d'informació dels usuaris com als diferents aspectes de les publicacions que són objectes de descripció, i als interessos dels distribuïdors.

Pel que fa als primers, seguint Morville i Rosenfeld (2006), se'n poden diferenciar quatre grans tipus dins un contínuum: la necessitat concreta, que presenta uns límits temàtics ben definits; la necessitat orientada a problemes, que no es pot expressar de forma exacta; la necessitat exploratòria, que es dóna quan se cerca una resposta útil dins un conjunt de respostes localitzades prèviament, i la necessitat sobre cerques prèvies.

Pel que fa als aspectes dels llibres que són objecte de descripció, i seguint Gilliland (2008, p. 2), se'n poden diferenciar tres de fonamentals: l'estructura, que es relaciona amb l'establiment formal d'associacions entre recursos d'informació; el context, que indica aspectes sobre qui, què, per què, on i com associats a la creació dels recursos d'informació, i el contingut, que es relaciona amb què conté el recurs d'informació o sobre què tracta.

Per tal de comprovar i valorar quina és la tendència actual en l'explotació de les metadades de l'EPUB3 en els tres contextos indicats, hem observat el seu comportament en cinc aplicacions diferents de lectura de llibres: l'Adobe Digital Editions, l'Apple iBooks,l'Azardi, el Calibre i el Readium. En la taula 1 es descriuen totes cinc pel que fa a les funcionalitats prioritàries que ofereixen, els tipus de dispositius i sistemes operatius que suporten, i les fonts de les quals poden incorporar llibres. Val a dir que, en tots els casos, l'observació s'ha fet sobre publicacions que permetien l'edició del fitxer que conté les metadades en el format EPUB3, el fitxer "package.opf".

 
Nom de l'aplicació
Funcionalitats prioritàries
Tipus de dispositius i sistemes operatius
Fonts per incorporar llibres
Adobe Digital Editions (versió 4.0.2) Lectura de llibres digitals i gestió de biblioteques Ordinadors amb sistemes operatius Mac OS X o Microsoft Windows Unitats d'emmagatzematge local, en núvol, etc.
Azardi (versió 32.0) Lectura de llibres digitals Ordinadors amb sistema operatiu Linux, Mac OS X o Microsoft Windows: Azardi Desktop i Azardi Online
Dispositius amb sistemes operatius iOS o Android: Azardi Mobile
Azardi Desktop és un producte de distribució lliure. En canvi, Azardi Online i Azardi Mobile són productes comercials que requereixen una llicència Azardi: Content Fulfilment (ACF).
Unitats d'emmagatzematge local
Des de múltiples llibreries en línia i llocs webs d'editors, que signen llicències Azardi: Content Fulfilment (ACF), que inclou quatre components: a bookstore, a delivery System, right managment i reading Systems.

Taula 1. Descripció de les aplicacions de lectura de llibres digitals que han estat objecte d'observació pel que fa al comportament de les metadades de les publicacions EPUB (part 2)

 

En conjunt, aquestes cinc aplicacions representen les diferents fonts d'obtenció de llibres digitals —plataformes de distribució indicades en l'apartat 2, publicacions EPUB disponibles de forma oberta en el web, unitats d'emmagatzematge locals i en núvol, etc.— i els diferents tipus de dispositius i plataformes (sistemes operatius) que suporten les aplicacions. És important assenyalar que si bé inicialment existia una forta vinculació entre les plataformes de distribució i les aplicacions de lectura de llibre, progressivament aquestes darreres han anat diversificant les fonts d'obtenció de publicacions.

Les dades obtingudes a partir de l'observació de les cinc aplicacions de referència s'organitzen a l'entorn de dues qüestions bàsiques:

  • Què ofereixen les metadades de l'EPUB3 a les aplicacions de lectura de llibres digitals, especialment pel que fa als requeriments de tipus de necessitats d'informació dels usuaris i als aspectes de descripció dels llibres digitals?

  • Com es comporten les aplicacions de lectura de llibres digitals amb les metadades de l'EPUB3?

Les respostes a aquestes dues qüestions es presenten a continuació.

 

3.1 Què ofereixen les metadades de l'EPUB3 a les aplicacions de lectura de llibres digitals?

El conjunt format pels elements que el format EPUB3 estableix com a obligatoris per a tot document "Package", i els elements opcionals vinculats a l'esquema Dublin Core Metadata Element Set (2014), des d'ara DCMET, permet descriure la diversitat d'aspectes d'estructura, context de creació i contingut de les publicacions. En la taula 2 es mostra aquest conjunt d'elements.

 
 
Context de creació
Contingut
Estructura
Obligatoris
<dc:language>
<dc:title>
<meta property=
"media:duration">
 
<dc:identifier>
<dc:title>
<meta property=
"dcterms:modified">
Opcionals
<dc:contributor>
<<dc:creator>
<dc:date>
<dc:format>
<dc:publisher>
<dc:rights>
<dc:type>
<dc:coverage>
<dc:description>
<dc:subject>
<dc:relation>
<dc:source>

Taula 2. Classificació d'elements obligatoris i opcionals de l'EPUB3 des del punt de vista dels aspectes de les publicacions que es descriuen

 

Els beneficis de l'aplicació d'aquests mecanismes són diferents segons els elements als quals s'apliquen.

  • Beneficis en l'expressió de metadades estructurals. La qualitat dels sistemes d'organització i cerca de llibres es basa, en gran mesura, en la possibilitat de diferenciar i interrelacionar els diferents tipus d'entitats del procés de creació intel·lectual o creatiu. En el marc del model de referència, Functional Requirements for Bibliographic Records o FRBR, aquestes entitats són quatre: obra (una creació intel·lectual o artística distinta) i expressió (la realització intel·lectual o artística d'una obra), que representen el contingut intel·lectual o artístic, i manifestació (la materialització física de l'expressió d'una obra) i ítem (un exemplar concret d'una manifestació), que representen la forma física. I aquestes quatre entitats poden presentar-se com a unitats integrals o com a entitats agregades o entitats components.

L'FRBR és el marc de referència promulgat per l'IFLA per poder catalogar les obres intel·lectuals mantenint la relació entre les seves diferents manifestacions físiques. Per exemple, l'FRBR ens permet catalogar i relacionar un conte universal com la Caputxeta vermella, la seva realització en llibre —en diferents versions i editorials—, en conte parlat o, fins i tot, en dibuixos animats.

L'especificació de l'EPUB3 estableix un mecanisme d'identificació únic i no ambigu de les publicacions com a obres, per garantir-ne la permanència malgrat petits canvis que es puguin produir en les presentacions i continguts. L'aplicació d'aquest mecanisme, amb el suport de la figura dels identificadors d'emissió/edició, facilita la preservació de la identitat d'una obra i, alhora, l'establiment d'una vinculació entre les diferents versions o, en el model FRBR, manifestacions. Aquest és un propòsit que en contextos d'organització i cerca de llibres digitals pot resultar especialment rellevant.

Entre els tipus de propietats proporcionades per l'EPUB3 per al refinament d'elements, cal destacar els tipus següents per a l'expressió de relacions entre entitats que representen el contingut intel·lectual o artístic: title-type (per a l'element <dc:title>) i identifier-type (per als elements <dc:identifier> i <dc:source>). Fins i tot és possible expressar la vinculació de publicacions i presentacions a col·leccions mitjançant l'ús de propietats de refinament belongs-to-collection, collection-type i group-position.

  • Beneficis en l'expressió de metadades relacionades amb el context de creació i amb el contingut. Algunes de les propietats aplicables al refinament d'elements faciliten l'enriquiment d'aspectes relatius al context de creació i al contingut de les publicacions EPUB i les seves presentacions. Alguns dels tipus de refinaments són:

    - La propietat de refinament title-type per caracteritzar a quin tipus de títol correspon el valor d'una instància de l'element <dc:title>.

    - La propietat de refinament role per caracteritzar a quin tipus de responsabilitat intel·lectual o artística correspon el valor d'una instància dels elements <dc:creator> o <dc:contributor>.

    - La propietat de refinament alternative-script per expressar el valor de qualsevol element en una llengua i/o sistema d'escriptura diferent.

    - La propietat file-as per expressar el valor de qualsevol element d'una forma normalitzada, i facilitar, per exemple, l'ordenació en llistes alfabètiques.

 

3.2 Com es comporten les aplicacions de lectura de llibres digitals amb relació a les metadades de l'EPUB3?

El comportament de les aplicacions de lectura de llibres digitals amb relació a les metadades de l'EPUB3 comprèn dues dimensions: en primer lloc, l'anàlisi de quins elements importen les publicacions i com els importen, i, en segon lloc, l'anàlisi de l'explotació específica dels elements importats en els tres contextos clau d'ús i explotació de metadades que hem indicat més amunt.

En la taula 3 s'identifiquen els elements de metadades que s'importen per a cada una de les aplicacions de lectura de llibres, i, a més, s'hi incorporen alguns detalls rellevants per a la nostra valoració.

  • En els casos en què l'element és importat, es detalla si l'aplicació en qüestió incorpora totes les instàncies assignades, quan l'element <metadata> n'inclou més d'una (Totes les instàncies), o si únicament se n'hi incorpora una d'específica (bàsicament, Primera instància o Darrera instància).

  • En els casos que l'element no és importat (NI), es detalla si l'aplicació en qüestió incorpora elements procedents de fonts diferents de l'element <metadata> del document "Package", però amb un abast equiparable (totalment o parcialment) als elements obligatoris i opcionals de l'esquema DCMET.
 
Obligatoris
Adobe Digital Editions
Apple iBooks
Azardi
Calibre
Readium
<dc:identifier>
NI
NI
Darrera instància NI. Abast equiparable a "identifiers" i, parcialment, a "id" i "uuid" Primera instància
<dc:title> Primera instància Darrera instància Darrera instància Primera instància Primera instància
<dc:language>
NI
NI
NI
Totes les instàncies
NI
<meta property=
"dcterms:modified">
NI
NI
NI
NI. Abast equiparable a "Modificat" / "last_modified" Primera instància
<meta property=
"media:duration">
NI
NI
NI
NI
NI

Taula 3. Importació d'elements de metadades de l'element <metadata> en les aplicacions de lectura de llibres digitals. L'abreviatura NI equival a no importat (part 1)

 
Opcionals
Adobe Digital Editions
Apple iBooks
Azardi
Calibre
Readium
<dc:contributor>
NI
NI
NI
NI
NI
<dc:coverage>
NI
NI
NI
NI
NI
<dc:creator> Primera instància Primera instància Darrera instància Totes les instàncies Primera instància
<dc:date>
NI
NI
Darrera instància Incorpora únicament la instància amb el valor més antic Primera instància
<dc:description>
NI
NI
Darrera instància Darrera instància
NI
<dc:format> Abast parcialment equiparable a "Pàgines"   Abast parcialment equiparable a "Type" i "Version" Abast parcialment equiparable a "Formats" i a "size" Abast parcialment equiparable a "EPUB Version"
<dc:publisher> Primera instància
NI
Darrera instància Incorpora únicament la instància amb el primer valor segons l'ordre alfabètic Primera instància
<dc:relation>
NI
NI
NI
NI
NI
<dc:rights>
NI
NI
NI
NI
NI
<dc:source>
NI
NI
NI
NI
NI
<dc:subject>
NI
NI
NI
Totes les instàncies
NI
<dc:type>
NI
NI
NI
NI
NI

Taula 3. Importació d'elements de metadades de l'element <metadata> en les aplicacions de lectura de llibres digitals. L'abreviatura NI equival a no importat (part 2)

 

A partir de les dades recollides en la taula 3, és possible identificar les tendències següents en el comportament de les aplicacions de lectura de llibres digitals.

  • Dels quatre elements obligatoris en el format EPUB3, únicament <dc:title> és importat per totes les aplicacions. Entre els elements que l'EPUB3 estableix com a opcionals, <dc:creator> també és importat per totes les aplicacions, mentre que  <dc:publisher> és importat per totes amb l'única excepció de l'Apple iBooks.

La importació d'elements de metadades relatives al contingut de les publicacions és molt limitada: l'element <dc:subject> és únicament importat pel Calibre, i l'element <dc:description>, per l'Azardi. Pel que fa als elements orientats a l'establiment d'associacions formals entre diferents publicacions EPUB, a banda de la pràctica generalitzada d'importar <dc:title>, l'element <dc:identifier> és importat per l'Azardi i el Readium i aquest segon importa també <meta property="dcterms:modified">.

  • En general, la incorporació de llibres en les aplicacions de lectura representa la importació directa de les metadades des del document "Package", sense modificar el contingut dels elements. Un cas especial és el Calibre. Aquest programa està integrat per un conjunt d'aplicacions que, a part d'organitzar i llegir els llibres, també permet crear-los i editar-los. L'arquitectura del Calibre segueix un model modular, de forma que moltes funcionalitats són desenvolupades mitjançant connectors escrits en Python. Una d'aquestes funcionalitats és la lectura i extracció de metadades de fitxers EPUB.4 En la configuració actual, aplica diverses modificacions en la secció <metadata> de la còpia del fitxer que incorpora en l'estructura de fitxers del Calibre. En les figures 4 i 5 es pot observar el contingut de la secció <metadata> del document "Package" original, i el contingut en el document "Package" generat pel Calibre i incorporat en el seu dipòsit.
 

Figura 4. Secció <metadata> en un document "Package"original d'un llibre EPUB3

 

Figura 5. Secció <metadata> en el document "Package" generat pel Calibre, amb les alteracions aplicades pel connector "Read EPUB metadata"

 

Aquestes modificacions afecten de forma decisiva el comportament d'alguns elements de metadades, i dels seus valors, en els contextos d'organització, cerca i presentació d'informació sobre els llibres de les biblioteques personals. Dels elements <dc:identifier>, <dc:title> i <dc:creator>, el Calibre incorpora variants en la còpia del document "Package", que són utilitzades en els contextos d'organització i cerca de llibres, en detriment dels elements i valors originalment incorporats en la publicació EPUB. En el cas de l'element <dc:identifier>, la substitució de l'identificador original de la publicació EPUB fa que en els contextos d'organització i cerca de llibres sigui impossible la interrelació entre les diferents presentacions que encarnen un mateix contingut intel·lectual. En els casos de <dc:title> i <dc:creator>, els nous valors generats pel Calibre no compleixen completament les regles de normalització de títols i noms de persona, respectivament.

Resoldre aquests problemes detectats en l'aplicació del connector sobre el document "Package" original és possible mitjançant l'editor de metadades —que desplega un panell WYSWYG5—, o mitjançant l'edició del document XML, a través de l'editor del llibre existent a les funcionalitats del Calibre. En la figura 6 es pot observar el document "Package" generat pel Calibre, amb les modificacions incorporades a través de l'editor de metadades per superar els errors indicats.6

 

Figura 6. Secció <metadata>en el document "Package" generat pel Calibre, amb les mesures aplicades mitjançant l'editor de metadades del Calibre per contrarestar els efectes d'algunes alteracions aplicades pel connector "Read EPUB metadata"

 
  • Les dades recollides mostren que, en general, les aplicacions ignoren els dos mecanismes habilitats al format EPUB3 per enriquir les metadades i incrementar els nivells de detall dels seus valors.

    - D'una banda, en cas que en un mateix document "Package" hi hagi més d'una instància d'un mateix element, les aplicacions en seleccionen i n'importen una de sola. Únicament el Calibre aplica un criteri d'exhaustivitat per a dos elements: <dc:language> i <dc:creator>.

    - De l'altra, les aplicacions exclouen de les dades importades els components d'enriquiment dels valors amb què es poblen, com són els atributs dels mateixos elements i els elements de refinament.

La combinació d'aquestes dues pràctiques provoca que els valors finalment incorporats per les aplicacions no siguin sempre els més representatius o útils per als processos d'organització i cerca de llibres en les biblioteques personals. Això és perquè els patrons de selecció solen respondre a un criteri absolut (la primera instància o la darrera instància) i no a la rellevància relativa dels valors en el conjunt de les instàncies d'un mateix element. Així, és previsible que la primera instància de l'element <dc:title> correspongui al títol propi de la publicació, i que la primera instància de l'element <dc:creator> correspongui a la menció de responsabilitat principal de la publicació. Però això no ha de perquè ser així en tots els casos. I més encara: aquesta funció d'establiment d'ordre de prelació en l'assignació de diferents instàncies d'un mateix element és conferida, en el marc de l'EPUB3, a les propietats de refinament. En aquest sentit, el Readium i l'Adobe Digital Editions apliquen patrons de selecció de la primera instància en tots els elements que importen; a priori, és possible que traslladin en una gran part dels casos les instàncies més representatives dels elements, però això no es pot assegurar un cop els mecanismes d'enriquiment de les metadades han estat bloquejats. En les proves fetes amb les aplicacions de lectura, els resultats eren encara pitjors amb l'Azardi, que aplica sistemàticament patrons de selecció de les darreres instàncies en tots els elements. L'Apple iBooks prefereix la darrera instància en el cas de l'element <dc:title> i la primera instància en el cas de l'element <dc:creator>.

L'excepció pel que fa a l'eficàcia dels patrons de selecció és, un cop més, el Calibre. En el cas de l'element <dc:date> aplica el criteri de selecció de la data més antiga, i en el cas de l'element <dc:publisher> aplica el criteri de selecció del primer valor segons l'ordre alfabètic. Són criteris adaptats a la natura dels elements i que proporcionen resultats més fiables que els criteris absoluts.

  • Una atenció especial requereix el comportament de les aplicacions amb relació a la presència de més d'una instància de l'element <dc:identifier> en una mateixa publicació EPUB. L'especificació de l'EPUB3 estableix un mecanisme d'identificació únic i no ambigu de les publicacions, per garantir-ne la permanència malgrat petits canvis que es puguin produir en les presentacions i continguts. L'aplicació d'aquest mecanisme, amb el suport de la figura dels identificadors d'edició/emissió, facilita la preservació de la identitat d'una obra i, alhora, l'establiment d'una vinculació entre les seves diferents versions, un propòsit que en contextos d'organització i cerca de llibres digitals pot resultar especialment rellevant. Malauradament, el comportament de les aplicacions de lectura analitzades mostren una resposta nul·la a l'aplicació d'aquestes mesures que, en general, són de obligat compliment en les publicacions EPUB. Així, en cas que un document "Package" incorpori més d'una instància de l'element <dc:identifier>, l'Azardi importa la darrera instància, i el Readium la primera.

  • La descripció del format és un aspecte de les publicacions que és majoritàriament utilitzat per les aplicacions de lectura de llibres. Entre les metadades opcionals del format EPUB3, existeix un element que el cobreix,<dc:format>. No obstant això, el valor d'aquest aspecte és obtingut de fonts alienes al document "Package" d'aquestes publicacions. Val a dir que aquest element, més enllà de ser opcional a l'EPUB3,  té un abast molt ampli a DCMET, la qual cosa fa que els valors assignats en origen siguin excessivament diversos (formats de fitxers, mitjans físics, dimensions de les publicacions en termes de mides i durades, etc.) i desbordin els límits previstos en les aplicacions. Sobre aquest mateix aspecte cal destacar que el Calibre declina importar des del document "Package" dos elements obligatoris a l'EPUB3, com són <dc:identifier> i <meta property="dcterms:modified">.

En conjunt, el Calibre i el Readium són les dues aplicacions que fan una explotació més extensa de les metadades procedents de l'EPUB3 (cada una n'inclou un total de set). Si comparem aquest nombre amb el conjunt total de metadades presentades en els panells observem que el Readium extreu set de les nou metadades exposades del fitxer EPUB (77 %), l'Azardi, sis d'onze (54 %) i el Calibre, set de setze (43 %).

Un cop hem presentat quins elements de metadades de les publicacions EPUB són importats per les aplicacions de referència, a continuació completarem l'anàlisi del comportament d'aquestes aplicacions en els tres contextos clau d'ús i explotació de les metadades en les biblioteques personals.

  • Sistemes d'exploració de les biblioteques personals (browsing). Les metadades, i els seus valors, poden esdevenir instruments d'agrupació, filtratge i ordenació dels llibres, per facilitar la navegació en les biblioteques personals. En aquest context, no tenim en compte els elements <dc:identifier> i <dc:description>, ja que no resulten útils per a aquests processos. L'anàlisi de les dades ens permet concloure que l'aplicació que explota de forma menys intensiva les metadades importades de l'EPUB3 és el Readium: no utilitza <meta property="dcterms:modified">, <dc:date> ni <dc:publisher>. D'altra banda, l'Azardi exclou l'element <dc:publisher> i el Calibre, el <dc:title>. 

Addicionalment, la coberta que mostra l'Azardien el sistema d'exploració dels llibres correspon a l'element <cover-image> que es pot declarar en la secció <manifest> del document "Package".

  • Sistemes de recuperació dels llibres per paraules clau (searching). La incorporació de cercadors en les aplicacions de lectura de llibres no és una pràctica majoritària. De les aplicacions analitzades, únicament dues, l'Azardi i el Calibre, incorporen aquesta funcionalitat. D'aquests, el primer ofereix un cercador que únicament permet consultes per termes lliures, sense solucions de limitació de les paraules de cerca a camps concrets, ni a la fase de plantejament de les consultes ni a la fase de filtratge de resultats. El Calibre torna a ser l'aplicació més avançada en aquest àmbit. Com es pot observar en la figura 7, la cerca avançada inclou vint-i-tres camps de cerca per limitar l'abast de les paraules clau.
 

Figura 7. Interfície de la cerca avançada en el Calibre

 

D'aquests vint-i-tres camps, set corresponen a metadades importades des del document "Package" de les publicacions de l'EPUB, com es pot observar en la taula 4.

 
Etiquetes en el Calibre Elements importats de l'EPUB3
authors dc:creator
languages dc:languge
last_modified meta property="dcterms:modified"
pubdate dc:date
publisher dc:ppublisherublisher
tags dc:subject
title dc:title

Taula 4. Correspondències entre etiquetes del Calibre i elements importats de l'EPUB3

 

I quatre dels elements són mostrats en les pantalles de resultats de la cerca, com es pot veure en la taula 5.

 
Etiquetes en el Calibre Elements importats de l'EPUB3
autors dc:creator
publicat dc:date
editorials dc:publisher
etiquetes dc:subject
idiomes dc:language

Taula 5. Correspondències entre etiquetes del Calibre i elements importats de l'EPUB3

 
  • Presentació d'informació sobre els llibres prèvia a la selecció i lectura d'un llibre concret, o d'un conjunt de llibres recuperats a partir dels dos contextos anteriors. Totes les aplicacions de lectura de llibres ofereixen panells de desplegament d'informació sobre cada llibre incorporat en la biblioteca personal. Aquests panells es poden desplegar abans de seleccionar i llegir un llibre. En la taula 3 es mostra, per a cada aplicació analitzada, quins elements importats des del document "Package" són utilitzats en aquests panells.

Addicionalment, la coberta que mostra el Readiumen els panells de desplegament d'informació dels llibres correspon a l'element <cover-image>, seguint el mateix mecanisme que hem comentat anteriorment amb relació a l'Azardi.

 

4 Conclusions i recomanacions

El format EPUB ofereix els recursos necessaris per situar en el mateix moment de la producció dels llibres la incorporació de metadades (catalogació en origen), de forma que puguin ser reutilitzades i explotades en fases posteriors de la cadena, sense perdre valors necessaris com la integritat de la identitat de la publicació enfront a variacions posteriors (Centelles, Ribera 2015). Amb aquest article hem volgut observar com s'utilitzen i exploten les metadades en dos contextos clau pel que fa a l'experiència d'usuari del llibre digital: les plataformes de distribució i les aplicacions de lectura. Amb aquesta finalitat, hem seleccionat i hem observat el comportament de mostres rellevants d'aquestes dues categories d'instruments.

En el cas de les plataformes de distribució, les dades obtingudes mostren que les metadades incorporades en el document "Package" no es tenen en compte en el procés de publicació, ni (en conseqüència) en els sistemes de cerca, selecció i adquisició de llibres. No sabem encara quina serà l'evolució en el comportament amb el format EPUB3, però davant la situació actual, la nostra recomanació als autors i editors de llibres en format EPUB3 és que, fins al punt que sigui possible, apliquin criteris de coherència entre les metadades que s'incorporen en els documents "Package" de l'EPUB3 i les metadades que s'incorporen en els formularis de publicació dels llibres en les plataformes de distribució.

És en l'àmbit de les aplicacions de lectura de llibres on la potencialitat de les metadades assignades en origen podria tenir un paper més rellevant per a l'experiència d'usuari. Cal tenir en compte que aquestes aplicacions permeten dissenyar veritables biblioteques personals. Les mostres obtingudes a partir de l'observació de cinc productes representatius ens permeten constatar que les metadades del document "Package" sí que són importades en el moment d'incorporar llibres, però que l'ús en la cerca i organització dels llibres és, en general, força limitat. La limitació ve donada tant pel nombre d'elements importats com per la fidelitat en la importació que sovint descuida els diferents mecanismes d'enriquiment de les metadades originals.

Quant a les aplicacions de lectura, recomanem als autors i editors incorporar com a mínim els elements de metadades obligatoris al format EPUB3 per permetre la validació de les publicacions. Pel que fa als elements de metadades opcionals, és difícil fer una recomanació ja que caldrà veure quins són importats per cada aplicació de lectura en concret. Finalment, i conscients de la pèrdua que això significa, amb l'estat actual de la tecnologia, recomanem evitar l'ús dels mecanismes d'enriquiment de metadades, i assignar valors únics a cada element, triant el valor que considerem fonamental per representar la publicació.

 

Bibliografia

Adobe Digital Editions (2015). <http://www.adobe.com/solutions/ebook/digital-editions.html>. [Consulta: 25/01/2015].

Apple iBooks (2015). <https://itunes.apple.com/us/app/id364709193>. [Consulta: 25/01/2015].

Azardi: Publisher Solutions: Infogrid Pacific (2015). <http://www.infogridpacific.com/Azardi.html>. [Consulta: 19/12/2014].

Calibre: E-Book Management (2015). <http://calibre-ebook.com/>. [Consulta: 25/01/2015].

Centelles Velilla, Miquel; Ribera, Mireia (2015). "L'assignació de metadades a llibres digitals en el format EPUB3. Primera part. Les metadades en les especificacions de l'EPUB3". BiD: textos universitaris de biblioteconomia i documentació, núm. 35 (desembre). <https://bid.ub.edu/35/centelles.htm>. [Consulta: 12-04-2016].

Dublin Core Metadata Element Set, version 1.1. (2014). <http://dublincore.org/documents/dces/>. [Consulta: 25/07/2014].

EPUB Publications 3.0.1. Recommended specification 28 June 2014 (2014). <http://www.idpf.org/epub/301/spec/epub-publications.html>. [Consulta: 20/03/2014].

Gilliland, A. J. (2008). ″Setting the Stage″. In: Baca, M. (ed.). Introduction to metadata. Los Angeles: Getty Research Institute. <http://www.getty.edu/research/publications/electronic_publications/intrometadata/setting.html>. [Consulta: 25/01/2015].

iTunes Store (2015). <http://store.apple.com/us>. [Consulta: 25/01/2015].

Kindle eBooks (2015). <http://www.amazon.com/Kindle-eBooks/b?ie=UTF8&node=154606011>. [Consulta: 25/01/2015].

Morville, P.; Rosenfeld, L. (2006). Information architecture for the World Wide Web. 3rd ed. Sebastopol (California). O'Reilly.

Project Gutenberg (2015). <https://www.gutenberg.org/>. [Consulta: 25/01/2015].

Readium (2015). <https://chrome.google.com/webstore/detail/readium/fepbnnnkkadjhjahcafoaglimekefifl>. [Consulta: 25/01/2015].

Trabajar con iTunes (2015). <https://www.apple.com/es/itunes/working-itunes>. [Consulta: 25/01/2015].

 

Notes

1L'especificació EPUB Publications 3.0.1 defineix el "sistema de lectura EPUB" (EPUB Reading System) en els termes següents: "A system that processes EPUB Publications for presentation to a User in a manner conformant with this specification and its sibling specifications.".

2Suporta de forma gairebé completa l'EPUB3.0 i algunes funcionalitats de l'EPUB3.0.1.

3En el moment d'elaborar aquest article s'estan fent proves d'optimització amb el Firefox i l'IE9/10.

4Aquest connector es denomina Read EPUB metadata (2.13.0), i està activat per defecte a Preferències > Avançat > Connectors.

5Abreviatura de What You See Is What You Get, que, en català, es pot traduir com "el que veus és el que obtens".

6En el moment d'elaborar aquest article no tenim notícia de l'existència d'un connector disponible  públicament que faciliti la importació de metadades de l'EPUB tot evitant les alteracions no desitjades en les metadades <dc:identifier>, <dc:title> i <dc:creator> que hem indicat.


Similares

Articles similars a Temària

Articles del mateix autor a Temària

Centelles Velilla, Miquel, Ribera, Mireia

[ més informació ]

llicencia CC BY-NC-ND
Creative Commons
Llicència Creative Commons de tipus Reconeixement-NoComercial-SenseObraDerivada. Aquest article es pot difondre lliurement sempre que se'n citi l'autor i l'editor amb els elements que consten en la secció "Citació recomanada". No se'n pot fer, però, cap obra derivada (traducció, canvi de format, etc.) sense el permís de l'editor. Així, BiD compleix amb la definició d'open access de la Declaració de Budapest a favor de l'accés obert. La revista també permet que els autors mantinguin els drets d'autor i els de publicació sense restriccions.