Número 35 (desembre 2015)

L'assignació de metadades a llibres digitals en el format EPUB3. Primera part. Les metadades en les especificacions de l'EPUB3

 

[English version]


Miquel Centelles Velilla

Professor
Departament Biblioteconomia i Documentació
Universitat de Barcelona

Mireia Ribera Turró

Professora
Departament Matemàtica Aplicada i Anàlisi
Universitat de Barcelona

 

Resum

Objectius: descriure els mecanismes i la funció de les metadades internes i descriptives en el format EPUB3 segons els estàndards vigents i les bones pràctiques difoses per la indústria editorial, i identificar un conjunt de recomanacions especialment orientades a petits editors o autors que s'autoediten les obres.

Metodologia: l'article és descriptiu i instructiu, ja que a partir de l'explicació de l'estructura interna d'un llibre en format EPUB3 s'expliquen els diferents elements de metadades, els estàndards corresponents, la seva estructura i els possibles valors. El conjunt de propostes s'exemplifica a partir d'un cas d'estudi.

Resultats: el format EPUB disposa de mecanismes de descripció del context, el contingut i l’estructura dels llibres que emulen, en origen, els instruments específicament orientats a la catalogació, una mostra de la consolidació del model de metadades en origen. Els autors recomanen especialment la inclusió dels cinc elements de metadades obligatoris, tres dels quals (identificador, títol i idioma) dins l'esquema Dublin Core i dos segons un esquema propi, per descriure la data de la darrera modificació i la durada dels mitjans audiovisuals inclosos.

Resumen

Objetivos: describir los mecanismos y la función de los metadatos internos y descriptivos en el formato EPUB3 según los estándares vigentes y las buenas prácticas difundidas por la industria editorial, e identificar un conjunto de recomendaciones especialmente orientadas a pequeños editores o autores que se autoeditan las obras.

Metodología: el artículo es descriptivo e instructivo, ya que a partir de la explicación de la estructura interna de un libro en formato EPUB3 se explican los diferentes elementos de metadatos, los estándares correspondientes, su estructura y los posibles valores. El conjunto de propuestas se ejemplifica a partir de un caso de estudio.

Resultados: el formato EPUB dispone de mecanismos de descripción del contexto, el contenido y la estructura de los libros que emulan, en origen, los instrumentos específicamente orientados a la catalogación, una muestra de la consolidación del modelo de metadatos en origen. Los autores recomiendan especialmente la inclusión de los cinco elementos de metadatos obligatorios, tres de los cuales (identificador, título e idioma) dentro del esquema Dublin Core y dos según un esquema propio, para describir el dato de la última modificación y la duración de los medios audiovisuales incluidos.

Abstract

Objectives: This paper describes how to use internal and descriptive metadata in EPUB 3 according to current standards and the good practices disseminated by the publishing industry. It also offers a series of recommendations which will be especially useful for small publishers and book authors wishing to publish their own works.

Methodology: The paper is descriptive and instructive, using an explanation of the internal structure of a book in EPUB3 format to consider different metadata elements and corresponding standards, their structure and possible values. The authors use a case study to exemplify their recommendations.

Results: The EPUB mechanisms that describe the context, content and structure of books essentially emulate the tools that are specifically designed for cataloguing, an indication of the consolidation of the metadata model in its origin. The authors especially recommend the inclusion of five mandatory metadata elements: identifier, title and language, as drawn from the Dublin Core standard, and two further elements, selected according to the user’s own scheme, to describe the date of the last modification and the duration of the audiovisual media included.

 

1 Introducció

Aquest article té el doble objectiu de mostrar quin és el tractament que fa de les metadades el format de publicació digital EPUB i analitzar i valorar les tendències actuals pel que fa a l'ús i explotació de les metadades de l'EPUB3 en processos d'organització i cerca de llibres digitals en les plataformes de distribució i en els dispositius de lectura dels llibres digitals.

El format EPUB va adquirint una importància creixent en la indústria editorial. Més concretament, la versió del format EPUB que serà objecte d'anàlisi és la 3 (des d'ara, EPUB3), que s'ha publicat el novembre del 2014 amb el títol oficial ISO/IEC TS 30135: Information Technology: Digital publishing: EPUB3.

L'exposició d'aquests dos objectius ens fa possible identificar un conjunt de recomanacions pel que fa al treball amb metadades en la creació i edició de llibres en format EPUB3, especialment orientades a petits editors (incloent-hi els autors que s'autoediten els llibres digitals), i que volen distribuir-los per mitjà de diferents canals, o simplement incorporar-los en biblioteques personals dins de dispositius de lectura.

És important tenir en compte dues consideracions que estableixen els límits de la mostra d'aproximació a les metadades de l'EPUB3. En primer lloc, la definició del concepte de metadades de què partim. En el marc d'aquest article, definim les metadades com a dades estructurades, relatives a publicacions, que descriuen aspectes del context de creació (per exemple, qui l'ha creat), del contingut (per exemple, de què tracten), de l'estructura (per exemple, a quina col·lecció pertany). Les metadades generades sobre una publicació, que habiten en components del format de publicació mateix —metadades internes— faciliten el desenvolupament de diferents tipus d'eines i processos. En aquest article, ens centrarem especialment en els mecanismes d'organització i cerca de llibres digitals en les plataformes de distribució i en les aplicacions de lectura de llibres digitals. En segon lloc, és important tenir en compte que el marc normatiu d'anàlisi de l'EPUB3 se centra en les dues especificacions que recullen les directrius sobre l'assignació de metadades en publicacions EPUB.1 D'una banda, EPUB Publicacions 3.0.1 (2014), que defineix la semàntica i els requisits de conformitat globals per a les publicacions EPUB i. d'altra banda, EPUB Media Overlays 3.0.1 (2014), que defineix un format i un model de processament per a la sincronització de text i àudio. En el context de les publicacions EPUB, un media overlay —que podem traduir per capa de superposició de mitjans— és un document XML que associa un document de contingut XHTML amb la narració àudio preenregistrada per tal de proporcionar una experiència de reproducció sincronitzada. Més endavant, tractarem la descripció mitjançant metadades d'aquests tipus de recursos en les publicacions EPUB.

La nostra aproximació al tractament que fa de les metadades el format EPUB3 està vinculada al projecte d'innovació docent "Creació de continguts multimodals II",2 desenvolupat pel grup de treball Adaptabit,3 en col·laboració amb un equip de professors de la Facultat de Dret de la Universitat de Barcelona. En el marc d'aquest projecte, s'han reelaborat uns materials docents del màster de Dret de Família i Infància per fer-los disponibles en diversos formats i, d'aquesta manera, facilitar-ne l'accés a estudiants amb discapacitats visuals o trastorns d'aprenentatge. El format de publicació digital prioritari que s'ha escollit és la versió 3 d'EPUB, que a més de la rellevància que té en la indústria editorial permet —entre altres funcionalitats avançades— la incorporació de veu sintetitzada. Com a part de la reelaboració dels materials indicats, s'han assignat metadades descriptives a la versió en format EPUB3 del document Módulo: Infancia, protección de la persona y adopción, que forma part de la XVI edició del màster esmentat, seguint les directius de les especificacions d'aquest format. I procedeixen d'aquests materials els exemples amb què il·lustrem els aspectes tractats en aquest article.

 

2 Metadades en el format EPUB3

L'EPUB3 inclou un conjunt d'elements de metadades predefinits, i mecanismes per a la definició d'elements addicionals, d'acord amb les necessitats específiques dels creadors de publicacions EPUB. En el cas dels elements predefinits, l'esquema de referència és Dublin Core Metadata Element Set(2014),4 des d'ara DCMET.

Com hem indicat anteriorment, les fonts fonamentals són les especificacions EPUB Publications 3.0.1 (2014) i EPUB Media Overlays 3.0.1 (2014). A més, cal tenir present que el format EPUB3 utilitza sintaxi XML i normes del web per a l'expressió del contingut —incloent-hi les metadades— i la forma de les publicacions.

Malgrat que diverses publicacions reconeixen el potencial del format EPUB3 per incloure-hi metadades (Barker; Campbell, 2015) i associar-hi diferents tipus de continguts (Sigarchian et al., 2014), segons el coneixement dels autors a data de la publicació d'aquest article no hi ha cap estudi aprofundit sobre les metadades en aquest format i el seu aprofitament.

Ara bé, abans de prosseguir és important diferenciar i definir tres entitats que són objecte de descripció per les metadades de l'EPUB3: l'entitat publicació EPUB (EPUB publication), l'entitat presentació (rendition) i l'entitat recurs (resource).

Una publicació EPUB és una col·lecció d'una presentació o més, empaquetades en un contenidor (EPUB Container) en forma d'arxiu ZIP, i que, en general, representa una única obra intel·lectual o artística. Una mateixa publicació pot tenir una presentació o més, cada una de les quals és un conjunt de recursos interrelacionats que representen una realització d'una publicació EPUB. Per exemple, d'una mateixa publicació EPUB pot existir una presentació visual, una presentació àudio, etc.

Un recurs pot incloure contingut creatiu o instruccions que contribueixen a la lògica i la concreció d'una presentació d'una publicació EPUB. Són exemples de recursos de publicació, el document "Package" d'una presentació, el document de contingut EPUB (EPUB Content Documents), els fulls d'estil (CSS) d'EPUB, l'àudio, el vídeo, les imatges, les fonts incrustades i els scripts.

Una publicació EPUB conté un nombre determinat de recursos, que s'organitzen en una presentació o més. Cada recurs ha d'estar incorporat, com a mínim, en una de les presentacions d'una publicació... si és que la publicació incorpora més d'una presentació.

Cada presentació d'una publicació EPUB inclou un únic document "Package", que és un document XML on s'especifiquen tots els recursos necessaris per fer una presentació determinada, es defineix l'ordre de lectura dels recursos i s'associa informació sobre la navegació pels recursos i les metadades de la presentació. En aquest document XML, l'element arrel és <package>, que incorpora tres (sub)elements obligatoris, en l'ordre en què es relacionen a continuació.

  • Un element <metadata>, que encapsula la informació descriptiva sobre la presentació en qüestió.
  • Un element <manifest>, que proporciona una llista exhaustiva dels recursos de la publicació que s'inclouen en la presentació en qüestió.
  • Un element <spine>, que defineix l'ordre de lectura dels recursos de la publicació EPUB en la presentació en qüestió.

A més, l'element <package> ha d'incorporar obligatòriament dos atributs: l'atribut version, que especifica la versió de l'especificació EPUB a què és conforme la presentació descrita en el document "Package",5 i l'atribut unique-identifier, que, com veurem en l'apartat 5, facilita l'expressió de l'identificador principal de la publicació descrita en les metadades (l'anomenat identificador únic).

En aquest article, ens centrem en el primer component que hem indicat, l'element <metadata>. Una exposició detallada de la resta de (sub)elements obligatoris de <package>, i d'altres d'opcionals, es pot trobar a EPUB 3 Overview.6

Igualment, queden fora de l'abast d'aquest article els mecanismes per incorporar metadades dins el contingut dels documents EPUB codificats en XHTML, per fer-los semànticament més rics, i ampliar les possibilitats de processament i accessibilitat. Exemples d'aquests mecanismes són RDFa (XHTML+RDFa 1.1., 2013) i les microdades (HTML Microdata, 2013).

La composició mínima de l'element <metadata> es pot copsar a partir de l'exemple següent.

Composició mínima de l'element <metadata> en un EPUB

Codi 1. Composició mínima de l'element <metadata> en un EPUB

  • L'atribut xmlns (1) per declarar l'espai de noms de DCMET, http://purl.org/dc/elements/1.1/ (2). El prefix dc (3) correspon al prefix amb què s'identifiquen els elements de metadades d'aquest esquema que utilitzarem.
  • Un element fill per cada una de les metadades amb què es descriu la publicació (4, 5, 6, 7). Els elements de metadades aplicables es resumeixen en la taula 1, on s'indica quines són les condicions d'obligatorietat: obligatori (una instància o més de l'element) o opcional (cap instància o més). Val a dir que no hi ha un ordre predefinit d'aquests elements, i que tots són repetibles.
Elements de les metadades
Obligatorietat
Cardinalitat
<dc:identifier>
Una o més
<dc:title>
Una o més
<dc:language>
Una o més
Elements de metadades de DCMES opcionals:
<dc:contributor>
<dc:coverage>
<dc:creator>
<dc:date>
<dc:description>
<dc:format>
<dc:publisher>
<dc:relation>
<dc:rights>
<dc:source>
<dc:subject>
<dc:type>
No
0 o més
<meta>
  • És obligatori un element <meta> amb la propietat dcterms:modified, que declara la data de la darrera modificació d'una presentació.
  • És obligatori un element <meta> amb la propietat media:duration per a la presentació en conjunt, i per a cada una de les media overlays incorporades en una presentació.
  • Tota la resta d'elements <meta> són opcionals.
Dues o més
<link>
No
0 o més

Taula 1. Elements de metadades en l'EPUB3

Cada un d'aquests elements admet diferents tipus d'atributs, que són declarats per l'especificació EPUB Publications 3.0.1 (2014). Alguns d'aquests atributs són genèrics d'XML Schema, concretament, id, xml:lang i dir.

De l'apartat 3 al 7 es descriuen el significat i les condicions d'aplicació de cada un dels elements de metadades establerts pel format EPUB3.

Com es pot observar en la taula 1, l'EPUB3 incorpora un conjunt d'elements de metadades procedents de l'esquema DCMET. D'aquests, tres són obligatoris per a tot document "Package": <dc:identifier>, <dc:title> i <dc:language>. Tots els elements són repetibles, és a dir, un mateix document "Package"pot incorporar-ne més d'una instància.

 

3 Elements obligatoris de DCMET

3.1 Element <dc:identifier>

Cada instància d'aquest element conté un (únic) codi d'identificació, associat amb la presentació en qüestió de la publicació EPUB. Els codis poden seguir un sistema propi, o poden estar basats en un sistema normalitzat d'identificació, com ara UUID, DOI, ISBN o ISSN. L'identificador es dóna en l'atribut opcional id, el valor del qual permet identificar la instància concreta de l'element.

Com que l'element <dc:identifier> és repetible, una mateixa presentació pot incorporar diferents identificadors —corresponents a sistemes d'identificació diferents — de la publicació que es descriu. No obstant això, tota secció <metadata> ha de contenir, com a mínim, una instància de l'element <dc:identifier> el valor del qual ha de ser un identificador principal, no ambigu, de la publicació, l'anomenat identificador únic (Unique Identifier). Aquest identificador es caracteritza perquè roman inalterable malgrat que la publicació experimenti revisions menors en el seu empaquetament o contingut, de manera que en preservarà la identitat en qualsevol procés d'identificació i distribució.

Per tal d'especificar quin de tots els identificadors d'una publicació és l'identificador únic, la instància de l'element <dc:identifier> que el conté ha d'incloure, com a valor de l'atribut id, el mateix valor de l'atribut unique-identifier de l'element <package>. Ho podem veure en l'exemple següent.

Repetició del valor de l'identificador a <package> i a <metadata>

Codi 2. Repetició del valor de l'identificador a <package> i a <metadata>

L'especificació EPUB Publications 3.0.1 (2014) proposa algunes bones pràctiques en relació amb el tractament dels identificadors de les publicacions.

  • Tot i que l'identificador únic d'una publicació EPUB no és un valor estàtic, es recomana no generar nous identificadors en actualitzar les metadades, corregir errades o fer altres canvis de menor importància en la publicació EPUB.
  • Per a la identificació de modificacions menors i emissions/edicions, l'especificació de l'EPUB3 defineix un altre tipus d'identificador, l'identificador d'edició/emissió (Release Identifier). Tot i que no és una propietat pròpiament dita en la secció <metadata>, l'especificació EPUB recomana que el seu valor es construeixi concatenant els valors de l'identificador únic i de l'element <meta property="dcterms:modified"> que expressa la data i l'hora de la darrera modificació d'una presentació (vegeu l'apartat 5.1). Procedint d'aquesta forma es facilita la distinció i l'ordenació seqüencial de totes les publicacions EPUB amb el mateix identificador únic. L'exemple següent mostra com un identificador únic i una data de modificació es combinen per formar l'identificador d'edició/emissió.
Element identificador i data de modificació com a identificadors d'edició

Codi 3. Element identificador i data de modificació com a identificadors d'edició

Resultat en l'identificador del document "Package": ca-20140317123428@2014-03-17T12:10:04Z

 

3.2 Element <dc:title>

Cada instància d'aquest element conté un nom donat a una publicació EPUB. Hi ha diferents tipus de títols assignables a una mateixa publicació, com ja veurem en l'apartat 5. Aquest element admet tres tipus d'atributs opcionals: id, xml:lang i dir.

Element <dc:title> amb els seus tres atributs: id, xml:lang i dir

Codi 4. Element <dc:title> amb els seus tres atributs: id, xml:lang i dir

 

3.3 Element <dc:language>

Cada instància d'aquest element especifica una llengua en què s'expressa el contingut d'una presentació d'una publicació EPUB. Aquest element admet un únic tipus d'atribut opcional: id.

Element <dc:language>

Codi 5. Element <dc:language>

 

4 Els elements opcionals de DCMET

Addicionalment, és possible incorporar els elements opcionals procedents de l'esquema DCMET següents: <dc:contributor>, <dc:coverage>, <dc:creator>, <dc:date>, <dc:description>, <dc:format>, <dc:publisher>, <dc:relation>, <dc:rights>, <dc:source>, <dc:subject> i <dc:type>, els     quals són tots repetibles.

La definició i descripció bàsiques de cada un es pot localitzar en l'especificació de l'esquema DCMET. Això no obstant, l'especificació EPUB Publications 3.0.1 (2014) incorpora concrecions sobre l'ús d'alguns elements, que s'han d'aplicar de forma preferent a l'esquema de base. Els elements afectats són <dc:contributor>, <dc:creator>, <dc:date>, <dc:source> i <dc:type>.

A continuació se sintetitzen les definicions i descripcions dels dotze elements opcionals. Situem, en primera posició, els cinc elements especialment concretats per a l'especificació EPUB Publications 3.0.1 (2014).

  • <dc:creator> s'utilitza per representar el nom de la persona, organització, etc. responsable de la creació del contingut de la publicació. Aspectes com el rol desenvolupat pel creador, i les formes alternatives del nom del creador es poden expressar mitjançant el mecanisme de refinament proporcionat per l'element <meta>.
  • <dc:contributor>s'utilitza per representar el nom d'una persona, organització, etc. que ha exercit un paper secundari en la creació del contingut d'una publicació EPUB.
  • <dc:date> s'utilitza per definir la data de publicació de la publicació EPUB. Es recomana que el valor d'aquest element s'expressi seguint el perfil W3CDTF de la norma internacional ISO 8601:2004 (2004). Un exemple és 2014-03-17T12:10:04Z.
  • <dc:source> s'utilitza per identificar publicacions relacionades, a partir de les quals s'ha derivat la publicació EPUB. Aquest element es pot aplicar, per exemple, per identificar una publicació impresa a partir de la qual s'ha editat digitalment la publicació EPUB.
  • <dc:type> s'utilitza per indicar que una publicació EPUB és d'un tipus específic, des del punt de vista d'aspectes com la natura o gènere. L'especificació EPUB Publications 3.0.1 (2014) remet a un registre de tipus de publicacions per poblar l'element <dc:type> (EPUB Registry of Publication Types, 2014). Val a dir que, en el moment d'elaborar aquest document, molts dels valors d'aquest registre estan en fase d'esborrany.
  • <dc:coverage> identifica l'abast espacial o temporal del recurs, l'aplicabilitat espacial o la jurisdicció en la qual és rellevant. Es recomana assignar valors extrets de vocabularis controlats.
  • <dc:description> inclou una síntesi del contingut del recurs. La descripció pot incloure, però no es limita, un resum, un sumari, una representació gràfica o un abstract del recurs.
  • <dc:format> identifica el format del fitxer, el mitjà físic, o les dimensions del recurs (mida i durada). Es recomana assignar valors extrets de vocabularis controlats.
  • <dc:publisher>identifica la persona, organització o servei responsable de la disponibilitat d'un recurs.
  • <dc:relation> identifica un recurs relacionat, per exemple, una versió en un altre format, una traducció, etc.
  • <dc:rights> inclou informació sobre els drets aplicables a un recurs, com ara els drets de propietat intel·lectual.
  • <dc:subject> identifica la matèria del recurs. Es recomana assignar valors extrets de vocabularis controlats.

Tots aquests elements de metadades opcionals admeten l'atribut id, que identifica de forma exclusiva l'element i que facilita l'associació amb elements <meta>, com veurem en l'apartat 5. Addicionalment, els elements <dc:contributor>, <dc:coverage>, <dc:creator>, <dc:description>, <dc:publisher>, <dc:relation>, <dc:rights> i <dc:subject> també admeten els atributs xml:lang i dir.

 

5 Elements <meta>

L'element <meta> és un mecanisme per incorporar elements de metadades addicionals, que no s'inclouen en l'esquema DCMET,7 o per refinar qualsevol element.8 Entenem per refinar la incorporació de detalls sobre una instància concreta d'un element de metadades i sobre el valor amb què es pobla. El refinament és un mecanisme fonamental d'enriquiment dels elements de metadades que proporcionen les especificacions de l'EPUB3.

Els elements objecte de refinament poden ser tant els elements obligatoris o opcionals de l'esquema DCTERM —que hem vist en els apartats 3 i 4— com els elements addicionals incorporats en el document "Package" com a elements <meta>. Per exemple, podem refinar una instància de l'element <dc:creator> per detallar quin és el seu rol, autor, editor, il·lustrador, etc.

En introduir elements <meta>, cal tenir en compte una sèrie de condicions que es poden observar a partir de l'exemple següent.

Element <meta> amb indicació dels punts en els quals cal fer atenció especial

Codi 6. Element <meta> amb indicació dels punts en els quals cal fer atenció especial

  • Quan volem incorporar un nou element de metadades (1), l'element <meta> ha d'incorporar, com a mínim, un atribut property (2) el valor del qual identifica quin és aquest nou element (3).
  • Quan volem refinar un element que ja ha estat incorporat (4), l'element que es refina s'identifica en el valor de l'atribut refines (5), mentre que el significat del refinament s'identifica en el valor de l'atribut property (6).
  • A més dels tipus d'atributs requerits, l'especificació EPUB Publications 3.0.1 (2014) admet els atributs opcionals següents: id, scheme, xml:lang, dir.

A continuació, detallem alguns aspectes relatius a l'ús d'elements <meta> per als dos propòsits que hem indicat.

 

5.1 Ús d'elements <meta> per incorporar elements de metadades addicionals

És possible incorporar elements de metadades de qualsevol esquema que ens interessi aplicar per descriure les publicacions. En general, es requereix declarar en la secció <package> l'espai de noms corresponent a l'esquema aplicat. Imaginem que volem incorporar l'element primaryTopic, de l'esquema Friend of a Friend (des d'ara, FOAF) (FOAF Vocabulary Specification, 2014), per descriure la matèria principal d'una publicació. El fragment de codi següent mostra com es podria expressar en un document "Package".

Incorporació d'altres esquemes de metadades a l'element <package>

Codi 7. Incorporació d'altres esquemes de metadades a l'element <package>

Amb l'atribut prefix (1) es declara l'espai de noms de l'esquema FOAF. Dins l'element <meta>, es declara l'element primaryTopic com a valor de l'atribut (2) property, precedit del (3) prefix foaf que el vincula a l'espai de noms.

Existeixen, però, alguns esquemes de metadades que es poden incorporar amb el mecanisme <meta> sense declarar prèviament l'espai de noms corresponent, perquè són vocabularis reservats (reserved prefixes). Alguns exemples rellevants són els que s'indiquen en la taula 2.

Esquema
Internationalized Resource Identifier (IRI)
Prefix
DCMI Metadata Terms http://purl.org/dc/terms/
dcterms
Media Overlays Metadata Vocabulary http://www.idpf.org/epub/vocab/overlays/#
media
ONIX for Books: Codelists Issue 26 http://www.editeur.org/ONIX/book/codelists/current.html#
nix

Taula 2. Exemples d'espais de noms d'esquemes de metadades reservats a l'EPUB3

Una relació completa i al dia d'aquests esquemes es pot consultar en el document normatiu EPUB Publications Reserved Prefixes (2013).

 

5.2 Ús d'elements <meta> per refinar elements de metadades

L'apartat "4.3.2 Metadata meta Properties" de l'especificació EPUB Publications 3.0.1 (2014) inclou un vocabulari de valors amb què es pot poblar l'atribut property per detallar el significat d'un refinament determinat, és a dir, el tipus de refinament. El vocabulari estableix, entre altres coses, si un tipus de refinament es pot aplicar a elements específics de l'esquema de base DCMET, o si es pot aplicar a qualsevol element.

Una categorització més rellevant per als nostres propòsits, però, és la que atén a la funció que persegueixen. En general, tenint en compte aquest criteri, podem identificar dues categories de tipus de refinaments: les que permeten detallar la natura de l'element que es refina i, en conseqüència, és concreta el significat del valor assignat a una instància determinada, i les que permeten declarar formes variants d'una mateixa propietat.

Dins la primera categoria, podem situar els tipus de refinament identifier-type, title-type i role. Tots ells són aplicables a un nombre limitat d'elements de l'esquema DCMET.

identifier-type s'aplica únicament als elements <dc:identifier> i <dc:source> per indicar la forma o natura d'un identificador. és possible utilitzar l'atribut scheme per especificar el vocabulari controlat de sistemes d'identificació de publicacions a partir del qual es pobla aquest refinament. En l'exemple següent:

Propietat identifier-type aplicada a <dc:identifier>

Codi 8. Propietat identifier-type aplicada a <dc:identifier>

el valor onix:codelist5 indica que el valor del refinament —01— és el codi corresponent a un sistema propietari, dins el vocabulari controlat List 5: Product identifier type code (2014) d'ONIX for Books (2015).

title-type s'aplica únicament a l'element <dc:title> per indicar-ne la forma o natura. Com en els dos casos anteriors, és possible especificar un vocabulari controlat mitjançant l'atribut scheme. En l'exemple següent:

Ús de la propietat title-type per introduir el número d'edició, el títol principal i la col·lecció

Codi 9. Ús de la propietat title-type per introduir el número d'edició, el títol principal i la col·lecció

els refinaments amb valors de la propietat de tipus de títol ens permeten declarar el títol propi (main), el número d'edició de la publicació (edition) i els títols de les col·leccions a què es vincula la publicació (collection).

role s'aplica únicament als elements <dc:contributor> i <dc:creator> per descriure la natura de la contribució (per exemple, que la persona és l'autor o editor d'una obra). és possible utilitzar l'atribut scheme per especificar el vocabulari controlat de sistemes d'identificació de publicacions a partir del qual es pobla aquest refinament. En l'exemple següent:

Propietat role per introduir la funció d'un autor

Codi 10. Propietat role per introduir la funció d'un autor

el valor marc:relators indica que el valor del refinament —aut— és el codi corresponent al rol d'autor, dins el vocabulari controlat MARC code list for relators (Library of Congress. Network Development and MARC Standards Office, 2014).

Dins la categoria de tipus de refinament que permeten identificar variacions diferents en la designació d'un mateix valor, podem situar alternative-script, file-as i display-seq, que es poden aplicar a qualsevol element.

alternative-script permet incorporar una expressió alternativa del valor de l'element objecte de refinament en una llengua i, si és el cas, sistema d'escriptura diferent. Majoritàriament, s'aplica als elements <dc:creator> i <dc:title>.

file-as permet incorporar una forma normalitzada del valor d'un element de metadades concret, amb finalitats d'ordenació alfabètica. Per exemple, imaginem una instància de l'element <dc:creator> com la següent: <dc:creator id="creator">Isaac Ravetllat Ballesté</dc:creator>. és possible incorporar en l'element <metadata> la forma invertida d'aquest creador —és a dir, "Ravetllat Ballesté, Isaac"— mitjançant un refinament del tipus file-as: <meta refines="#creator" property="file-as">Ravetllat Ballesté, Isaac</meta>. De forma similar podem procedir, per exemple, amb els valors d'instàncies de l'element <dc:title> que s'inicien amb articles, adjectius demostratius, etc. si volem generar una forma òptima per a l'ordenament alfabètic.

display-seq indica la posició numèrica amb què s'ha de mostrar la propietat actual relativa a instàncies del mateix element. Per exemple, en una publicació el contingut de la qual està expressat en més d'una llengua, l'aplicació d'aquest tipus de refinament permet indicar l'ordre de prelació en què les llengües s'han de presentar. En el fragment de codi següent es mostra com es podria expressar la propietat display-seq en un document "Package".

Propietat display-seq aplicada a un document multilingüe

Codi 11. Propietat display-seq aplicada a un document multilingüe

L'ús del tipus de refinament display-seq permet matisar que la llengua castellana (corresponent al codi es) és la principal, i que la llengua llatina (corresponent al codi la) és secundària.

El vocabulari de valors amb què es pot poblar l'atribut property recull altres tipus de refinaments més enllà d'aquestes dues categories, com ara belongs-to-collection, collection-type, group-position, meta-auth, source-of.

Cada una d'aquestes dues categories de refinaments pot aportar beneficis diferents si s'utilitzen en les eines d'organització i cerca de llibres digitals. Ara, però, descriurem dos elements <meta> que, com hem mostrat en la taula 1, són obligatoris en tot document "Package": l'element amb la propietat dcterms:modified i l'element amb la propietat media:duration.

 

5.3. Element <meta> amb la propietat dcterms:modified

Tota presentació ha d'incorporar una instància de l'element <meta>, que declari la data de la darrera modificació. Aquest element ha de contenir un atribut property, el valor del qual ha de ser dcterms:modified, que està vinculat a l'esquema DCMI Metadata Terms (2014) (des d'ara, DCTERMS). El significat d'aquest element no s'ha de confondre amb l'element opcional <dc:date> que, com hem vist en l'apartat 4, s'utilitza per definir la data de publicació de la publicació EPUB.

El valor de l'element <meta> amb la propietat dcterms:modified s'ha d'expressar com una data conforme amb el tipus dateTime de l'XML Schema (XML Schema Part 2: Datatypes Second Edition), amb el format d'expressió CCYY-MM-DDThh:mm:ssZ, anomenat complete date plus hours and minutes.9

Un exemple d'una instància de l'element <meta> amb la propietat dcterms:modified és <meta property="dcterms:modified">2014-03-17T12:10:04Z</meta>.

Es poden incloure més elements <meta> amb propietats de modificació, però no poden tenir l'objectiu de declarar la data de la darrera modificació d'una presentació en qüestió, és a dir, han d'incorporar un atribut refine que faci referència a un altre element o recurs.

 

5.4 Elements <meta> per descriure la durada de les presentacions en conjunt i dels media overlays

L'especificació EPUB Media Overlays 3.0.1 (2014) estableix que en l'element <package> s'ha de descriure, com a mínim, la durada de la presentació completa, així com la de cada un dels media overlays incorporats en la publicació EPUB. En tots els casos, l'element ha de contenir un atribut property, el valor del qual ha de ser media:duration, que està vinculat a l'esquema "Media Overlays Metadata Vocabulary" (2014). Com hem indicat anteriorment, és un vocabulari reservat, i, en conseqüència, el seu espai de noms no s'ha de declarar amb l'atribut prefix en l'element <package>.

El valor de l'element <meta> amb la propietat media:duration s'ha d'expressar com un valor de rellotge (clock value), que és un subconjunt de valors de Synchronized Multimedia Integration Language (SMIL) (SMIL 3.0 Timing and Synchronization, 2008). Les durades especificades representen els clips d'àudio coneguts en temps d'edició, de manera que no inclouen la transmissió en viu dels recursos externs ni la reproducció.

Una mostra de descripció de la durada de la presentació completa és la següent.

Indicació de la durada d'un contingut multimèdia amb la propietat media:duration

Codi 12. Indicació de la durada d'un contingut multimèdia amb la propietat media:duration

La durada d'aquest recurs és d'una hora, cinquanta-tres minuts, vint-i-cinc segons i seixanta-cinc centèsimes de segon.

La incorporació d'elements <meta> per descriure la durada dels media overlays requereix que, prèviament, aquests media overlays s'hagin declarat (i identificat) en la secció <manifest>. Dins aquesta secció, cada component es declara mitjançant un element <item>. A continuació, es presenta un exemple de declaració de media overlays.

Declaració d'elements media-overlay al <manifest>

Codi 13. Declaració d'elements media-overlay al <manifest>

El contingut d'un element <item> ha d'incloure (obligatòriament) un atribut id per identificar-lo (1). En aquest exemple, l'element <meta> amb l'identificador item_1 és el que referencia un document de contingut EPUB. En aquest mateix element, s'inclou un atribut (opcional) media-overlay (2), on es referencia l'identificador del media overlay que es descriurà en un altre <item>, amb l'identificador item_44.

L'element <meta> amb l'identificador item_44 (3) és el que descriu de forma detallada el media overlay. En el contingut, hi ha un atribut (obligatori) media-type (4), el valor del qual és —tal com succeeix en tots els media overlaysapplication/smil+xml (“Core Media Types”, 2014).

Un cop un media overlay s'ha declarat i identificat en la secció <manifest>, és possible descriure'n la durada mitjançant un element <meta> de refinament amb una propietat media:duration. Ho podem veure en l'exemple següent, que refina el media overlay declarat en l'exemple anterior.

Indicació de la duració del media-overlay declarat prèviament

Codi 14. Indicació de la duració del media-overlay declarat prèviament

El vocabulari de referència "Media Overlays Metadata Vocabulary" (2014) proporciona altres propietats per descriure altres aspectes de la presentació en conjunt i dels media overlays. Una propietat aplicable a tots els casos és narrator, que permet identificar el nom del narrador.

Per a la presentació en conjunt, hi ha dues propietats addicionals:

  • active-class: el nom de la classe CSS definida per l'autor per aplicar a l'element de contingut de document EPUB que s'està reproduint.
  • playback-active-class: el nom de la classe CSS definida per l'autor per aplicar a l'element de contingut de document EPUB quan la reproducció és activa.
 

6 L'element <link>

L'element <link> és un mecanisme que, entre altres coses, permet associar un registre de metadades complet a una publicació EPUB. Tal com hem indicat en l'apartat 1, un registre de metadades és un conjunt d'elements que descriuen d'una forma completa una publicació, seguint un esquema de metadades predefinit i expressat en un format d'intercanvi de dades determinat.

Exemple de registre de metadades d'una publicació, pertanyent al Dipòsit Digital de la UB (2008-)

Figura 1. Exemple de registre de metadades d'una publicació, pertanyent al Dipòsit Digital de la UB (2008-)

En l'aplicació de l'element <link>, cal fer dues consideracions fonamentals:

  • Aquest mecanisme permet associar registres de metadades de qualsevol esquema.
  • Els registres de metadades associats poden estar allotjats en el contenidor d'EPUB o fora de la publicació (un catàleg editorial, un catàleg de biblioteca, un dipòsit institucional, etc. disponibles en el web).

L'element <link> admet cinc atributs, dos dels quals són obligatoris: rel i href. L'aplicació d'aquests atributs es pot observar en l'exemple d'element <link> següent.10

Exemples d'ús dels atributs rel i href en un element <link>

Codi 15. Exemples d'ús dels atributs rel i href en un element <link>

  • L'atribut rel (1) permet indicar que el que s'associa és un registre de metadades i, fins i tot, es pot detallar amb quin esquema s'ha creat el registre. Tots els valors disponibles per a aquest atribut estan definits en un vocabulari normatiu: l'EPUB Link Relationships Vocabulary (2013). Alguns esquemes tenen assignats valors específics; per exemple, el valor onix-record indica que l'esquema del registre de metadades és ONIX for books (2015). Més enllà d'aquests esquemes, el valor genèric per associar un registre de metadades és record.
  • L'atribut href (2) permet indicar la localització del registre de metadades, tant si aquesta localització és interna al contenidor de la publicació EPUB com si és externa.

El procediment de declaració d'espais de noms corresponents als esquemes aplicats en l'element <link> és idèntic al que hem vist en el cas dels elements <meta>.

 

7 L'element cover-image

Un cas especial pel que fa a les metadades aplicables a publicacions EPUB és l'element relatiu a la coberta de la publicació —cover-image. L'especificació EPUB Publications 3.0.1 (2014) estableix que la imatge de la coberta és un dels components d'una publicació que es pot declarar en la secció <manifest>. Un exemple de declaració d'un <item> corresponent a la imatge de la coberta d'una publicació és el següent.

 Declaració de la imatge de la coberta dins l'element <manifest>

Codi 16. Declaració de la imatge de la coberta dins l'element <manifest>

El valor de l'atribut id de l'element <item> vincula aquest component de la publicació amb l'element de metadades relatiu a la imatge de la coberta.

La imatge de la coberta és primordial per a la identificació comercial del llibre electrònic en tota la cadena de distribució. Els dispositius de lectura basats en l'especificació EPUB3 són capaços de presentar i reconèixer perfectament aquesta imatge a través de l'element <item> corresponent declarat en la secció <manifest>. EPUB Publications 3.0.1 (2014), per compatibilitat amb la versió 2 d'EPUB (Open Packaging Format (OPF) 2.0.1 v1.0., 2010), en l'apartat "3.4.8 The meta Element (OPF2)" admet la incorporació d'un element <meta> per descriure la coberta, ja que moltes plataformes de distribució digital exigeixen la presència d'aquest element. No obstant això, adverteix que els dispositius de lectura basats en l'EPUB3 han d'ignorar-lo.

Exemple de coberta de publicació EPUB expressada com a <item> i descrita amb un element <meta>

Figura 2. Exemple de coberta de publicació EPUB expressada com a <item> i descrita amb un element <meta>

Aquest element millora la presentació del llibre en les col·leccions digitals de les plataformes de distribució, i facilita la identificació, a primer cop d'ull, en les biblioteques personals de les aplicacions de lectura de llibres.

 

8 Conclusions i recomanacions

Les especificacions del format EPUB3 incorporen previsions sobre elements de metadades relatives al context, al contingut i a l'estructura de les publicacions, dins un dels components fonamentals, el document "Package". Aquest document especifica i descriu els recursos que conformen una presentació d'una publicació EPUB. L'esquema de metadades de referència és Dublin Core Metadata Element Set (DCMET), tot i que s'han habilitat mecanismes per incorporar elements vinculats a altres esquemes de metadades (elements <meta>) i per enllaçar les publicacions amb registres de metadades allotjats en el contenidor d'EPUB mateix o fora de la publicació (mitjançant elements <link>).

Del conjunt d'elements de metadades susceptibles d'incorporar-se en un document "Package", n'hi ha cinc que són obligatoris, i que, en conseqüència, condicionen la validesa de les publicacions EPUB. D'aquests, tres es vinculen a l'esquema de referència (<dc:identifier>, <dc:title> i <dc:language>). Els altres dos (la declaració de la data de la darrera modificació d'una presentació i la declaració de la durada de la presentació completa i de cada una de les media overlays que s'han declarat en l'element <manifest>) es declaren com a elements <meta>.

L'expressió dels elements de metadades disposa de mecanismes d'enriquiment, per tal de concretar el significat del valor assignat a un element (per exemple, quin tipus de responsabilitat ha exercit una persona declarada en l'element <dc:creator>), o per declarar formes variants d'una mateixa propietat (per exemple, un títol propi i un títol variant en sengles instàncies de l'element <dc:title>).

En conjunt, podem afirmar que les publicacions creades amb el format EPUB3 disposen de mecanismes de descripció del context, el contingut i l'estructura dels llibres que emulen, en origen, els instruments específicament orientats a la catalogació, posats a disposició d'agents dedicats a aquesta tasca, i que tradicionalment s'han situat en etapes posteriors de la cadena de valor dels llibres.

El tractament que fa de les metadades internes el format EPUB3 mostra, a priori, una consolidació de l'assumpció per part dels productors i editors de llibres digitals de rols de catalogadors dels llibres, que s'integren en altres rols com la creació i el disseny del contingut. Tot sembla indicar que el format EPUB3 esdevindrà prioritari en el context editorial. En conseqüència, existeixen els instruments per situar en el mateix moment de la producció dels llibres la incorporació de metadades (catalogació en origen), de manera que es puguin reutilitzar i explotar en fases posteriors de la cadena, sense perdre valors necessaris com la integritat de la identitat de la publicació enfront a variacions posteriors. I sense renunciar, això sí, a la possibilitat d'enriquir les dades sobre les publicacions en fases posteriors.

Els beneficis que, a priori, es podrien derivar d'aquest avançament a l'origen de les metadades de les publicacions, xoquen amb limitacions que s'imposen al seu ús en dos contextos clau des del punt de vista de l'experiència d'usuari: les plataformes de distribució dels llibres digitals i les aplicacions de lectura de llibres.

 

Bibliografia

Barker, P.; Campbell, L. M. (2015). "LRMI, Learning Resource Metadata on the Web". En: International Conference on World Wide.

"WWW'15 Companion: proceedings of the 24th International Conference on World Wide Web" (2005). International World Wide Web Conferences Steering Committee. Geneva, Switzerland.

"Core Media Types" (2014). En: EPUB Publications 3.0.1: proposed specification 28 February 2014. <http://www.idpf.org/epub/301/spec/epub-publications.html#sec-core-media-types>. [Consulta: 20/03/2014].

DCMI Metadata Terms (2014). <http://dublincore.org/documents/dcmi-terms/>. [Consulta: 05/08/2014].

Dipòsit Digital de la UB (2008-). Barcelona: Universitat de Barcelona. Centre de Recursos per a l'Aprenentatge i la Investigació. <http://diposit.ub.edu/dspace/>. [Consulta: 25/01/2015].

Dublin Core Metadata Element Set, Version 1.1. (2014). <http://dublincore.org/documents/dces/>. [Consulta: 25/07/2014].

EPUB Content Documents 3.0.1 (2014). <http://www.idpf.org/epub/301/spec/epub-contentdocs.html>. [Consulta: 04/08/2014].

EPUB Link Relationships Vocabulary (2013). <http://www.idpf.org/epub/vocab/package/link/>. [Consulta: 30/07/2014].

EPUB Media Overlays 3.0.1 (2014). <http://www.idpf.org/epub/301/spec/epub-mediaoverlays.html>. [Consulta: 04/08/2014].

EPUB Open Container Format (OCF) 3.0.1 (2014). <http://www.idpf.org/epub/301/spec/epub-ocf.html>. [Consulta: 04/08/2014].

EPUB Publications 3.0.1: proposed specification 28 February 2014 (2014). <http://www.idpf.org/epub/301/spec/epub-publications.html>. [Consulta: 20/03/2014].

EPUB Publications Reserved Prefixes (2013). <http://www.idpf.org/epub/vocab/package/pfx/reserved-20131108.html>. [Consulta: 30/07/2014].

EPUB Registry of Publication Types (2014). <http://www.idpf.org/epub/vocab/package/types/>. [Consulta: 01/08/2014].

FOAF Vocabulary Specification (2014). <http://xmlns.com/foaf/spec/>. [Consulta: 25/01/2015].

HTML Microdata: W3C Working Group Note 29 October 2013. (2013). <http://www.w3.org/TR/microdata/>. [Consulta: 25/01/2015].

ISO 8601:2004: data elements and interchange formats: information interchange: representation of dates and times (2004). Geneva: International Organization for Standardization.

ISO/IEC TS 30135: Information Technology: Digital Publishing: EPUB3 (2014). Geneva: International Organization for Standardization.

Library of Congress. Network Development and MARC Standards Office (2014). MARC code list for relators. <http://www.loc.gov/marc/relators/relaterm.html>. [Consulta: 01/08/2014].

"Media Overlays Metadata Vocabulary" (2014). En: EPUB Media Overlays 3.0.1. <http://www.idpf.org/epub/301/spec/epub-mediaoverlays.html>. [Consulta: 04/08/2014].

ONIX for Books: Codelists Issue 26 (2014). <http://www.editeur.org/files/ONIX%20for%20books%20-%20code%20lists/ONIX_BookProduct_Codelists_Issue_26.html>. [Consulta: 04/08/2014].

Open Packaging Format (OPF) 2.0.1 v1.0. (2010). <http://www.idpf.org/epub/20/spec/OPF_2.0.1_draft.htm>. [Consulta: 30/07/2014].

Register, Renée (2012). Development, use, and modification of book product metadata. New York: Book Industry Study Group.

Sigarchian, Hajar Ghaem et al. (2014). "EPUB 3 for integrated and customizable representation of a scientific publication and its associated resources". CEUR workshop proceedings, vol. 1.282. <http://ceur-ws.org/Vol-1282/lisc2014_submission_3.pdf>. [Consulta: 18/09/2015].

SMIL 3.0 Timing and Synchronization (2008). <http://www.w3.org/TR/SMIL/smil-timing.html#q22>. [Consulta: 16/01/2015].

Wolf, Misha; Wicksteed, Charles (1997). Date and Time Formats. W3C. <http://www.w3.org/TR/NOTE-datetime>. [Consulta: 31/07/2014].

XHTML+RDFa 1.1. (2013). Second Edition. W3C. <http://www.w3.org/TR/xhtml-rdfa/>. [Consulta: 25/01/2015].

 

Notes

1 Les altres dues especificacions són EPUB Content Documents 3.0.1. (2014), que defineix els perfils d'XHTML, SVG i CSS per a l'ús en el context de publicacions EPUB, i EPUB Open Container Format (OCF) 3.0.1 (2014), que defineix un format de fitxer i un model de processament per encapsular un conjunt de recursos relacionats en un sol fitxer (ZIP) de contenidor EPUB.

2 Aquest projecte ha estat finançat amb un ajut del Programa de Millora i Innovació Docent de la Universitat de Barcelona, en la convocatòria del darrer trimestre de l'any 2013.

3 Adaptabit és un grup de treball dedicat a l'accessibilitat digital en docència, recerca i innovació docent, vinculat al Departament de Biblioteconomia i Documentació de la Universitat de Barcelona, i reconegut, el 2013, com a grup d'innovació consolidat (GIDC) a la UB.

4 Dublin Core Metadata Element Set (2014) incorpora quinze elements de metadades (designats propietats) per a la descripció de recursos d'informació. És part d'un esquema més ampli d'elements creat i mantingut pel Dublin Core Metadata Initiative, i que s'anomena DCMI Metadata Terms (2014).

5 El valor 3.0 d'aquest atribut indica la conformitat d'una presentació amb EPUB Publications 3.0.1 (2014).

6 L'esquema XML dels documents "Package" està disponible a <http://www.idpf.org/epub/301/schema/package-30.nvdl>.

7 L'especificació EPUB Publications 3.0.1 (2014) designa aquest ús de l'element meta com a "primary expression".

8 L'especificació EPUB Publications 3.0.1 (2014) designa aquest ús de l'element meta com a "subexpression".

9 Aquest format d'expressió es troba en el perfil W3CDTF de la norma internacional ISO 8601, que es recull en el document de Wolf; Wicksteed, 1997.

10 Aquest exemple s'ha extret d'EPUB Publicacions 3.0.1 (2014).

Similares

Articles similars a Temària

Articles del mateix autor a Temària

Centelles Velilla, Miquel, Ribera, Mireia

[ més informació ]

llicencia CC BY-NC-ND
Creative Commons
Llicència Creative Commons de tipus Reconeixement-NoComercial-SenseObraDerivada. Aquest article es pot difondre lliurement sempre que se'n citi l'autor i l'editor amb els elements que consten en la secció "Citació recomanada". No se'n pot fer, però, cap obra derivada (traducció, canvi de format, etc.) sense el permís de l'editor. Així, BiD compleix amb la definició d'open access de la Declaració de Budapest a favor de l'accés obert. La revista també permet que els autors mantinguin els drets d'autor i els de publicació sense restriccions.