Responsables del monográfico: Miquel Centelles (UB) y Daniele Metilli (UCL)
Hace más de veinte años que el World Wide Web Consortium (W3C) impulsó su visión y su programa de la web semántica con el objetivo de proporcionar a los sistemas automáticos metadatos procesables automáticamente sobre los datos y la información que se publica en la web. El reto de sistemas automáticos capaces de interpretar semánticamente los datos, y de generar procesos de forma autónoma basados en esa capacidad, se vislumbraba como una revolución definitiva en internet. Pasados esos veinte años, las tecnologías y los estándares que se han desarrollado en el marco de este programa, y que conformaban la ya mítica pila o tarta de capas de la web semántica —con sus relaciones ascendentes y descendentes—, han experimentado un grado de desarrollo desigual. En su conjunto, podemos decir que no se ha implementado en su totalidad.
Algunas tecnologías se han consolidado y han tenido repercusión en múltiples áreas de actividad y especialidad. Es el caso de los identificadores únicos de recursos (URI), de determinados formatos de serialización —como JSON-LD (JavaScript Object Notation for Linked Data)— o de las ontologías vinculadas, por ejemplo, a esquemas de metadatos.
Otras han experimentado un proceso de complementación con otras tecnologías que comercialmente han tenido más éxito. Es el caso del modelo de datos RDF (marco de descripción de recursos), que en muchos contextos de implementación de soluciones con orientación semántica es complementado (e incluso sustituido) por otros modelos orientados a grafos, como son los grafos de propiedades (Neo4J), o incluso por el tradicional modelo relacional. De modo similar, el lenguaje de interrogación SPARQL ha sustituido en algunas ocasiones —con menos capacidad, pero de forma más escalable— a alternativas como GraphQL.
Por último, existe un grupo de tecnologías situadas, precisamente, en la cúspide de la tarta que han sido postergadas o, simplemente, abandonadas.
En algunos contextos, como el jurídico, la implementación de los lenguajes y las tecnologías que han tenido éxito ha dado muestras del trabajo coordinado internacionalmente, y de resultados que han trascendido los límites del laboratorio y de la beta constante. Es el caso, por ejemplo, del Identificador Europeo de Legislación (ELI), un sistema de acceso en línea a la legislación en el contexto de la Unión Europea que está impulsando el desarrollo de servicios de información críticos para la ciudadanía de este milenio.
Muchas bibliotecas nacionales también han transformado sus datos catalográficos y de autoridades al modelo RDF, con el fin de ofrecerlos como datos abiertos; Datos.bne.es e ID.LOC.GOV – Linked Data Service son ejemplos de ello. Este modelo, y la existencia de conjuntos de datos relativos a entidades —como es el caso de Wikidata—, ha abierto un escenario de infinitas posibilidades para el enriquecimiento de conjuntos de datos limitados en su concepción original.
De manera más amplia, también se ha desarrollado con éxito el modelo de publicación de datos enlazados. Este modelo ha sido priorizado por el esquema de cinco estrellas en la publicación de datos abiertos y, más recientemente, los principios FAIR (fáciles de encontrar, accesibles, interoperables y reutilizables) para la gestión de datos de investigación. En su evolución se ha integrado en un ecosistema de generación y publicación de datos semánticamente enriquecidos como son los grafos de conocimiento, que ofrecen tanto su versión abierta como propietaria. A partir de esta segunda versión, los
grafos de conocimiento se están convirtiendo en un activo clave en la gestión del conocimiento corporativo y, al mismo tiempo, en una herramienta clave de entrenamiento de datos en aplicaciones de aprendizaje automático y de explicación de sus resultados.
Teniendo en cuenta estas coordenadas, la revista BiD hace un llamamiento a los investigadores e investigadoras y a los responsables de proyectos y servicios para publicar en el próximo [fecha prevista de publicación del especial] trabajos que muestren la evolución de las tecnologías y los estándares de la web semántica y el estado actual del modelo de publicación de datos (abiertos) enlazados y grafos de conocimiento orientados a la provisión de servicios de información para el público general y para los miembros de instituciones y empresas.
Líneas propuestas:
· Gestión, publicación y explotación de datos abiertos enlazados
· Creación y explotación de grafos de conocimiento
· Servicios de información basados en datos abiertos enlazados y grafos de conocimiento
· Inteligencia artificial y datos abiertos enlazados
· Corpus textuales y datos abiertos enlazados
· Corpus textuales y grafos de conocimiento
· Aplicación de bots en datos abiertos enlazados
· Aplicación de bots en grafos de conocimiento
· Datos abiertos enlazados y diversidad de géneros
· Grafos de conocimiento y diversidad de géneros
· FAIR y datos abiertos enlazados
· FAIR y grafos de conocimiento
· Ontologías y datos abiertos enlazados
· Ontologías y grafos de conocimiento
· Aplicación de ontologías en servicios de información