Los pasados días 7, 8 y 9 de febrero nuestras compañeras Vega Rodrigálvarez y Paula Peña, del equipo de Big Data y Sistemas Cognitivos de ITAINNOVA, asistieron al “7th Plenary Meeting” del proyecto europeo EuHubs4Data en Poznan (Polonia), en la sede de uno de los socios del proyecto, en concreto en el Centro de Supercomputación y Redes (PSNC).
Tres días de sesiones de trabajo para debatir sobre cada unos de los paquetes de trabajo del proyecto, acompañados de algún workshop y visita guiada al centro de datos PSNC y a algunos laboratorios de interés.
La importancia y el impacto que los datos tienen en la economía, la industria y la sociedad europeas es hoy en día incuestionable. La innovación basada en los datos es un motor clave del crecimiento y el empleo para impulsar competitividad europea. Por esta razón, el proyecto Euhubs4Data tiene como objetivo crear la referencia europea para la experimentación e innovación en Big Data, aprovechando los logros de las iniciativas relevantes europeas sobre Big Data, vinculándolas todas en un único ecosistema, componiendo todo un catálogo de fuentes de datos y conjuntos de datos, servicios y modelos, y proporcionando una ventanilla única que garantice que las empresas europeas de cualquier nivel puedan acceder fácilmente a las oportunidades económicas que ofrece Big Data.
En este contexto, el grupo de Big Data y Sistemas Cognitivos del Instituto, socio fundador del Aragón DIH, participa con mayor peso y con sus competencias en el liderazgo de la Tarea” 5.2 Anlaysis and Cataloguing of data soruces and datasets” del WP5 – “Federation of data sources and datasets”, y participando en el WP4 – “Toolkit for federated services”, cuyo objetivo es capitalizar los distintos catálogos regionales y europeos para crear una cartera federada de servicios basados en datos a los que los DIH miembros de la federación puedan acceder a nivel local.
En la actualidad, basándonos en una gran colección de fuentes de datos y conjuntos de datos relevantes aportados por los miembros de EUHubs4Data al proyecto y aprovechando las plataformas y repositorios de datos abiertos existentes a nivel de la UE, nacional y regional, incluidos los conjuntos de datos de gran valor identificados por la Comisión Europea, se identifican diferentes dominios de aplicación, formatos, tipos, el uso de distintos estándares de vocabularios y metadatos,… Surge la necesidad de idear una estrategia o metodología para armonizar dinámicamente las fuentes y conjuntos de datos.
Es por ello, que en la tarea 5.2 para alcanzar la armonización de los datos y metadatos, y promover una mejor oferta de servicios, se ha trabajado en añadir una capa semántica que permita una mejor armonización entre estos metadatos y enriquecer los conjuntos de datos con información adicional. A veces, con los metadatos hay campos que faltan para expresar información que va más allá de un dominio de aplicación. En esta tarea, a través de aproximaciones semánticas, se ha investigado cómo generar grafos de conocimiento automáticamente a partir de texto aprovechando modelos lingüísticos basado en trasformadores (Transformers) y usando una ontología como base. En este caso, el modelo IDS (International Data Spaces) que usa conceptos relevantes del International Data Spaces, extendiendo conceptos de otras ontologías externas (DCAT, SKOS, FOAF, …).
Asimismo, dentro del proyecto ITAINNOVA está participando en proyectos/experimentos con empresas que han solicitado servicios proporcionados por Aragón DIH.
Aragón DIH se enmarca en la Actuación ITA05_RU “Innovación tecnológica y digitalización en las empresas”, Objetivo Específico REACT-EU 2 del PO FEDER Aragón 2014-2020, «Financiado como parte de la respuesta de la Unión a la pandemia de COVID-19”, Construyendo Europa desde Aragón.