El informe del Portal Europeo de Datos analiza la implementación de la Directiva (UE) 2019/1024 y su reglamento de ejecución, que exige a los países de la Unión Europea poner a disposición conjuntos de datos de alto valor (HVD). El objetivo de esta iniciativa es facilitar el acceso a estos datos tanto a ciudadanos como a empresas, con el fin de fomentar su reutilización y generar un impacto positivo en la sociedad, la economía y el medio ambiente. A partir de este mes de febrero, los Estados miembros tendrán que informar cada dos años a la Comisión Europea sobre los HVD disponibles, incluyendo los enlaces a las condiciones de las licencias y las API correspondientes.
Este proceso implica varios desafíos para las administraciones públicas, ya que muchos de estos datos ya están disponibles, pero deben ser identificados de manera clara y consistente, dado que existen diferencias en los formatos, estructuras y semánticas de los datos. El informe propone un enfoque metodológico para facilitar la identificación y homogeneización de los HVD en tres pasos clave:
Identificación de los HVD en portales de datos existentes: Aunque existen pautas para la publicación de estos datos, como las que se aplican al DCAT-AP, no hay una nomenclatura uniforme, lo que dificulta su localización. El informe sugiere un protocolo que incluye la definición de palabras clave, basadas en los conjuntos de datos y sus atributos, para facilitar la búsqueda en los portales de datos.
Localización o desarrollo de modelos de datos, ontologías, vocabularios controlados y/o API comunes: En esta sección, el informe describe algunos recursos de utilidad, los cuales se resumen en la siguiente tabla:
Recurso
Descripción
Categoría de datos en las que más pueden ayudar, según el informe
Directiva Inspire
Características que debe tener la información espacial y sus metadatos.
Datos geoespaciales
Datos de Observación de la Tierra y medioambientales.
Datos meteorológicos
Datos sobre redes de transporte.
Especificaciones de datos de la Directiva Inspire
(data specifications)
Modelos, esquemas y reglas de codificación para diferentes áreas temáticas de datos espaciales.
Datos de Observación de la Tierra y medioambientales
Servicios de red de Inspire (network services)
Conjunto de interfaces comunes para servicios web que permiten el descubrimiento, visualización, descarga y transformación de datos espaciales.
Directrices técnicas para los metadatos de Inspire
(Inspire technical guidelines for metadata)
Directrices técnicas para metadatos, con los elementos mínimos a incluir definidos en el Reglamento 1205/2008 de la Comisión.
Geo-DCATAP
Extensión del perfil de aplicación DCAT para describir conjuntos de datos geoespaciales.
Core Location Vocabulary
Modelo de datos simplificado que incluye las características fundamentales de una ubicación, representada como una dirección o nombre geográfico, o a través de geometría.
General Multilingual Environmental Thesaurus (GEMET).
Vocabulario controlado especializado en información medioambiental. Dispone de una sección de conceptos ligados con las categorías de datos espaciales incluidas en Inspire.
Datos de Observación de la Tierra
Semantic Sensor Network
Recomendación del W3C para describir los sensores y sus observaciones.
Quantity, unit, dimension and type (QUDT).
Conjunto de ontologías que definen clases básicas, propiedades y restricciones utilizadas para modelar magnitudes físicas, unidades de medida y sus dimensiones en diversos sistemas de medición.
Lista de clasificaciones estadísticas de Eurostat
Clasificaciones estadísticas mantenidas por Eurostat, disponibles como Linked Open Data en XKOS, la extensión de SKOS para modelar clasificaciones estadísticas. Se presentan por familia de clasificación, categorizadas por ámbito estadístico y subdominios (por ejemplo, NACE para la actividad económica, la cual describiremos más adelante).
Datos estadísticos
Listas de códigos estándar de Eurostat
Conjuntos predefinidos y organizados de elementos que presentan conceptos estadísticos mediante códigos únicos
Statistical Data and Metadata eXchange (SDMX)
Iniciativa mundial para normalizar y armonizar el intercambio de datos y metadatos estadísticos. Ofrece normas técnicas (el modelo de información SDMX), directrices, una arquitectura informática, herramientas y una serie de tutoriales para ayudar a los usuarios.
RDF Data Cube Vocabulary
Ontología para describir datos multidimensionales, como las estadísticas, que se basa en el núcleo del modelo de información SDMX 2.0.
Core Business Vocabulary
Mencionado por el propio reglamento, consiste en un modelo de datos simplificado que captura las características fundamentales de una entidad jurídica, como su nombre legal, actividad o dirección.
Registros empresariales
Código NACE
Códigos para la clasificación de actividades económicas en la Unión Europea. Su revisión NACE 2 fue publicada por la Comisión Europea en octubre de 2022
Organization ontology
Ontología del W3C para apoyar la publicación de datos enlazados relativos a información organizativa, es decir, proporciona una serie de formas de representar la relación entre las personas y las organizaciones, junto con la estructura de información interna de una organización.
Global Legal Entity Identifier Foundation
Base de datos centralizada con información sobre las personas jurídicas que participan en los mercados financieros mundiales. Asigna a cada entidad un código único de Identificador de Personas Jurídicas (Legal Entity Identifier o LEI) reconocido a escala mundial.
Taxonomía NST
Sistema de clasificación para las mercancías transportadas a través de carretera, ferrocarril, vías navegables interiores y mar. Tiene en cuenta la actividad económica asociada al origen de las mercancías.
Tabla de autoridades de "Transport service"
Lista de códigos de los distintos tipos de servicios de transporte facilitada por la sección de Vocabularios de la UE.
El informe resalta algunos recursos útiles para armonizar los datos, como los modelos Smart Data Models y la iniciativa española Ciudades Abiertas, especialmente aplicados en ámbito de ciudades inteligentes.
Aplicación de los modelos seleccionados: El último paso es la armonización real de los datos. Una vez elegidos los modelos, es necesario convertir los datos en formatos adecuados, unificando metadatos y estructuras. Esto puede implicar transformar datos tabulares (como CSV o Excel) en otros formatos, como JSON o RDF, siguiendo las ontologías seleccionadas.
El informe concluye reconociendo que aún existen retos en torno a la identificación de los HVD y la aplicación del reglamento en todos los países europeos. En áreas como los datos geoespaciales o los estadísticos, donde ya existen grandes iniciativas de armonización, los avances son más notables. Sin embargo, en áreas como la información sobre empresas y su propiedad, donde no hay una iniciativa adoptada de manera generalizada, queda un largo camino por recorrer.
Finalmente, el informe ofrece recomendaciones para ayudar a los países a crear una hoja de ruta que facilite la publicación de estos conjuntos de datos de alto valor, lo que permitirá una mayor reutilización de la información pública, algo que las administraciones deberán abordar en 2024.
Fuente de la noticia
Publicado por la editora.