BLOG IDEE

Responsive Image

BLOG IDEE

Blogs

Informe del Portal Europeo de Datos con los estándares para homogeneizar los datos de alto valor

El informe del Portal Europeo de Datos analiza la implementación de la Directiva (UE) 2019/1024 y su reglamento de ejecución, que exige a los países de la Unión Europea poner a disposición conjuntos de datos de alto valor (HVD). El objetivo de esta iniciativa es facilitar el acceso a estos datos tanto a ciudadanos como a empresas, con el fin de fomentar su reutilización y generar un impacto positivo en la sociedad, la economía y el medio ambiente. A partir de este mes de febrero, los Estados miembros tendrán que informar cada dos años a la Comisión Europea sobre los HVD disponibles, incluyendo los enlaces a las condiciones de las licencias y las API correspondientes.

Este proceso implica varios desafíos para las administraciones públicas, ya que muchos de estos datos ya están disponibles, pero deben ser identificados de manera clara y consistente, dado que existen diferencias en los formatos, estructuras y semánticas de los datos. El informe propone un enfoque metodológico para facilitar la identificación y homogeneización de los HVD en tres pasos clave:

  1. Identificación de los HVD en portales de datos existentes: Aunque existen pautas para la publicación de estos datos, como las que se aplican al DCAT-AP, no hay una nomenclatura uniforme, lo que dificulta su localización. El informe sugiere un protocolo que incluye la definición de palabras clave, basadas en los conjuntos de datos y sus atributos, para facilitar la búsqueda en los portales de datos.

  1. Localización o desarrollo de modelos de datos, ontologías, vocabularios controlados y/o API comunes: En esta sección, el informe describe algunos recursos de utilidad, los cuales se resumen en la siguiente tabla:

Recurso

Descripción

Categoría de datos en las que más pueden ayudar, según el informe

Directiva Inspire

Características que debe tener la información espacial y sus metadatos.

  • Datos geoespaciales

  • Datos de Observación de la Tierra y medioambientales.

  • Datos meteorológicos

  • Datos sobre redes de transporte.

Especificaciones de datos de la Directiva Inspire

(data specifications)

Modelos, esquemas y reglas de codificación para diferentes áreas temáticas de datos espaciales.

 

 

  • Datos geoespaciales

  • Datos de Observación de la Tierra y medioambientales

  • Datos meteorológicos

  • Datos sobre redes de transporte.

Servicios de red de Inspire (network services)

Conjunto de interfaces comunes para servicios web que permiten el descubrimiento, visualización, descarga y transformación de datos espaciales.

  • Datos geoespaciales

  • Datos de Observación de la Tierra y medioambientales

  • Datos meteorológicos

  • Datos sobre redes de transporte.

Directrices técnicas para los metadatos de Inspire

(Inspire technical guidelines for metadata)

Directrices técnicas para metadatos, con los elementos mínimos a incluir definidos en el Reglamento 1205/2008 de la Comisión.

  • Datos geoespaciales

  • Datos de Observación de la Tierra y medioambientales

  • Datos meteorológicos

  • Datos sobre redes de transporte.

Geo-DCATAP

Extensión del perfil de aplicación DCAT para describir conjuntos de datos geoespaciales.

  • Datos geoespaciales

Core Location Vocabulary

Modelo de datos simplificado que incluye las características fundamentales de una ubicación, representada como una dirección o nombre geográfico, o a través de geometría.

  • Datos geoespaciales

General Multilingual Environmental Thesaurus (GEMET).

Vocabulario controlado especializado en información medioambiental. Dispone de una sección de conceptos ligados con las categorías de datos espaciales incluidas en Inspire.

  • Datos geoespaciales

  • Datos de Observación de la Tierra

  • Datos sobre redes de transporte.

Semantic Sensor Network

Recomendación del W3C para describir los sensores y sus observaciones.

  • Datos meteorológicos

Quantity, unit, dimension and type (QUDT).

Conjunto de ontologías que definen clases básicas, propiedades y restricciones utilizadas para modelar magnitudes físicas, unidades de medida y sus dimensiones en diversos sistemas de medición.

  • Datos meteorológicos

Lista de clasificaciones estadísticas de Eurostat

Clasificaciones estadísticas mantenidas por Eurostat, disponibles como Linked Open Data en XKOS, la extensión de SKOS para modelar clasificaciones estadísticas. Se presentan por familia de clasificación, categorizadas por ámbito estadístico y subdominios (por ejemplo, NACE para la actividad económica, la cual describiremos más adelante).

  • Datos estadísticos

Listas de códigos estándar de Eurostat

Conjuntos predefinidos y organizados de elementos que presentan conceptos estadísticos mediante códigos únicos

  • Datos estadísticos

Statistical Data and Metadata eXchange (SDMX)

Iniciativa mundial para normalizar y armonizar el intercambio de datos y metadatos estadísticos. Ofrece normas técnicas (el modelo de información SDMX), directrices, una arquitectura informática, herramientas y una serie de tutoriales para ayudar a los usuarios.

  • Datos estadísticos

RDF Data Cube Vocabulary

Ontología para describir datos multidimensionales, como las estadísticas, que se basa en el núcleo del modelo de información SDMX 2.0.

  • Datos estadísticos

Core Business Vocabulary

Mencionado por el propio reglamento, consiste en un modelo de datos simplificado que captura las características fundamentales de una entidad jurídica, como su nombre legal, actividad o dirección.

  • Registros empresariales

Código NACE

Códigos para la clasificación de actividades económicas en la Unión Europea. Su revisión NACE 2 fue publicada por la Comisión Europea en octubre de 2022

  • Registros empresariales

Organization ontology

Ontología del W3C para apoyar la publicación de datos enlazados relativos a información organizativa, es decir, proporciona una serie de formas de representar la relación entre las personas y las organizaciones, junto con la estructura de información interna de una organización.

  • Registros empresariales

Global Legal Entity Identifier Foundation

Base de datos centralizada con información sobre las personas jurídicas que participan en los mercados financieros mundiales. Asigna a cada entidad un código único de Identificador de Personas Jurídicas (Legal Entity Identifier o LEI) reconocido a escala mundial.

  • Registros empresariales

Taxonomía NST

Sistema de clasificación para las mercancías transportadas a través de carretera, ferrocarril, vías navegables interiores y mar. Tiene en cuenta la actividad económica asociada al origen de las mercancías.

  • Datos sobre redes de transporte.

Tabla de autoridades de "Transport service"

Lista de códigos de los distintos tipos de servicios de transporte facilitada por la sección de Vocabularios de la UE.

  • Datos sobre redes de transporte.

El informe resalta algunos recursos útiles para armonizar los datos, como los modelos Smart Data Models y la iniciativa española Ciudades Abiertas, especialmente aplicados en ámbito de ciudades inteligentes.

  1. Aplicación de los modelos seleccionados: El último paso es la armonización real de los datos. Una vez elegidos los modelos, es necesario convertir los datos en formatos adecuados, unificando metadatos y estructuras. Esto puede implicar transformar datos tabulares (como CSV o Excel) en otros formatos, como JSON o RDF, siguiendo las ontologías seleccionadas.

El informe concluye reconociendo que aún existen retos en torno a la identificación de los HVD y la aplicación del reglamento en todos los países europeos. En áreas como los datos geoespaciales o los estadísticos, donde ya existen grandes iniciativas de armonización, los avances son más notables. Sin embargo, en áreas como la información sobre empresas y su propiedad, donde no hay una iniciativa adoptada de manera generalizada, queda un largo camino por recorrer.

Finalmente, el informe ofrece recomendaciones para ayudar a los países a crear una hoja de ruta que facilite la publicación de estos conjuntos de datos de alto valor, lo que permitirá una mayor reutilización de la información pública, algo que las administraciones deberán abordar en 2024.

Fuente de la noticia

Publicado por la editora.

0 Comments
Contacto
Calle General Ibáñez de Íbero 3
​​​​​​​Madrid 28003
Síguenos
Responsive Image

BLOG IDEE

Responsive Image
Responsive Image

BLOG IDEE

Responsive Image
Contacto
Calle General Ibáñez de Íbero 3
​​​​​​​Madrid 28003
Síguenos
Responsive Image