En el ámbito de la inteligencia artificial (IA) aplicada a la información geoespacial, la calidad y estandarización de los datos de entrenamiento son fundamentales para desarrollar modelos precisos y fiables. El Open Geospatial Consortium (OGC) ha abordado esta necesidad mediante el desarrollo del estándar Training Data Markup Language for Artificial Intelligence (TrainingDML-AI), que proporciona un marco común para describir, compartir y reutilizar conjuntos de datos de entrenamiento en proyectos de IA y aprendizaje automático (ML).
TrainingDML-AI es un estándar que define un modelo conceptual, basado en UML, y codificaciones en formatos como JSON y XML para describir conjuntos de datos de entrenamiento utilizados en IA/ML. Su objetivo principal es mejorar la interoperabilidad y facilitar la reutilización de estos datos, especialmente en aplicaciones que involucran información geoespacial y observación de la Tierra.
El estándar se organiza en tres partes principales:
Los beneficios de este estándar
TrainingDML-AI es útil en proyectos que requieren grandes volúmenes de datos geoespaciales para entrenar modelos de IA, como monitoreo ambiental: análisis del uso del suelo, detección de deforestación, seguimiento de fenómenos naturales, gestión urbana: planificación de infraestructuras, análisis de movilidad, gestión de servicios, agricultura de precisión: monitoreo de cultivos, predicción de rendimientos, optimización de recursos.
Para más información, se pueden consultar los siguientes enlaces:
Publicado por la editora.