Deep learning aplicado a la detección automática de Spread-F
Cargando...
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Nacional de Tucumán, Facultad de Ciencias Exactas y Tecnología, Departamento de Informática
Resumen
1. Resumen
El Spread-F (SF) es un evento observable en un ionograma (generado por un radar ionosférico o ionosonda) asociado a irregularidades en la región F de la ionosfera. La identificación de estos eventos resulta particularmente relevante para el monitoreo de condiciones ionosféricas que afectan la propagación de ondas de radio. Actualmente, su detección se realiza de manera manual a partir de la inspección visual de los ionogramas, lo que implica un proceso intensivo en tiempo y dependiente del criterio experto, lo cual reduce
su robustez y reproducibilidad. En este contexto, en el presente trabajo se aborda esta problemática mediante el diseño e implementación de un sistema de detección automática de Spread-F en ionogramas utilizando técnicas de Aprendizaje Profundo (Deep Learning).
El sistema propuesto se basa en el uso de Redes Neuronales Convolucionales
(Convolutional Neural Network, en adelante CNN) para abordar un problema de clasificación binaria, diferenciando ionogramas (imágenes generadas por un radar denominado sondador ionosférico) con y sin presencia de Spread-F. Para su desarrollo se definió un pipeline de datos como principal metodología que integra las etapas de adquisición, unificación y preprocesamiento de la información, así como el entrenamiento, validación y actualización
del modelo. El conjunto de datos fue construido a partir de registros reales provenientes de dos radares ionosféricos instalados en Tucumán (AIS-INGV y VIPIR), y está compuesto por 49.679 ionogramas o imágenes, con una distribución aproximada del 75.69 % de casos sin Spread-F y 24.31 % con Spread-F. Las etiquetas fueron generadas a partir de interpretaciones visuales realizadas por múltiples expertos.
Como parte del flujo de trabajo, se desarrolló una herramienta gráfica específica que permite la visualización, revisión y etiquetado manual de ionogramas (IonoVisor), facilitando el control de calidad de los datos y la gestión de casos ambiguos o no etiquetados. El modelo fue entrenado aplicando estrategias de ponderación de clases para tratar el desbalance del conjunto de datos, y se evaluaron distintas configuraciones mediante optimización de hiperparámetros y técnicas de regularización. El desempeño del clasificador final, evaluado sobre un conjunto de prueba independiente, alcanzó un accuracy de 0.8904, un recall de 0.8345, una precisión de 0.7446, un F1-score de 0.7870 y un área bajo la curva ROC de 0.9454.
Adicionalmente, se implementó un esquema de aprendizaje incremental utilizando un conjunto adicional de aproximadamente 3.000 ionogramas etiquetados. Tras este proceso, el modelo presentó un incremento del recall cercano al 2.6 %, una variación negativa del
accuracy del orden del 1.6 %, y una variación despreciable en el valor de ROC-AUC, manteniendo estable la capacidad discriminativa global del clasificador.
Estos resultados son muy promisorios aunque se observaron algunas limitaciones relacionadas con los datos y con el modelado. En particular, las etiquetas utilizadas para el entrenamiento derivan de la interpretación visual humana, lo que introduce un grado inevitable de subjetividad en el conjunto de datos. Asimismo, el sistema se restringe a una Avda. Independencia 1800 - C.P. 4000 - Tucumán (Rep. Argentina) - +54 381 436-4093 - Fax +54 381 436-4157 5
clasificación binaria y no aborda la diferenciación entre subtipos de Spread-F ni la predicción temporal de su ocurrencia. Es por esto que, como líneas de trabajo futuro se plantea la extensión del modelo hacia esquemas de clasificación multiclase y la exploración de enfoques semi-supervisados u otros. También, a futuro, se espera explorar otras arquitecturas y comparar resultados. Estas extensiones permitirían ampliar el alcance del
sistema y avanzar hacia su integración en entornos operativos de monitoreo ionosférico continuo. Además, se espera implementar el mismo algoritmo a otras estaciones ionosféricas, en particular para Bahía Blanca donde la ocurrencia de SF es mucho menor pero aún representa efectos nocivos para las telecomunicaciones.Finalmente, queremos resaltar el aporte de este trabajo ya que representa la implementación de técnicas de IA a un problema concreto con impacto en las investigaciones científicas pero sobre todo para la
generación de alertas para sistemas de comunicaciones. Así, este trabajo permitirá transicionar un prototipo a un producto operativo como herramienta de asistencia basada en IA como un aporte a la economía del conocimiento.
Descripción
Índice
Índice.......................................................................................................................................3
1. Resumen............................................................................................................................. 5
2. Introducción....................................................................................................................... 7
2.1. La ionosfera y Spread-F..............................................................................................8
2.2. Inteligencia Artificial y Machine Learning........................................................ 11
3. Propuesta del modelo.....................................................................................18
3.1. Sobre el lenguaje de programación y otras herramientas utilizadas.........18
3.2. Propuesta del modelo y su pipeline de datos........................................20
4. Adquisición De Los Datos..........................................................................22
4.1. Contexto y Distribución Temporal de las Etiquetas...................................22
4.1.1 Formato de datos.............................................................................................. 23
4.2. Generación del conjunto de datos.................................................................24
4.3. Ingeniería y Homogeneización del Conjunto de Datos............................ 26
4.4. Análisis Exploratorio y división del Conjunto de Datos......................... 29
5. Modelado usando Deep Learning..................................................................31
5.1. Modelo propuesto......................................................................................................31
5.1.1 Optimización de Hiperparámetros.....................................................................33
5.2. Evaluación de posibles modelos (Fine Tuning)..........................................38
6. Resultados........................................................................................................................42
6.1. Evaluación del desempeño final.....................................................................42
6.2. Aprendizaje incremental............................................................................................43
7. Repositorio....................................................................................................................... 46
8. Conclusiones....................................................................................................................46
9. Trabajos futuros............................................................................................................... 47
10. Referencias.....................................................................................................................48
ANEXO I: Documento de Requisitos de Software (SRS).....................................51
1. Introducción..................................................................................................................51
1.1. Propósito............................................................................................................. 51
1.2. Ámbito del Sistema (Scope)................................................................................51
1.3. Definiciones, Acrónimos y Abreviaturas..............................................................52
1.4. Organización del Resto del Documento..............................................................52
2. Descripción General.....................................................................................................52
2.1. Perspectiva del Producto.................................................................................... 52
2.2. Funciones del Producto.......................................................................................53
2.3. Características de los Usuarios...........................................................................53
2.4. Restricciones.......................................................................................................53
2.5. Suposiciones y Dependencias............................................................................ 53
3. Requisitos Específicos................................................................................................. 54
3.1. Requisitos Funcionales (RF)............................................................................... 54
Avda. Independencia 1800 - C.P. 4000 - Tucumán (Rep. Argentina) -
+54 381 436-4093 - Fax +54 381 436-4157 3
3.2. Requisitos No Funcionales (RNF).......................................................................54
3.3. Requisitos de Interfaz..........................................................................................55
4. Características del Conjunto de Datos....................................................55
4.1. Estructura del Dataset.........................................................................................55
4.2. Distribución de Clases.........................................................................................55
ANEXO II: Ionogram RDF File Format....................................................................... 57

