Introducción: El Corazón Eléctrico de la Minería Moderna

La electromovilidad está transformando la industria minera, y el monitoreo eficiente del estado de salud (SoH) y estado de carga (SoC) de las baterías en vehículos eléctricos (EVs) es absolutamente crucial. Esto no solo optimiza el rendimiento y la vida útil de los equipos, sino que también es vital para la seguridad operacional. Este desafío es aún más pronunciado en la minería subterránea masiva, un área donde Codelco está impulsando activamente su estrategia de “Descarbonización y Electromovilidad”.

Mi trabajo de tesis, titulado “Sistema de Monitoreo en Tiempo Real de Señales Vitales Asociado a Baterías de Vehículos Electromóviles en Minería Subterránea”, se inserta directamente en esta iniciativa, específicamente dentro del Work Package 4 (WP4) del proyecto “Electromovilidad en Minería Subterránea” (ODS-16-24), que cuenta con el apoyo de centros de excelencia como el AMTC y el CASE de la Universidad de Chile.

En este post, quiero compartir los detalles de este emocionante proyecto, los problemas que buscamos resolver y la arquitectura de datos moderna que estamos implementando.


El Desafío: Datos Críticos en un Entorno Hostil

El entorno de la minería subterránea presenta obstáculos técnicos significativos para el monitoreo efectivo:

  • Sistemas Existentes con Limitaciones: Si bien existen sistemas de adquisición de datos como Optimine, su despliegue enfrenta restricciones importantes.
  • Calidad de Señal Deficiente: Nos encontramos con bajas tasas de muestreo, sensores con resolución insuficiente (a nivel de mV y A) y pérdidas frecuentes de datos vía telemetría o CAN bus.
  • Variables Incompletas: Existe una necesidad crítica de integrar variables eléctricas, operacionales y ambientales, muchas de las cuales hoy son incompletas o están ausentes.
  • Impacto en Indicadores Clave: Estas deficiencias impiden calcular con precisión el SoC, SoH y el Estado de Máxima Potencia Disponible (SoMPA), que son fundamentales para una operación segura y eficiente de los vehículos.
  • Condiciones Operacionales Adversas: La conectividad limitada (Wi-Fi/BLE), las condiciones ambientales hostiles y las restricciones de hardware en la minería subterránea agravan estos problemas.
  • Evidencia Actual: Un análisis de los datos actuales de vehículos LHD (Load, Haul, Dump) ya ha confirmado la presencia de valores faltantes, baja resolución y la pérdida de variables críticas, lo que justifica plenamente la necesidad de un sistema de monitoreo más robusto y adaptado.

Objetivos de la Investigación

El objetivo general de esta tesis es desarrollar e implementar un sistema de monitoreo robusto y escalable en tiempo real para evaluar el estado de las baterías en vehículos electromóviles mineros, abordando y mitigando los efectos de las restricciones operacionales mediante una arquitectura de datos moderna y técnicas avanzadas de procesamiento y aprendizaje automático.

Algunos de los objetivos específicos clave incluyen:

  1. Diseñar e implementar una arquitectura de datos escalable basada en contenedores (Docker), que permita la ingesta (Kafka, Python), almacenamiento (TimescaleDB), procesamiento y orquestación (Airflow) de grandes volúmenes de datos.
  2. Evaluar el impacto de las limitaciones en la tasa de muestreo y la irregularidad de los datos.
  3. Desarrollar y aplicar técnicas de procesamiento de señales para mejorar la calidad de los datos (interpolación, filtrado, etc.).
  4. Implementar un pipeline de análisis que utilice modelos preentrenados para estimar SoC, SoH y SoMPA en tiempo cercano al real.
  5. Validar la solución con datos operacionales reales de LHDs y camiones eléctricos proporcionados por Codelco.

Nuestra Propuesta: Una Plataforma de Streaming de Eventos para Monitoreo de Flotas Mineras

Para enfrentar estos desafíos, estamos construyendo una Plataforma de Streaming de Eventos para Monitoreo de Flotas Mineras, como se menciona en mi portafolio. La arquitectura se basa en las siguientes tecnologías y componentes clave:

  • 🐳 Contenerización con Docker: Todo el sistema se distribuye y gestiona mediante contenedores Docker, lo que asegura la modularidad, reproducibilidad y facilita el despliegue tanto en servidores NAS como en equipos locales.
  • 📜 Ingesta de Datos con Apache Kafka: Utilizamos Kafka para desacoplar los sensores y fuentes de datos del procesamiento posterior. Esto mejora la resiliencia del sistema y permite manejar altas tasas de ingesta de datos de telemetría.
  • 🐘 Almacenamiento Dual con TimescaleDB: Hemos implementado una solución de almacenamiento de dos niveles con TimescaleDB:
    • Una instancia optimizada para operaciones en tiempo real y acceso de baja latencia a los datos más recientes.
    • Una segunda instancia para el almacenamiento histórico masivo, aprovechando la compresión nativa de TimescaleDB para análisis retrospectivos y reentrenamiento de modelos.
  • 🐍 Procesamiento con Python: Python es el lenguaje principal para desarrollar los consumidores de Kafka, los scripts de procesamiento de señales y la implementación de los modelos de machine learning.
  • 🌬️ Orquestación con Apache Airflow: Airflow se encarga de orquestar los flujos de trabajo ETL (Extract, Transform, Load) para mover datos entre las bases de datos, así como los pipelines de reentrenamiento periódico de los modelos predictivos.
  • 🐙 Control de Versiones con GitHub: Todo el código, incluyendo scripts, DAGs de Airflow y Dockerfiles, se gestiona y versiona utilizando GitHub.

Las fuentes de datos para este proyecto incluyen datos proporcionados por Codelco y datos complementarios que estamos extrayendo de un EV civil para replicar y validar el pipeline completo.


Resultados Esperados y Avances Preliminares

Con esta metodología, esperamos alcanzar resultados significativos:

  • Una plataforma de datos completamente funcional y documentada.
  • Una cuantificación precisa del impacto de las limitaciones de la red en la calidad de las señales.
  • Un servicio de predicción en tiempo real para SoC, SoH y SoMPA, validado con datos reales.
  • Una base de datos histórica con una tasa de compresión superior al 89%, como ya hemos observado en pruebas preliminares (reduciendo ~10.56 GB de CSVs a ~1.15 GB en base de datos).
  • Un flujo de datos automatizado y reentrenable gestionado por Airflow.

Los avances hasta la fecha ya son prometedores, con la implementación de la arquitectura base de TimescaleDB en Docker y la carga inicial de aproximadamente 75 millones de registros históricos.


Conclusión y Próximos Pasos

Este proyecto de tesis representa un paso importante hacia la optimización de la electromovilidad en la minería subterránea. Al combinar una arquitectura de datos moderna con técnicas avanzadas de análisis, buscamos proporcionar herramientas valiosas para mejorar la eficiencia y seguridad de las operaciones de Codelco.

El camino es desafiante, pero los avances y el potencial impacto son sumamente motivadores. ¡Sigan atentos para más actualizaciones sobre el desarrollo de este sistema!


¿Interesado en la electromovilidad en minería o en arquitecturas de datos para IoT? ¡Conectemos!