¿Qué?
10 equipos, 48 horas de tiempo y 15 000 euros en premios: así fue el emocionante hackatón celebrado en Currenta en octubre de 2022 en Zons, cerca de Dormagen. Para Nils, Henri, Steffen y Yoka, de laizee.ai, fue la ocasión perfecta tanto para mostrar de forma impresionante su experiencia técnica como para demostrar su capacidad para resolver problemas. Juntos competimos contra otros equipos para diseñar, en diferentes retos, soluciones digitales creativas y basadas en datos para el operador de Chempark —y, en el mejor de los casos, llevarnos también un premio—.
¿Quién?
Currenta GmbH es el principal operador de parques químicos en Leverkusen, Dormagen y Krefeld-Uerdingen. Currenta ofrece servicios e infraestructuras a diversas empresas del sector químico y garantiza la producción de este importante sector económico. La empresa desempeña un papel fundamental en la creación de un entorno seguro, eficiente y sostenible para los procesos de producción y la innovación.
Desafío
El día de nuestra llegada, elegimos uno de los tres retos propuestos: se trataba de evitar daños en las bombas mediante la detección precoz de desviaciones en los datos de los sensores. Estas bombas se utilizan en el CHEMPARK para bombear agua del Rin. Nuestro objetivo era desarrollar un analizador de valores de medición universal que señalara de forma autónoma y en tiempo real las desviaciones mínimas (las llamadas anomalías) en los procesos o las máquinas. La creación de un sistema fiable para la evaluación automática de los valores de medición y su aplicabilidad a diversas series temporales y sistemas de control de procesos fueron aspectos fundamentales para ofrecer soluciones eficaces.
Aplicación de la ciencia de datos
Así que, con una comida excelente a base de platos veganos y cantidades ingentes de café de filtro, mate y Red Bull, además de breves pausas para pensar entre intensas partidas de futbolín, nos pusimos manos a la obra: 48 horas de trabajo sin descanso.
Para nosotros era importante que la detección de anomalías resultara comprensible para los usuarios finales de nuestra aplicación. Por eso decidimos probar y utilizar algoritmos que no solo proporcionaran una clasificación binaria, sino también un valor interpretable entre 0,0 y 1,0.
Tras planificar los siguientes pasos, una parte del equipo se dedicó al análisis de los datos, que teníamos en forma de series temporales, centrándonos en la detección de patrones y desviaciones. La visualización de los datos nos ayudó a comprender mejor la evolución de la serie temporal y las posibles anomalías que pueden producirse en una central hidroeléctrica de bombeo. Comprender mejor el ámbito fue un aspecto importante para nosotros, ya que, antes del hackatón, las centrales hidroeléctricas de bombeo no eran un tema que nos interesara a ninguno de nosotros.
La otra parte de nuestro equipo se dedicó a la conceptualización y el desarrollo de un prototipo funcional de interfaz de usuario con el marco Streamlit.
En el siguiente paso, procesamos minuciosamente los datos de las series temporales para eliminar el ruido y reducir los valores atípicos. Esto contribuyó a mejorar la calidad de los datos para la posterior modelización. Se agregaron los distintos valores de medición de las series temporales para crear un conjunto de datos coherente que representara los datos globales para la detección de anomalías.
Para determinar cuál era el modelo óptimo, llevamos a cabo una evaluación exhaustiva de los distintos modelos. Esto incluyó la realización de pruebas con los modelos en diferentes conjuntos de datos y la evaluación de su rendimiento en cuanto a precisión y eficiencia.
Además, desarrollamos una ventana deslizante para delimitar el intervalo de tiempo de la anomalía. Esto nos permitió también determinar si las anomalías se producían en periodos consecutivos, lo que nos proporcionó información adicional sobre el comportamiento de los datos.
Entonces fue necesario recurrir a la creatividad y a los conocimientos gráficos: para presentar los resultados de forma clara, representamos gráficamente las anomalías detectadas y las ventanas deslizantes. Esto nos ayudó a identificar e interpretar con claridad las desviaciones en los datos.
Así, en el plazo de 48 horas, gracias a un enfoque iterativo y a la combinación de un análisis exhaustivo, la modelización y la visualización, logramos desarrollar un sistema eficaz de detección de anomalías que satisface los complejos requisitos del análisis de series temporales. Y, por si fuera poco, durante ese tiempo también se elaboró una presentación de cinco minutos, a la vez interesante, clara e informativa, para exponer nuestros resultados ante el jurado.
Cuando se anunciaron los ganadores de cada uno de los retos, Nils, Henri, Steffen y Yoka apenas podían estar quietos, ¡ya que, al fin y al cabo, había un premio en metálico de 5000 euros en juego! Cuando el jurado nombró al equipo de laizee.ai En cuanto nos proclamaron ganadores, ya nada nos retenía en nuestros asientos. Las 48 horas del fin de semana de programación habían merecido la pena con creces y, además de mucha diversión, trabajo en equipo y pensamiento creativo, ahora también nos llevábamos el premio a casa.
Por eso, el lema es:
¡Una vez terminado el Coding Challenge, ya hay que pensar en el siguiente! ¡Hasta el año que viene, Currenta!




