Was?
10 Teams, 48 Stunden Zeit und 15.000 Euro Preisgelder – das war der spannende Hackathon bei der Currenta im Oktober 2022 in Zons bei Dormagen. Für Nils, Henri, Steffen & Yoka von laizee.ai war das der perfekte Anlass, sowohl ihre technische Expertise eindrucksvoll zu präsentieren als auch ihre Problemlösungsskills unter Beweis zu stellen. Gemeinsam traten wir gegen andere Teams an um in verschiedenen Challenges kreative digitale und datengetriebene Lösungen für den Chempark-Betreiber zu konzipieren – und im Idealfall auch noch einen Gewinn abzustauben.
Wer?
Die Currenta GmbH ist der führende Betreiber von Chemieparks in Leverkusen, Dormagen und Krefeld-Uerdingen. Die Currenta bietet Dienstleistungen und Infrastruktur für verschiedene Unternehmen im chemischen Sektor an und stellt die Produktion des wichtigen Wirtschaftszweigs sicher. Das Unternehmen spielt eine zentrale Rolle bei der Schaffung eines sicheren, effizienten und nachhaltigen Umfelds für Produktionsprozesse und Innovationen.
Herausforderung
Am Anreisetag wählten wir aus einer der 3 gestellten Herausforderungen eine aus: es galt, Schäden an Pumpen durch frühzeitige Erkennung von Abweichungen in Sensordaten zu vermeiden. Diese Pumpen werden im CHEMPARK genutzt, um Wasser aus dem Rhein zu pumpen. Unser Ziel war es, einen universellen Messwertanalysator zu entwickeln, der eigenständig und in Echtzeit auf minimale Abweichungen (sogenannte Anomalien) in Prozessen oder Maschinen hinweist. Die Schaffung eines zuverlässigen Systems zur automatischen Bewertung von Messwerten und die Anwendbarkeit auf vielfältige Zeitreihen und Prozessleitsysteme waren hierbei zentrale Aspekte, um effektive Lösungen zu liefern.
Einsatz von Data Science
Bei exzellenter Verpflegung mit veganem Essen und Massen an Filterkaffee, Mate und Redbull sowie kurzen Denkpausen bei heißen Kicker-Battles ging es also an die Arbeit – 48 Stunden voller Einsatz.
Dabei war es uns wichtig, dass die Bestimmung von Anomalien für die Endnutzer*innen unserer Anwendung nachvollziehbar sind. Deswegen entschieden wir uns, Algorithmen zu testen und zu verwenden, die nicht nur eine binäre Klassifikation liefern, sondern einen interpretierbaren Wert zwischen 0.0 und 1.0.
Nach dem Planen der nächsten Schritte beschäftigte sich ein Teil des Teams mit der Analyse der Daten, welche uns in Zeitreihen vorlagen, wobei wir uns auf die Erfassung von Mustern und Abweichungen konzentrierten. Die Visualisierung der Daten half uns, den Verlauf der Zeitreihe und mögliche Anomalien, die in einem Pumpwasserkraftwerk auftreten können, besser nachzuvollziehen. Das bessere Verständnis der Domäne war ein wichtiger Punkt für uns, denn vor dem Hackathon waren Pumpwasserkraftwerke für keine*n von uns ein Thema.
Der andere Teil unseres Teams beschäftigte sich mit der Konzeptionalisierung und Entwicklung eines funktionalen UI-Prototypen mit dem Framework Streamlit.
Im nächsten Schritt verarbeiteten wir die Zeitreihen-Daten sorgfältig, um Rauschen zu eliminieren und Ausreißer zu reduzieren. Dies trug dazu bei, die Qualität der Daten für die spätere Modellierung zu verbessern. Die unterschiedlichen Messwerte aus den Zeitreihen wurden aggregiert, um einen kohärenten Datensatz zu erstellen, der die Gesamtdaten für die Anomalie-Erkennung repräsentiert.
Um das optimale Modell zu ermitteln, führten wir eine umfangreiche Evaluierung der verschiedenen Modelle durch. Dies beinhaltete das Testen der Modelle auf verschiedenen Datensätzen und die Beurteilung ihrer Leistung hinsichtlich Genauigkeit und Effizienz.
Außerdem entwickelten wir ein Sliding Window, um den Zeitrahmen der Anomalie einzugrenzen. Dies ermöglichte uns auch, festzustellen, ob Anomalien in aufeinanderfolgenden Zeiträumen auftreten, was zusätzliche Einblicke in das Verhalten der Daten lieferte.
Dann war Kreativität und graphisches Know-how gefragt: Um die Ergebnisse anschaulich darzustellen, visualisierten wir die erkannten Anomalien und die Sliding Windows in Graphen. Dies half uns, Abweichungen in den Daten klar zu erkennen und zu interpretieren.
So gelang es uns innerhalb der 48 Stunden mit einer iterativen Herangehensweise und der Kombination aus gründlicher Analyse, Modellierung und Visualisierung, eine effektive Anomalie-Detektion zu entwickeln, die den komplexen Anforderungen der Zeitreihen-Analyse gerecht wird. Und nicht zuletzt entstand in dieser Zeit auch noch ein zugleich spannender sowie nachvollziehbarer und informativer 5-Minuten-Pitch für die Präsentation unserer Ergebnisse vor der Jury.
Bei der Bekanntgabe der Gewinner*innen der einzelnen Herausforderungen konnten Nils, Henri, Steffen & Yoka dann kaum noch stillsitzen, denn schließlich ging es um ein Preisgeld von 5000 Euro! Als die Jury dann das Team von laizee.ai zum Gewinner kürte, hielt uns nichts mehr auf unseren Plätzen. Da hatten sich die 48 Stunden beim Coding-Weekend doch mehr als rentiert gemacht und neben jeder Menge Spaß, Teambuilding und kreativem Denken konnten wir nun auch noch den Gewinn mit nach Hause nehmen.
Daher lautet das Motto:
Nach der Coding-Challenge ist vor der Coding-Challenge! Bis zum nächsten Jahr, Currenta!