Fallstudie
Anwendungsfall Dateningenieur für ein Mittelstandsunternehmen für erneuerbare Energien
Herausfoderung, Kontext, Probleme lösen
Mit Sitz im UK bietet das Unternehmen Bewertung von gewerblichem Energieverbrauch im Süden des Landes in Form von Wärmemodellierung, Energieeffizienzausweisen, SAP-Berechnung, Energieverbrauchsausweisen und mehr.
Das Bedürfnis, viele Prozesse zu automatisiseren wurde gleich deutlich. Von vielen Bereichen, in denen Technik rund um Daten nötig war, konzentrierten wir uns auf ein spezielles Ziel, nämlich die Analyse der Wärmemodellierung und die Überhitzungsbewertung zu verbessern.
Mission, Tools und Methodik
Kandidaten für ""Digitalisierung"" waren der Geschäftsbetrieb und Businessanalysen. Einerseits verlangte ein Teil des Geschäftsbetriebs Veränderung. Wohingegen in jüngster Vergangenheit Kunden Projektdokumentation per E-Mail schickten, entschieden wir uns für Google Suite, Google Sheets und Google Apps Script, um den Upload von Projektdokumentationen zu automatisieren.
Das Ergebnis war eine auf Google Apps Script-basierte Webanwendung in modernen Javascript. Die Kunden sind dazu aufgefordert, ihre Dokumente per Google Sheets hochzuladen. Angepasste Funktionen werden dann ausgeführt, sodass die Menge an Daten dynamisch im Master-Google Drive des Kunden verarbeitet wird.
Zweitens, verlässt sich das Unternehmen für die Analyse stark auf IESVE-Software, eine ausgeklügelte Suite integrierter Analyse-Tools, die, als die Intergrierung des Data Engineering begann, einen großen Mangel an Funktionen aufwies.
Nachdem die Kunden die entsprechenden Projektdokumente hochgeladen haben, entwirft und führt ihr Datenarchitekt eine dynamische 3D-Simulation aus, in der Ergebnisse und Projektdaten per API verfügbar werden. Das Unternehmen hatte jedoch noch immer keine wichtige Granularität und bat darum, mehr Ebenen und Funktionen zu entwickeln. Jede neue Funktion wurde separat in Angriff genommen, sodass wir uns ausgiebig in die Tiefe und Weite der API von IESVE einarbeiten konnten und alle Schutzschriften, Besonderheiten und mögliche Defizite einer solchen Anwendung ausmachen konnten und unsere Ressourcen entsprechend anpassen konnten.
Nach Abschluss dieser wollten wir ihre Analyse noch erweitern, indem wir neue Attribute einführten, um diese in neue Funktionen umzuwandeln. Deren Berechnung und die zugrundeliegende Logik wurde dann zu einem Set aus ETL-Pipelines, die alle möglichen Logiktransformationsmöglichkeiten in eine Bank umsetzt, in der jede Pipeline angesteuert wird gemäß einem Set aus Regeln, die zusammen mit Architekten zusammengestellt wurden.
Die Daten aus den IESVE API abzurufen und diese ermittelten Datenpunkte und Konfigurationsparamter für jeden Wärmemoddelierungstyp wiederherzustellen, ermöglichte eine erfolgreiche Ansteuerung der ETL-Logik.
Schließlich, nach der Pipeline und der ETL-Bank, kommt man zu einer Meldeanlage, die die Daten formatiert, um einer spezifischen gestalterischen Ästhetik zu entsprechen, gemäß vielseitigen Layouts, die vom Unternehmen vorgeschlagen wurden.
Erzielte Ergebnisse
Für die Projektdauer, ungefähr eineinhalb Monate, wurde sehr deutlich, welche Macht Data Engineering und Automatisierung dem Kunden gibt, indem sie die Arbeit einfacher machen, Zeit sparen im Unternehmen, dem Betrieb und der Analyse, und, wenn korrekt bewertet, viele aufregende Möglichkeiten erschließen kann. Nicht nur für vollwertiges Wachstum, sondern auch für eine differenzierte Ansicht und ein differenzierteres Verständnis von dem, was Daten leisten können.
Unabdingbare Fähigkeiten eines Data Engineer
Relevante Profile müssen folgende Fähigkeiten aufweisen:
- Datenstrukturen und Datenbanken aufbauen, parametrisieren und instandhalten.
- Datenverarbeitungssysteme und -organisationen gestalten
- Daten analysieren und maschinelles Lernen ermöglichen.
- Design für Verlässlichkeit.
- Daten visualisieren und die Strategien vertreten.
- Geschäftsprozesse zur Analyse modellieren.
- Design für Sicherheit und Compliance.
Andere spezifische unabdingbare Fähigkeiten eines Data Engineer:
- Debugging und Problemlösung.
- ETL-Tools und -Software.
- Cloud-Fähigkeiten – AWS, GCP, Azure, IBM (2+)
- Andere Fähigkeiten : Hive, Apache Spark, Mongodb, MySQL, PostgreSQL.