Projekt

Pamina Spachholz - (FB3) Bachelorarbeit

Konzeption und Aufbau einer automatisierten Prozesskette zur Erschließung des Marktstammdatenregisters und dessen Integration in den Energieatlas Baden-Württemberg

Einreichung der Arbeit: Februar 2021

Der Klimawandel und seine Folgen sind eine der größten Herausforderungen an die Gesellschaft. Die globalen Auswirkungen sind bereits heute deutlich zu spüren.

Um die Erderwärmung und somit die Folgen des Klimawandels möglichst gering zu halten, sollen in Deutschland im Rahmen der Energiewende nukleare und fossile Brennstoffe durch erneuerbare Energien ersetzt und die Energieeffizienz gesteigert werden.

Für die Planung und Umsetzung der Energiewende sowie zur Information der politischen Entscheidungsträger und der Öffentlichkeit sind aktuelle und zuverlässige Daten von großer Bedeutung.
Eine wichtige Datengrundlage ist in diesem Zusammenhang das seit 2019 von der Bundesnetzagentur betriebene Marktstammdatenregister (MaStR), welches der zentralen Erfassung und Bereitstellung von Stammdaten zur Strom- und Gasversorgung dient. Auf diese Weise soll Bürokratie abgebaut sowie Datentransparenz und Datenqualität gesteigert werden

Speziell für das Bundesland Baden-Württemberg stellt auch der Energieatlas Baden-Württemberg als gemeinsames Internetportal der Landesanstalt für Umwelt und des Ministeriums für Umwelt, Klima und Energiewirtschaft verschiedene Informationen zum Themenbereich erneuerbare Energien bereit.
Dessen Daten stammten bislang aus unterschiedlichen Quellen und waren teilweise fehlerhaft, so dass ihre Aufbereitung in aufwändigen manuellen Prozessen durchgeführt werden musste und Aktualisierungen nur in unregelmäßigen Abständen möglich waren.

Um hier Verbesserungen zu erreichen, soll das Marktstammdatenregister zukünftig die zentrale Datenquelle des Energieatlas Baden-Württemberg werden.
Die Zielstellung der Arbeit bestand deshalb darin, in Zusammenarbeit mit den zuständigen Fachabteilungen der Landesanstalt für Umwelt Baden-Württemberg und dem Institut für Automation und angewandte Informatik des Karlsruher Instituts für Technologie eine automatisierte Lösung zur Integration der Daten des Marktstammdatenregisters in den Energieatlas Baden-Württemberg zu entwickeln.

In der schriftlichen Arbeit werden nach einem Überblick über das organisatorische Umfeld und einige wichtige fachliche und technische Grundlagen zunächst das Quell- und das Zielsystem der geplanten automatisierten Prozesskette (Marktstammdatenregister und Energieatlas Baden-Württemberg) ausführlich analysiert.

Hierbei wird auf die rechtlichen Grundlagen des Marktstammdatenregisters eingegangen, auf seine technische Umsetzung als online-gestützte Datenbank mit den technischen Lösungen Webportal, Webdienst und Datenbankvollauszug und auf sein Datenmodell, welches in Form eines Objektmodells vorliegt

Bezüglich des Energieatlas Baden-Württemberg werden seine Daten- und Kartenangebote für verschiedene Themenbereiche erläutert - wie zum Beispiel die Darstellung der Energiekennwerte von Bestandsanlagen - und seine Systemarchitektur, bei der es sich um eine microservice-orientierte Architektur handelt, welche leicht konfigurier- und erweiterbar ist.

Anschließend werden die unter Einbeziehung der Fachabteilung der Landesanstalt für Umwelt Baden-Württemberg erarbeiteten fachlichen und die daraus abgeleiteten technischen Anforderungen an das Projekt zusammengestellt, wobei soweit möglich zwischen funktionalen und nicht funktionalen Anforderungen unterschieden wird.
Die verschiedenen auf dieser Grundlage entwickelten Konzeptionen zur Realisierung der Aufgabenstellung (Datenhaltungskonzept, Konzepte zur Aufbereitung und Integration der Daten in die verschiedenen Systeme des Energieatlas, Konzepte zur Aggregation und zur Visualisierung der Daten) werden ausführlich erläutert.

In den weiteren Abschnitten der Arbeit wird die prototypische Umsetzung der erarbeiteten Konzeptionen dokumentiert. Die erhaltenen Ergebnisse werden dargelegt und bewertet.

Konkret wurden für das Auslesen der Daten des  Marktstammdatenregisters aus dem Gesamtdatenbankabzug und dem Webdienst und ihre Übertragung in die Primärdatenbank des Energieatlas sowie in den Master Data Service (ein spezialisierter Microservice im Energieatlas) sogenannte Datenpipelines entwickelt (Werkzeuge zum automatisierten Datentransfer von einem oder mehreren Quellsystemen in ein Zielsystem), welche ETL-Prozesse enthalten (Anwendung der Prozessierungsschritte Extract, Transform und Load).
Da die Umsetzung im Rahmen der Arbeit prototypisch erfolgte, beschränkte sie sich auf den Energieträger "Solare Strahlungsenergie", war aber so konzipiert, dass sie auch auf andere Energieträger wie Biomasse, Wasser, Wind übertragbar ist.

Weitere Datenpipelines, teilweise ebenfalls mit ETL-Prozessierung, wurden für die Datenübertragung aus der Primärdatenbank des Energieatlas in die Datenbank CartoDB (eine Komponente zur Visualisierung der Daten des Energieatlas) und für die Übertragung der von den Übertragungsnetzbetreibern im Zuge der Jahresabrechnungen bereitgestellten sogenannten Bewegungsdaten in die Primärdatenbank und den Master Data Service des Energieatlas entwickelt.
Bei letzteren handelt es sich um jährlich zu aktualisierende, also zeitlich veränderliche, Daten zur produzierten Strommenge, zur erhaltenen Zahlung nach dem Erneuerbare-Energien-Gesetz (EEG-Zahlung) und zu vermiedenen Netzentgelten für die einzelnen, im Markstammdatenregister eingetragenen Energieanlagen.

Aus Datenschutzgründen ist es ferner in vielen Fällen erforderlich, vor der Visualisierung standortscharf vorliegender Stamm- und Bewegungsdaten eine Datenaggregation durchzuführen, damit die Daten auf der Ebene von Verwaltungseinheiten (Region, Kreis oder Gemeinde) ausgewertet und dargestellt werden können.
Die Aggregation erfolgte durch Anwendung geeigneter Visualisierungswerkzeuge der Primärdatenbank und des Master Data Service (z.B. Materialized Views), wobei zwecks Darstellung der Verwaltungseinheiten eine Verknüpfung zum Geometriedatenbestand der Landesanstalt für Umwelt Baden-Württemberg (LUBW) hergestellt werden musste.

Die eigentliche Visualisierung der aggregiert oder standortscharf vorliegenden Stammdaten der Bestandsanlagen wurde entsprechend der bisherigen Darstellungsmethode im Energieatlas in Form einer Kartendarstellung mit Hilfe der Komponente CartoDB realisiert, wobei als Objektinformationen verschiedene Attribute dargestellt werden.
Die im Rahmen der Arbeit prototypisch auf den Energieträger "Solare Strahlungsenergie" beschränkte Umsetzung erfolgte getrennt nach Dach- und Freiflächenanlagen.

Die Visualisierung der Bewegungsdaten (Strommenge, EEG-Zahlung, vermiedene Netzentgelte) erfolgte hingegen unter Nutzung eines anderen im Energieatlas verfügbaren Dienstes, des Time Series Service (Zeitreihendienst). Die Bewegungsdaten werden hierbei in Diagrammen unterhalb des Kartenausschnitts dargestellt.

Bei der abschließenden Bewertung der erzielten Ergebnisse konnte festgestellt werden, dass die angestrebte automatisierte Prozesskette zur Erschließung des Marktstammdatenregisters sowie der Bewegungsdaten erfolgreich umgesetzt wurde.
Auch die erarbeiteten Konzeptionen zur Datenaggregation, zur prototypischen Visualisierung und zur Automation der Datenaufbereitung konnten größtenteils realisiert werden, wobei auf noch vorhandene kleinere Mängel und sich daraus ergebende zukünftige Aufgabenstellungen hingewiesen wird.

Die im Rahmen der Arbeit ebenfalls durchgeführten Plausibilitätsprüfungen der benutzten Datengrundlage (Marktstammdatenregister und Bewegungsdaten) konnten nur einen sehr geringen Anteil fehlerhafter räumlicher Angaben nachweisen, wobei eine automatisierte Korrektur allerdings nicht für alle Fehlertypen möglich war.
Außerdem konnten aber auch verschiedene Fehler bei fachlichen Angaben ohne räumlichen Bezug identifiziert werden, weshalb empfohlen wird, zukünftig automatisierte Plausibilisierungsroutinen auch für derartige Daten zu entwickeln.

Da festgestellt werden musste, dass der zum Zeitpunkt der Arbeit verfügbare Datenbestand des Marktstammdatenregisters insgesamt noch zu lückenhaft war, wird empfohlen, mit einer Veröffentlichung im Energieatlas bis zum Vorliegen eines Gesamtdatenbankabzugs Ende 2021 zu warten und dann auf diesem aufbauend Aktualisierungen mittels des MaStR-Webdienstes durchzuführen.