Projekt

Christopher Kremkow - Data Science (FB5) Semesterprojekt

Normalisierung von Photovoltaik Daten mit Generative Adversarial Networks (GANs)

Daten sind eine treibende Kraft, wenn es darum geht, ein Modell zum Beispiel mit Hilfe von Deep Learning zu erstellen. Leider gibt es im Bereich der Photovoltaik nicht so viele Daten. Wirklich große Netze von Photovoltaikanlagen sind eher selten und können von anderen Anbietern lokalisiert werden. Unternehmen zögern zumeist ihre Daten zu veröffentlichen, um keine Wettbewerbsnachteile zu verursachen. Denn ein Vergleich der Performance solcher Photovoltaik Anlagen könnte zu einem schlechten Ruf für die Hersteller dieser Systeme führen. Die Veröffentlichung der Daten würde einen Vergleich solcher Anlagen ermöglichen. Hier könnte ein Verfahren im Sinne des „Privacy-Preserving Data Mining“ (z.B. eine Funktion in Form eines neuronalen Netzes) helfen den Unternehmen die Angst zu nehmen ihre Daten zu veröffentlichen. Die Normierung der Daten unterschiedlicher Anlagen auf einen Normstandort würde dafür sorgen, dass der Originalstandort nicht mehr ausfindig gemacht werden kann. Generative Adversarial Networks (GANs) haben gezeigt, dass sie die Verteilung von Zeitreihendaten lernen und somit neue, originalgetreue Daten synthetisieren können. Um den Schritt einer Normierung zu vollziehen wurde in diesem Versuch das Lernverhalten dahingehend angepasst, nicht nur die Verteilung der Originaldaten zu erlernen sondern auch den Abstand der Eigenschaften zwischen Original- und Normstandort zu minimieren. Der Vorteil eines solchen Anonymisierungsverfahren besteht darin, ein größeres Spektrum an unterschiedlichen Daten zu erlangen und somit auch die unterschiedlichen Eventualitäten im Leben einer Photovoltaikanlage abzubilden (wie z.B. ein verdrecktes Solarmodul). Basierend auf dieser erweiterten Datenlage lassen sich dann bessere Modelle z.B. für die prädiktive Instandhaltung entwickeln.