AGENS - Analytisch-generative Netzwerke zur Systemidentifikation; Teilvorhaben 2: Generative Neuronale Netze (GAN) zur Ergänzung der Datenbasis

Loading...
Thumbnail Image

Volume

Issue

Journal

Series Titel

Book Title

Publisher

Hannover : Technische Informationsbibliothek

Link to publishers version

Abstract

Um strategische Entscheidungen eines Stromanbieters wie z.B. den Bau eines neuen Wind- oder Solarparks zu unterstützen oder aber Handlungen des Risikomanagement wie z.B. den Erwerb oder Verkauf eines Energiederivats auf seine Vorteilhaftigkeit zu überprüfen, reicht oft die vorhandene Datenlage eines Unternehmens nicht aus.

Die Möglichkeit, die vorhandenen Daten durch synthetisch erzeugte Daten mit gleichen Eigenschaften (gleiche (Marginal-)Verteilung, gleiche zeitliche Entwicklung im Hinblick auf die zeitliche Abhängigkeitsstruktur) zu ergänzen, löst gleich zwei wichtige Probleme,

  • die Erzeugung einer für zuverlässige statistische Aussagen hinreichend großen Datenmenge (Datenaugmentation),
  • die Möglichkeit der DSGVO-konformen Weitergabe anonymer Daten für Forschungszwecke oder aber zur Unterstützung durch ein Beratungsunternehmen.

Im vorliegenden Teilprojekt wurde die Möglichkeit der Erzeugung von Stromverbrauchsdaten einzelner Industriekunden des Energieversorgers und Projektpartners EWE (Oldenburg) mit Hilfe sogenannter Generativer Adversarieller Netze (GANs) untersucht. Dabei bestehen GANs aus der Kombination zweier neuronaler Netze, eines Erzeugernetzwerks, das synthetische Daten erzeugt und eines Diskriminatornetzwerks, das einen erzeugten Datensatz als „falsch“ (also synthetisch erzeugt) oder „richtig“ (also mit der den Originaldaten zugrunde liegenden, aber dem Diskriminator unbekannten Verteilung erzeugt) klassifiziert.

In einem iterativen Prozess werden die Parameter der beiden Netzwerke so lange variiert, bis im Idealfall die beste Strategie des Diskriminators darin besteht, dass er nur noch zufällig entscheiden kann, ob die erzeugten Daten aus der den Originaldaten zugrunde liegenden Verteilung erzeugt wurden oder nicht. Dabei ist die Arbeit des Diskriminatornetzwerks für die Qualität der vom Generatornetzwerk erzeugten Daten von entscheidender Bedeutung, denn nur eine gute Erkennungsrate des Diskriminators zwingt das Generatornetzwerk zur Verbesserung seines Erzeugermechanismus.

Im konkret vorliegenden Fall unseres Teilprojekt sollten auf der Basis vorhandener Zeitreihen von Verbrauchsdaten einzelner Industriekunden des Partners EWE individuelle GANs entwickelt werden, die für jede der 96 Viertelstunden eines Tages Verbrauchswerte vorhersagen. Dabei besteht das Ziel nicht (!) in der bestmöglichen Vorhersage für einen einzelnen Zeitraum, sondern in der Nachbildung der dem Verbrauch in diesem Zeitraum zugrunde liegenden Wahrscheinlichkeitsverteilung. Insbesondere sind auch die Autokorrelationen der Verteilungen, also deren Zusammenhang im Zeitablauf korrekt abzubilden. Die Entwicklung geschah im Austausch mit den Verbundpartnern, insbesondere dem Projektpartner EWE.

Da GAN ein relativ neues Konzept darstellen, gleichzeitig aber auch für die Datengenerierung als sehr attraktiv erscheinen, begann ab ca 2019 ein regelrechter Hype um die Anwendungen von GANs und die fortlaufende Entwicklung neuer GAN-Konzepte, die sich im Wesentlichen in der Variation zweier Komponenten der GANs widerspiegelte, der Wahl der verwendeten Struktur der neuronalen Netze auf der Generator- und der Diskriminatorseite sowie der Wahl des Abstandskriteriums der empirischen Verteilung der erzeugten Daten von der empirischen Verteilung der Originaldaten. Hier wurden von uns in Yilmaz, Korn (2022) eine breite Auswahl an GANs betrachtet und insbesondere für die Anwendungen im Zeitreihenbereich empfohlen, bedingte GANs (conditional GAN) und hier speziell ein bedingtes GAN empfohlen, das den Abstand zu den Daten in der Wasserstein-Metrik misst (CWGAN).

Um sowohl Anwendern als auch der mathematischen Community den Zugang zu GANs zu erleichtern, wurden Grundlagen von GAN (inklusive Beweisen von Optimalitätseigenschaften) und Aspekte der Anwendung (Auswahl des GAN-Typs, Konvergenz der Trainingsverfahren) in Yilmaz, Korn (2023, 2024) behandelt.

Bei Projektende lagen all unseren Projektpartnern und insbesondere dem Energieversorger EWE unsere Entwicklungen und detaillierte Untersuchungen der Konzepte und Varianten hinter den GAN vor. Unsere Publikationen machen das Knowhow allgemein zugänglich. Wir werden über das Fraunhofer ITWM auch direkten Zugang zu Industrieprojekten und –anwendungen in Deutschland suchen, um so dem deutschen Strommarkt helfen zu können, die erzielten Methoden der Datenaugmentation mittels GAN einzusetzen.

Des Weiteren wurden unsere Forschungen fortgesetzt und sowohl ein neues eingereichtes Arbeitspapier für die Anwendungen im Strommarkt, bei dem als neuer Aspekt die Daten in der Vorverarbeitung einer Quantilstransformation unterzogen werden, als auch eine nahezu abgeschlossene Promotion von Frau Ramadani, die auch als Hilfswissenschaftlerin am Projekt beteiligt was und sich der Anwendung von GAN in der Portfolio-Optimierung widmet, liegen als weitere Resultate vor.

Datei-Upload durch TIB

Description

Keywords

License

Creative Commons Attribution-NonDerivs 3.0 Germany