OwnYourData @ Semantics 2025

OwnYourData @ Semantics 2025: Privacy-preserving Data Sharing für Renewable Energy Communities

Am 3. September 2025 waren wir auf der Semantics 2025 in Wien zu Gast – genauer gesagt beim 2nd NeXt-Generation Data Governance (NXDG) Workshop. Gemeinsam mit unseren Partnern präsentierten wir dort Ergebnisse aus einem aktuellen Forschungsprojekt:

„A Configurable Anonymisation Service for Semantically Annotated Data: A Case Study on REC Data“.

Warum Anonymisierung entscheidend ist

Mit der Energiewende und der zunehmenden Verbreitung von Renewable Energy Communities (RECs) entsteht ein wachsender Bedarf an Datenaustausch – sowohl innerhalb von Energiegemeinschaften als auch mit externen Akteuren. Doch Energiedaten sind hochsensibel: Aus Smart-Meter-Daten lassen sich detaillierte Verhaltensmuster ableiten.

Die Herausforderung: Wie können Energiedaten geteilt werden, ohne die Privatsphäre zu gefährden?

Unsere Lösung: Ein konfigurierbarer Anonymisierungsservice

Im Rahmen des Projekts USEFLEDS haben wir einen offenen, online verfügbaren Anonymisierungsservice entwickelt, der sich nahtlos in die von uns entwickelte Semantic Overlay Architecture (SOyA) integriert.

Zentrale Merkmale:

  • Semantische Annotation der Daten, um Datenschutzregeln explizit und maschinenlesbar zu machen.

  • Regelbasierte Anonymisierungspipelines, die automatisiert Generalisierung und Randomisierung anwenden.

  • Konfigurierbar via YAML-Dateien, ohne tiefe Programmierkenntnisse.

  • Nutzung als SaaS oder On-Premises – mit Open-Source-Code und Docker-Images für maximale Transparenz und Nachvollziehbarkeit.

➡️ Direkt ausprobieren: anonymiser.ownyourdata.eu

Evaluation: Datenschutz vs. Datenwert

Für die Evaluation des Dienstes haben wir mit synthetischen Datensätzen aus burgenländischen Energiegemeinschaften gearbeitet. Dabei stand die Frage im Zentrum, wie sich ein angemessenes Schutzniveau erreichen lässt, ohne die analytische Nützlichkeit der Daten zu zerstören. Als Bewertungsmaßstab diente k-Anonymity, ergänzt um ein Ähnlichkeitsmaß, um auch die Wirksamkeit der Randomisierung zu überprüfen. Die Ergebnisse zeigen, dass sich in allen getesteten Szenarien eine ausreichende Anonymisierung erzielen ließ: Kein Datensatz blieb eindeutig einer Person zuordenbar, gleichzeitig konnten die Daten weiterhin sinnvoll für Analysen genutzt werden. Damit lässt sich belegen, dass unser Ansatz eine solide Balance zwischen Datenschutz und Datenwert schafft.

Einbettung in den europäischen Rechtsrahmen und Ausblick

Die entwickelte Lösung ist eng mit den europäischen Regulierungen verknüpft. Während die GDPR (2018) den Schutz personenbezogener Daten und die Rechte der Individuen in den Vordergrund stellt, legt die Data Governance Act (2022) den Schwerpunkt auf vertrauenswürdige Ökosysteme und die Rolle neutraler Intermediäre. Anonymisierung fungiert hier als Schlüsselinstrument, um die beiden Ebenen zu verbinden: Sie schützt individuelle Privatsphäre und schafft gleichzeitig die Grundlage für ein sicheres, regelkonformes Teilen von Daten innerhalb von Datenintermediären und Energiegemeinschaften. Genau diese doppelte Wirkung macht den Ansatz für die Praxis so relevant.

In den kommenden Projektphasen wollen wir den Anonymisierungsservice weiter ausbauen. Geplant ist die Integration zusätzlicher Techniken, um noch flexibler auf unterschiedliche Datenarten reagieren zu können. Außerdem soll das System künftig Kennzahlen und Risikobewertungen direkt im Ergebnis bereitstellen, damit Nutzer:innen die Wirksamkeit der angewandten Anonymisierung besser nachvollziehen können. Schließlich werden wir untersuchen, wie sich der Service in großskaligen produktiven Umgebungen verhält, um seine Eignung als Baustein in realen Datenintermediär-Infrastrukturen sicherzustellen.

👉 Paper zum Workshop:

A Configurable Anonymisation Service for Semantically Annotated Data: A Case Study on REC Data (PDF)