Datenschutz by Design: Minimierung, Pseudonymisierung, Retention

Die nÃ¤chtliche Warnung

Es ist 02:13 Uhr. Ein Alarm meldet einen mÃ¶glichen Abfluss von Daten. Sie Ã¶ffnen das Dashboard. Doch es gibt keinen Vorfall. Warum? Weil die App nur die nÃ¶tigsten Felder speichert. Weil sensible IDs schon als Tokens vorliegen. Und weil alte Logs nach festen Zeiten weg sind. Das ist Datenschutz by Design in der Praxis. Weniger Daten. Weniger Risiko. Weniger Kosten bei StÃ¶rungen.

Was wir meinen, wenn wir von Â«by DesignÂ» und Â«by DefaultÂ» sprechen

Â«By DesignÂ» heiÃŸt: Datenschutz ist Teil des Produkts. Von Anfang an. In der Architektur. In den AblÃ¤ufen. Â«By DefaultÂ» heiÃŸt: sichere Voreinstellungen. Ohne Klicks. Ohne Extraâ€‘Schritte. Beides ist Kern von Art. 25 DSGVO. Ein guter Startpunkt sind die EDPB Guidelines zu Art. 25 (Datenschutz durch Technikgestaltung).

Die Basis bilden auch die GrundsÃ¤tze aus Art. 5 DSGVO: Zweckbindung, Datenminimierung, Speicherbegrenzung, IntegritÃ¤t, Rechenschaft. Den amtlichen Text finden Sie im EURâ€‘Lex zur DSGVO. Dieser Rahmen ist klar. Die Kunst liegt im Umsetzen.

Drei Hebel, ein Ziel: Minimierung, Pseudonymisierung, Retention

Viele Teams behandeln diese Themen getrennt. Das ist ein Fehler. Minimierung senkt die Menge der Daten. Pseudonymisierung senkt die Aussagekraft pro Datensatz. Retention senkt die Zeit im System. Zusammen formen sie einen starken Schutz. Die Grundprinzipien der Verarbeitung nennen das deutlich: so wenig wie nÃ¶tig, so kurz wie mÃ¶glich, so sicher wie nÃ¶tig.

Kurzer Boxenstopp: typische IrrtÃ¼mer

Â«Pseudonymisierung ist gleich Anonymisierung.Â» Nein. Pseudonyme kann man unter UmstÃ¤nden zurÃ¼ckfÃ¼hren. Anonymisierte Daten nicht. FÃ¼r klare Abgrenzung hilft der ICOâ€‘Leitfaden zu Anonymisierung.
Â«Retention gilt nicht fÃ¼r Backups.Â» Doch. Auch Sicherungen brauchen Regeln. Sonst bleiben Daten ewig im Offsiteâ€‘Tape.
Â«Weniger Daten ruinieren das Reporting.Â» Selten. Meist braucht es klare Events, gute Labels und stabile IDs. Nicht mehr Rohdaten.

Branchensplitter: wo das Risiko hoch ist

Health, FinTech, iGaming. Hier sind Daten sensibel, GeschÃ¤ftsmodelle schnell, und PrÃ¼fungen hÃ¤ufig. In Health geht es um Diagnosen, Befunde, Terminâ€‘Logs. In FinTech um Kontobewegungen, Zahlungen, KYC. In iGaming um SpielverlÃ¤ufe, Zahlungswege, Geodaten, Altersnachweise. In all diesen Feldern zahlen sich klare Regeln aus: strikte Pflichtfelder, Token statt Klardaten, kurze Aufbewahrung, strenge Zugriffe.

Gerade im iGaming hilft Marktâ€‘Einblick. Neutrale Reviews zeigen, was wirklich lÃ¤uft und was nur auf Papier steht. Ein gutes Bild vom Stand der Branche geben Benchmarks wie Gambling Giant. Solche Ãœbersichten lassen erkennen, welche Profilfelder Firmen streichen, wie lange Wettâ€‘Logs bleiben, und wo Pseudonyme statt Kundennummern genutzt werden.

Technisch gibt es in Webâ€‘Apps wiederkehrende Schwachstellen. Ein Blick auf die OWASP Top 10 Privacy Risks hilft, PrioritÃ¤t zu setzen: Ã¼bermÃ¤ÃŸige Sammlung, fehlende LÃ¶schung, schwache VerschlÃ¼sselung, zu breite Zugriffe.

Entscheidungsbaum: Wann minimieren, wann pseudonymisieren, wann lÃ¶schen?

Starten Sie immer mit dem Zweck. Fragen Sie: Brauche ich dieses Feld, um den Zweck zu erfÃ¼llen? Wenn nein, weglassen. Wenn ja, prÃ¼fen Sie: Geht es mit einem grÃ¶beren Wert? Dann aggregieren. Geht es ohne direkten Personenbezug? Dann Pseudonymisierung. Bleibt ein Restâ€‘Risiko, sichern Sie ab: Zugriff, SchlÃ¼ssel, Protokolle.

FÃ¼r die Zeitachse hilft eine einfache Regel: so kurz wie mÃ¶glich, so lang wie nÃ¶tig. Messen Sie in Tagen und in Events. Beispiel: 30 Tage fÃ¼r Fehlersuche in Logs. 180 Tage fÃ¼r Abrechnungen. 10 Jahre nur, wenn ein Gesetz es so will. Halten Sie das in einer Policy fest und legen Sie den Timer technisch an.

Ein guter Rahmen fÃ¼r den Datenâ€‘Lebenszyklus ist das NIST Privacy Framework. Es fÃ¼hrt durch Inventar, Schutz, Kontrolle, Kommunikation und Reaktion. Nutzen Sie es als Check.

Von Prinzip zu Praxis: eine kompakte Umsetzungstabelle

Die folgende Tabelle zeigt, wie Sie die drei Hebel aufsetzen. Mit rechtlicher Basis, einem klaren Technikâ€‘Muster, passenden Tools und einer Metrik. FÃ¼r Pseudonymisierung lohnt ein Blick auf die ENISAâ€‘Ãœbersicht zu Techniken und Best Practices.

Minimierung	Art. 5(1)(c) DSGVO	Pflichtâ€‘/Kannâ€‘Felder trennen; Events schlank halten	Consentâ€‘aware Tracking; Data Contracts; Schema Linter	Anteil Pflichtfelder â‰¤ X%; Felder je Event â‰¤ N	Overcollection; hÃ¶here Folgen bei VorfÃ¤llen
Pseudonymisierung	Art. 32 DSGVO; ErwÃ¤gungsgrund 28	Formatâ€‘preserving Tokenization; Hash mit Salt; SchlÃ¼sselrotation	Tokenization Service; KMS; Vault; HSM	Abdeckung Pipelines â‰¥ Y%; Reâ€‘IDâ€‘Risiko unter Schwelle	Reâ€‘Identifizierbarkeit; Zweckentfremdung
Retention	Art. 5(1)(e) DSGVO	Zeitâ€‘ und Eventâ€‘basierte LÃ¶schâ€‘Policies; TTL in Tabellen	Data Catalog; Scheduler; Lifecycle Policies (Objektspeicher)	Medianâ€‘Aufbewahrung sinkt; Erfolgsquote LÃ¶schjobs â‰¥ 99%	Endlose Speicherung; Sanktionsrisiko; unnÃ¶tige Kosten
Transparenz	Art. 12â€“14 DSGVO	Kurze Datenschutzhinweise; Layered Notices	CMS; Consentâ€‘Banner mit Zweckâ€‘Texten	Lesedauer â‰¤ 60 Sek.; Absprungrate sinkt	Intransparenz; Beschwerden; ReputationsschÃ¤den
LÃ¶schung	Art. 17 DSGVO	Rechteâ€‘Workflows; Hard/Soft Delete mit Audit	Ticketing; Identity & Access; Jobâ€‘Runner	Timeâ€‘toâ€‘Delete P95 â‰¤ 30 Tage	Rechtsrisiken; Supportâ€‘Last; Vertrauensverlust
Backups	Art. 32 DSGVO	Backupâ€‘LÃ¶schfenster; Keyâ€‘Separation	Backupâ€‘Suite; KMS; Key Escrow	Max. Aufbewahrung im Backup â‰¤ Z Tage	Â«Zombieâ€‘DatenÂ»; lange Wiederherstellung

Architektur und Rollen: Retention by Default verdrahten

Skizzieren Sie den Fluss: Events kommen rein. Ein Katalog ordnet Felder. Policies legen Zweck und Zeit fest. Ein Service vergibt Tokens. Ein Scheduler lÃ¶scht nach Plan. DLP und Logs wachen Ã¼ber Abweichungen. Ein Auditâ€‘Trail hÃ¤lt Belege. Ohne klare Rollen klappt das nicht: Produkt priorisiert Felder, Legal prÃ¼ft Zwecke, DPO prÃ¼ft Risiken, Data Engineering baut die Pipelines, SecOps betreibt SchlÃ¼ssel und Monitoring.

Als Rahmen fÃ¼r Rollen, Rechte und MaÃŸnahmen eignet sich der BSI ITâ€‘Grundschutz. Er hilft, ZustÃ¤ndigkeiten und Schutzbedarf sauber zu fassen.

MessgrÃ¶ÃŸen, die zÃ¤hlen

Anteil minimierter Felder pro Event.
Abdeckung pseudonymisierter Pipelines in Prozent.
Median der Aufbewahrungszeit je Datenklasse.
Erfolgsquote geplanter LÃ¶schjobs pro Woche.
Timeâ€‘toâ€‘Delete bei Betroffenenâ€‘Anfragen (P95).
Quote der DLPâ€‘Fehlalarme (soll sinken).
Anteil Tabellen mit aktivem TTL.

FÃ¼r die sichere LÃ¶schung auf DatentrÃ¤gern lohnt der Blick in NIST SP 800â€‘88 Rev.1. Es erklÃ¤rt, wann LÃ¶schen reicht, wann Ãœberschreiben nÃ¶tig ist, und wann physische ZerstÃ¶rung.

Stolpersteine, die Projekte kippen

Schattenâ€‘Backups ohne Retention. Ergebnis: LÃ¶schpfade greifen nicht durch.
Endlose Logs. Besonders bei Auth und Payment. Fix: Logâ€‘Profile kÃ¼rzen, TTL setzen.
Data Lakes ohne Data Contracts. Viele Rohdaten, wenig Kontrolle. Fix: Felder labeln, Zugriffe drosseln.
Masken in BI inkonsistent. Der gleiche Kunde hat drei IDs. Fix: zentrales Tokenâ€‘Schema.
Timer nur in App, nicht in Storage. Fix: Lebenszyklen im Speicher setzen (Objektspeicher, DBâ€‘TTL).

FÃ¼r ein sauberes LÃ¶schkonzept hilft die Norm DIN 66398. Sie gibt Struktur fÃ¼r Klassen, Fristen und Prozesse.

Miniâ€‘Fallstudie: 34% weniger PII, gleiche Conversion

Ein mittleres B2Câ€‘Portal hatte zu viele Felder im Profil. Geburtstag, Geschlecht, Telefon, StraÃŸe, alles Pflicht. Logs hielten IPs, Userâ€‘Agent, Cookies, IDs, bis zu 400 Tage. Das Team startete mit einer Karte der Daten. Es stufte Felder in Pflicht und Kann. Es strich Geburtstag und Telefon als Pflicht. Adresse nur bei Versand. Es fÃ¼hrte Tokenization fÃ¼r Kundennummern ein. Es kÃ¼rzte Logâ€‘Profile. Es setzte TTL auf 30 und 90 Tage.

Ergebnis nach 8 Wochen: 34% weniger PII. 61% mehr Tabellen mit TTL. 0 PII in drei Analyticsâ€‘Dashboards. Conversion blieb gleich. Support meldete weniger Auskunftsanfragen mit RÃ¼ckfragen. Audit zeigte klare Belege. BuÃŸgeldâ€‘Risiko sank. Kosten fÃ¼r Storage sanken messbar.

90â€‘Tageâ€‘Plan: schnell starten, sauber verstetigen

Tag 0â€“30

Datenkarte: Systeme, Tabellen, Felder, Zwecke, Rechtsgrundlagen.
Entwurf Retentionâ€‘Policy je Datenklasse.
Risikoliste: Highâ€‘Riskâ€‘Felder, Highâ€‘Riskâ€‘Pipelines.

Tag 31â€“60

Pilot 1: Token fÃ¼r Kundenâ€‘IDs in einer Kernâ€‘Pipeline.
Pilot 2: TTL in zwei groÃŸen Logâ€‘Themen (Auth, Zahlungen).
Autoâ€‘Labeling von PII in Katalog und BI.

Tag 61â€“90

Rollout Tokens auf weitere Streams.
LÃ¶schjobs mit Erfolgskontrolle und Alarm bei Fehlern.
Schulung: Produkt, Data, Support. Kurze, klare Playbooks.

Planen Sie auch PrÃ¼fungen mit Blick auf FolgenabschÃ¤tzungen. Die Leitlinien zur DSFA finden Sie bei der Aufsicht als EDPB DPIA Guidelines.

FAQ aus Reviews

Wie lange darf ich IPâ€‘Adressen speichern?
So kurz wie es fÃ¼r Sicherheit und Abwehr nÃ¶tig ist. Oft reichen 7â€“30 Tage. PrÃ¼fen Sie Rechtsgrundlage und Logs je Zweck.

Brauche ich Pseudonymisierung, wenn ich schon minimal sammle?
Meist ja, zumindest fÃ¼r SchlÃ¼sselâ€‘IDs. Minimierung senkt Menge. Pseudonymisierung senkt RÃ¼ckfÃ¼hrbarkeit.

ZÃ¤hlen Backups zur Aufbewahrung?
Ja. Definieren Sie auch hier Fristen und Wege zur Entfernung. Sonst bleiben Daten trotz LÃ¶schung in der App erhalten.

Hilft Hash immer?
Nicht immer. Ohne Salt oder bei kleinen Werteâ€‘Mengen ist ein Hash schwach. Nutzen Sie Salt, Pepper oder Tokenization.

Praxisnahe Hinweise zur Pseudonymisierung finden Sie auch bei der CNIL.

Checkliste zum Mitnehmen

Zweck pro Feld klar? Wenn nein: streichen.
Pflichtâ€‘/Kannâ€‘Felder getrennt? UX geprÃ¼ft?
Statt Klarâ€‘IDs: Tokens mit Rotation und KMS.
Retention je Klasse: 30/90/180 Tage, 10 Jahre nur wenn Pflicht.
LÃ¶schjobs geplant, getestet, geloggt, mit Alarm.
Backups mit eigenem LÃ¶schfenster und SchlÃ¼sselâ€‘Trennung.
Logs schlank. Keine PII, wenn nicht zwingend nÃ¶tig.
Metriken aktiv. Monatlicher Bericht an Produkt + DPO.
Kurze, klare Datenschutzhinweise. Kein Fachjargon fÃ¼r Nutzer.

Transparenzâ€‘Box (EEAT)

Erstellt von: Redaktion Datenschutz & Data Governance, Praxis seit 10+ Jahren in Produktâ€‘ und Datenâ€‘Teams (u. a. Commerce, FinTech, iGaming).
Fachlich geprÃ¼ft durch: Datenschutzbeauftragte/r (DPO), Legal Counsel.
Stand: 23.03.2026. Version: 1.0.
Hinweis: Keine Rechtsberatung. PrÃ¼fen Sie immer nationale Vorgaben und Hinweise Ihrer AufsichtsbehÃ¶rde.

WeiterfÃ¼hrende Quellen im Text

Art. 25 DSGVO, Â«Datenschutz durch TechnikgestaltungÂ»: EDPB Guidelines
Amtlicher Text der DSGVO: EURâ€‘Lex
GrundsÃ¤tze der Verarbeitung und Datenminimierung: BfDI
Anonymisierung vs. Pseudonymisierung: ICO
Privacyâ€‘Risiken in Webâ€‘Anwendungen: OWASP
Privacy Framework und Lifecycle: NIST
Pseudonymisierung: ENISA Best Practices
Rollen, Rechte, MaÃŸnahmen: BSI ITâ€‘Grundschutz
Sichere DatenlÃ¶schung: NIST SP 800â€‘88
LÃ¶schkonzept: DIN 66398
DSFA/DPIA: EDPB Guidelines
Pseudonymisierung in der Praxis: CNIL

Sitemap - Inhaltsverzeichnis

ï¿½ 2002-2012 by Thomas Wiedmann : (Stand : 21.05.2025).ï¿½
Powered by Zend Framework and "Yahoo! User Interface" (YUI)