Daten-Neutralisierer Logik

Der Daten-Neutralisierer unterstützt die Anonymisierung von sensiblen Daten in verschiedenen Dateiformaten (TXT, JSON, CSV, XML, DOCX) und Sprachen (DE, EN, FR, IT).

1. Unterstützte Dateiformate

2. Neutralisierungsmuster

Personenbezogene Daten

Vornamen

Deutsch: vorname, vornamen, rufname, taufname

Englisch: first name, given name, forename, personal name

Französisch: prénom, prénoms, nom de baptême

Italienisch: nome, nome di battesimo

Ersetzung: NAME_{uuid}

Nachnamen

Deutsch: nachname, nachnamen, familienname, familiennamen, zuname, zunamen

Englisch: last name, family name, surname, second name

Französisch: nom de famille, nom, noms

Italienisch: cognome, cognomi

Ersetzung: NAME_{uuid}

Namen mit Titel

Muster: Herr/Frau/Mr./Mrs./Ms./Monsieur/Madame/Signore/Signora/Dr./Prof.

Ersetzung: NAME_{uuid}

Kontaktdaten

E-Mail-Adressen

Muster: [A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}

Ersetzung: EMAIL_{uuid}

Telefonnummern

Allgemein: (+XXX)? (XXX) XXX-XXXX

Deutsch: (+49|0049|0) XXX XXXXXXX

Schweiz: (+41|0041|0) XXX XXX XX XX

Ersetzung: PHONE_{uuid}

Finanzielle Daten

IBAN

Muster: [A-Z]{2}\d{2}[A-Z0-9]{4}\d{7}([A-Z0-9]?){0,16}

Ersetzung: IBAN_{uuid}

Kreditkartennummern

Muster: XXXX-XXXX-XXXX-XXXX

Ersetzung: CREDITCARD_{uuid}

Adressdaten

Vollständige Adressen

Muster: Straßenname + Hausnummer + PLZ + Stadt

Ersetzung: ADDRESS_{uuid}

Städte und Orte

Muster: Stadtnamen mit typischen Endungen (-stadt, -dorf, -berg, etc.)

Ersetzung: CITY_{uuid}

3. Verarbeitungslogik

  1. Datei wird basierend auf dem Dateityp eingelesen
  2. Bei Tabellendaten (CSV, JSON, XML):
  3. Bei Textdaten:
  4. Alle Ersetzungen werden in einer Mapping-Datei protokolliert

4. Logging und Tracking