Einzelne Menschen können mitunter mit wenig Aufwand aus grossen, anonymisierten Datensätzen herausgepickt werden. Das fanden Forscher am US-amerikanischen Massachusetts Institute of Technology (MIT) und der dänischen Universität Aarhus heraus.
Sie untersuchten einen Satz Kreditkartendaten von 1,1 Millionen Menschen. Die Daten enthielten weder Namen noch Kontonummern, sondern lediglich Tag, Ort und Höhe der Zahlungen, die von einem bestimmten Konto getätigt worden waren.
Dennoch konnten die Forscher einen einzelnen Menschen mit hoher Wahrscheinlichkeit in dem Datensatz wiederfinden. Dazu mussten sie lediglich vier Bezahlvorgänge von ihm kennen und mit dem Datensatz abgleichen. Solche privaten Infos können etwa aus einem öffentlichen Tweet oder einer Bewertung im Internet abgeleitet werden.
Wussten die Forscher auf diese Weise, dass eine Person am Montag einen Kaffee mit der Kreditkarte bezahlt, am Dienstag im Supermarkt eingekauft hatte, am Donnerstag in einem Sportartikelgeschäft und am Freitag in einem Kleidungsladen war, konnten sie diese Person in 90 Prozent der Fälle in dem Datensatz wiederfinden.
Anonymisierung reicht nicht
Für die Wissenschaftler zeigen die Ergebnisse, dass auch grosse Datensätze häufig keine umfassende Anonymität bieten. Das gilt nicht nur für Kreditkartendaten.
Auch beim Surfen im Internet, beim Benutzen von öffentlichen Verkehrsmitteln oder beim Streamen von Filmen über Online-Dienste fallen massenhaft Daten an, die gesammelt und analysiert werden. Es sei wahrscheinlich, dass auch diese Daten trotz Anonymisierung einfach wieder einzelnen Personen zugeordnet werden könnten, schreiben die Forscher im Fachmagazin «Science».
«Nur weil ein Datensatz keine Namen, Adressen, Telefonnummern oder andere offensichtliche Merkmale enthält (…) macht ihn das nicht anonym», heisst es. Das erfordere eine neue Diskussion über Datenschutz.
Denn personenbezogene Daten sind zwar geschützt, anonymisierte Datensätze aber nicht. «Unsere Ergebnisse zeigen, dass eine Reform unseres Datenschutzes nötig ist, die über personenbezogene Daten hinaus geht.»