Wie Big Data Betrüger entlarven kann – und wo die Grenzen liegen

Mit moderner forensischer Datenanalyse machen Behörden und Wissenschaftler Jagd auf Betrüger. Algorithmen durchforsten Papiere nach Anomalien. Tatsächlich können mit reiner Zahlenlehre Schummler entlarvt werden. Doch Big Data hat Grenzen.

Mauscheleien, versteckte Vermögen, Korruption: Big Data kann helfen. Aber nur punktuell.

(Bild: Nils Fisch)

Mit moderner forensischer Datenanalyse machen Behörden und Wissenschaftler Jagd auf Betrüger. Algorithmen durchforsten Papiere nach Anomalien. Tatsächlich können mit reiner Zahlenlehre Schummler entlarvt werden. Doch Big Data hat Grenzen.

Betrug ist so alt wie die Menschheit. Schon im alten Rom gab es Schwindler und Falschmünzer, auf dem Forum Romanum blühte das gezinkte Würfelspiel. Der Komödiendichter Plautus beklagte sich über Berufsbankrotteure, die – sobald man ihnen Geld zur Anlage übergeben hatte – kurz darauf Konkurs anmeldeten.

Heute gibt es zwar effektive Strafverfolgung, doch Betrug ist keineswegs ausgerottet. Das machen die jüngsten Enthüllungen der Panama Papers einmal mehr deutlich. Doch im Zeitalter von Big Data und des automatisierten Informationsaustauschs haben Ermittler eine entscheidende Waffe: Daten. Mit moderner Datenanalyse sollen Betrügereien entlarvt werden. Es ist die Suche nach dem einen verdächtigen Zahlendreher, nach der unerklärlichen Lücke in der Bilanz.

Italien: Ausschweifenden Lebensstil? Steuerbetrüger!

In Italien wurde 2013 ein Einkommensmeter (redditometro) eingeführt, der mit Big Data Steuerbetrüger entlarven soll. Das System gründet auf der Annahme, dass man auf Basis der Ausgaben eines Haushalts auf dessen Steuerschuld schliessen kann. Anders gewendet: Um etwas ausgeben zu können, braucht man auch ein entsprechendes Einkommen – das man wiederum versteuern muss.

Die italienischen Steuerbehörden verfügen über eine Menge Daten: Versorgungsverträge, Neuzulassung von Fahrzeugen, Hypotheken, Versicherungen etc. Die restlichen Ausgabeposten für Güter wie Nahrungsmittel wurden mithilfe der Daten des Statistikamts gemittelt. Das System hat Italien anschliessend in fünf geografische Zonen mit unterschiedlicher Kaufkraft unterteilt und das verfügbare Haushaltseinkommen für fünf verschiedene «Familientypen», vom Single unter 35 Jahren bis zum Ehepaar über 65 Jahren, geschätzt. Wenn das veranlagte Einkommen 20 Prozent unterhalb der geschätzten Ausgaben liegt, schlägt der Einkommensmeter Alarm – die Steuererklärung muss gerechtfertigt werden.

«Ich wünsche mir ein Land, in dem der Kardinal jeden Monat ein Pornoheft kaufen kann, ohne sich den Steuerbehörden erklären zu müssen.»
Piero Ostellion, italienischer Kolumnist 

Das System war schon vor seiner Einführung heftig umstritten. Piero Ostellino, Kolumnist der Tageszeitung «Corriere della Sera», sagte, dies seien Zustände wie in der ehemaligen DDR: «Das ist keine Bekämpfung der Steuerflucht, das ist eine Ausforschung, wie man lebt, was man kauft und was man anhat.» Er wünsche sich ein offenes, liberales Land, «in dem der Kardinal jeden Monat ein Pornoheft kaufen kann, ohne sich den Steuerbehörden erklären zu müssen». Ein ausschweifender Lebensstil macht verdächtig. Das System werde zunächst nur selektiv angewandt, sagte Attilio Befera, der Chef der italienischen Steuerbehörde.

USA: «RoboCop» gegen Korruption

Im Verwaltungsbezirk Los Angeles County gibt es seit geraumer Zeit das «Fraud Framework for Government», eine Plattform, mit der Sozialhilfebetrug entlarvt werden soll. Mithilfe komplexer Algorithmen generiert das Programm aus «Verhaltensanomalien» beim Bezug von Kindergeld einen «Risk Score» der Transferleistungsempfänger. Eine Netzwerkanalyse stellt auffällige Beziehungsmuster her. Die Software spuckt dann einen Verdächtigen aus. Wer einen Ferrari fährt und Kindergeld bezieht, ist ein potenzieller Sozialhilfebetrüger.

Die US-Börsenaufsicht SEC setzt seit 2013 einen «RoboCop» im Kampf gegen Korruption ein. Das computerisierte Tool durchsucht Finanzdaten nach verdächtigen Informationen. Gibt es Inkonsistenzen im Rechnungsbericht?

Der Hintergrund: In den USA müssen Banken und Konzerne ihre Quartalsberichte in XBRL (extensible Business Reporting Language) einreichen, eine Computersprache, die Finanzinformationen auf ein einheitliches Format bringt. Der RoboCop stellt Unregelmässigkeiten fest, zum Beispiel bei Rückstellungen, die vom Management manipuliert werden können. Die Software scannt die Finanzinformationen und schlägt Alarm. Die SEC hat das System nach dem Betrugsskandal von Bernard Madoff eingeführt, der Tausende Anleger um 50 Milliarden Dollar prellte.

Mathematische Lehrbücher als Detektive

Das Problem ist, dass die Software nur so gut ist wie die zur Verfügung gestellten Daten. Wie bei jeder Programmiersprache treten bei XBRL Übersetzungsfehler auf. 2013 registrierte die SEC nach Berichten des «Wall Street Journal» bei 57’000 eingegangen Berichten 900’000 fehlerhafte XBRL-Tags. So ein erratisches Reporting kann für einen Konzern schwerwiegende Folgen haben, nicht nur im Hinblick auf eine mögliche Strafverfolgung.

Mit dem Benford’schen Gesetz deckten Wissenschaftler der Technischen Universität Ilmenau die Zahlentrickserei griechischer Finanzbehörden auf.

Der Markt bestraft Fehlinformationen sofort, der Aktienkurs kann binnen kurzer Zeit einbrechen. Deshalb suchen Wissenschaftler nach immer präziseren Methoden, um Missstände am Finanzmarkt aufzudecken. Dabei werden sie auch in mathematischen Lehrbüchern fündig. Das Benford’sche Gesetz besagt, dass bei einer Sammlung von Daten etwa 30 Prozent der aufgelisteten Zahlen eine 1 als vorderste Ziffer aufweisen sollten, 17,6 Prozent eine führende 2 und so weiter bis zur führenden 9, die nur in weniger als 5 Prozent der Fälle auftreten sollte. Eine Abweichung von dieser Normalverteilung indiziert einen möglichen Betrug.

Die Wirtschaftsprüfungsgesellschaft KPMG hat sich diese Gesetzmässigkeit bei der Buchprüfung eines Callcenters in den USA zunutze gemacht. Die Mitarbeiter in den Büros durften Geld bis zu einem Betrag von 50 Dollar zurückerstatten. Jede höhere Summe bedurfte der Zustimmung eines Vorgesetzten. Bei der Revision der Rückerstattungen fiel den Wirtschaftsprüfern von KPMG auf, dass auffällig viele Zahlen eine 4 als vorderste Ziffer aufwiesen – mehr, als die Benford-Verteilung erwarten liess. Somit bestand ein Anfangsverdacht.

Und tatsächlich: Die weitere Untersuchung ergab, dass Dutzende Mitarbeiter unrechtmässig Rückerstattungen an sich selbst, Freunde oder Verwandte auszahlten – Beträge im 40-Dollar-Bereich, die gerade noch ohne Erlaubnis ausbezahlt werden durften. Gewiss, die Zauberformel ist damit nicht gefunden. Doch mit dem Benford’schen Gesetz deckten Wissenschaftler der Technischen Universität Ilmenau die Zahlentrickserei griechischer Finanzbehörden auf – Griechenland hat bei seinen Bilanzen über Jahre hinweg kräftig geschummelt.

Die Stärke von Big Data

Mihaly Fazekas forscht an der Universität Cambridge an objektiven Korruptionsindikatoren. Mithilfe einer Data-Mining-Technik sollen die Marktstruktur durchleuchtet und illegale Absprachen erkannt werden. Das Verfahren könnte etwa helfen, Betrug bei öffentlichen Ausschreibungsverfahren zu erkennen.

Fazekas Grundannahme ist, dass Korruption in der öffentlichen Daseinsvorsorge mit der Abwesenheit von Wettbewerb einhergeht. Der Ökonom analysiert mit statistischen Modellen, wie viele Anbieter es idealiter in einer gesunden Wettbewerbsstruktur geben müsste, und schaut sich dann die Zahl der Bewerbungen in einem Bieterverfahren an. Anomalien indizieren einen Anfangsverdacht.

Big Data kann Kriminalität punktuell bekämpfen. Dennoch wird es auch in Zukunft nach wie vor Betrüger und Falschmünzer geben.

Wenn sich zum Beispiel in einer EU-weiten Ausschreibung von fünf Eisenbahnunternehmen nur eines auf den Betrieb einer S-Bahn bewirbt, bestehen Verdachtsmomente (sogenannte Red Flags). «Die Stärke des Big-Data-Ansatzes ist, dass diese Verdachtsmomente mit weiteren Informationen substantiiert werden können», sagt Fazekas. «Zum Beispiel, wenn Unternehmen ohne Konkurrenten eine Ausschreibung auf einem sonst kompetitiven Markt gewinnen, ehemalige Politiker in ihrem Aufsichtsrat beschäftigen oder den Wahlkampf der Regierungspartei finanziert haben.»

Die EU und die Weltbank haben bereits Interesse an dem System signalisiert. Bloss, kann eine Software wirklich detektieren, ob der Bürgermeister mit einem Bieter gemauschelt hat? Ob ein Politiker sein Privatvermögen über Briefkastenfirmen in Steueroasen geschleust hat? Was, wenn eine Firma den Kostenrahmen in der Ausschreibung nicht einhalten kann? Das zeigt: Big Data hat Grenzen – und kann Kriminalität nur punktuell bekämpfen. Auch oder gerade im Zeitalter von Bitcoin und E-Government wird es Betrüger und Falschmünzer geben.

Konversation

Nächster Artikel