Forscher der ETH Lausanne haben mittels eines Softwarepakets das Star Wars-Universum quantifiziert. Die Studie dürfte sich als interessant für eine Reihe wissenschaftlicher Felder erweisen, die sich mit der Analyse «realer» Daten beschäftigen.
Eingefleischte Star Wars-Fans wissen, dass das von George Lucas geschaffene Universum weit über die sieben Filme hinaus reicht. Aber von diesen Ausmassen dürfte der eine oder die andere doch überrascht sein: Mehr als 20’000 Charaktere in 640 Gesellschaften auf 294 Planeten haben Forschende der ETH Lausanne (EPFL) bilanziert, wie die Hochschule am Mittwoch mitteilte.
Abseits der Filme entwickelten Bücher und Videospiele die Geschichte weiter, fügten weitere Episoden hinzu und und vergrösserten das Star Wars-Universum zunehmend. Für ihre Studie extrahierten die Forschenden um Kirell Benzi und Pierre Vandergheynst von der EPFL Daten von Hunderten von Websites des Star Wars Wikipedia «Wookiepedia».
Jedi in der Überzahl
Von den 20’000 Charakteren, auf die die Wissenschaftler dabei stiessen, spielen rund 7500 eine wichtige Rolle. Beruhigend ist auch zu wissen, dass die Guten zumindest unterm Strich in der Überzahl sind: 1367 Jedi stehen 724 Sith gegenüber.
Das Programm vermochte auch, die Herkunft der Charaktere zu bestimmen. Bei der Analyse der zehn grössten Gesellschaften zeigte sich dabei ein erstaunliches Ungleichgewicht: 80 Prozent der Bevölkerung der Star Wars-Galaxie scheinen Menschen zu sein.
Ausserdem platzierte der Algorithmus die Charaktere auf der 36’000 Jahre umfassenden Zeitachse der Saga. Hierfür stützten sich die Forschenden auf Netzwerkanalysen: Sie bestimmten alle Verbindungen zwischen dem jeweiligen Charakter und anderen Charakteren und konnten ihn dank dieser Referenz auf der Zeitachse platzieren, auch wenn die Information in den Filmen oder Büchern fehlte.
Keine Spielerei
Obwohl sie sich um eine fiktive Welt dreht, ist die Studie keine reine Spielerei. Vielmehr sollte sie die Fähigkeiten des Softwarepakets demonstrieren, digitale Daten aus online Lexika zu extrahieren und zu analysieren. «Das Programm kartiert Verbindungen in der Masse unorganisierter Daten im Internet», erklärte Hauptautor Benzi in der Mitteilung.
Konfrontiert mit grossen Datenmengen leistet die Software, was kein Mensch bewerkstelligen könnte: Sie sammelt Daten anhand von sehr präzisen Kriterien, stellt Verbindungen zwischen Datenpunkten her, quantifiziert und interpretiert sie und errechnet fehlende Informationen. In kürzester Zeit produziert sie daraus interaktive Grafiken.
Das Softwarepaket dürfte sich als sehr wertvoll für eine Reihe von wissenschaftlichen Disziplinen erweisen. Mit der zunehmenden Digitalisierung von Dokumenten und Archiven könnte es helfen, Wissenslücken in der Geschichtsforschung oder anderen Forschungsfeldern zu schliessen.