Zum Inhalt springen

Header

Inhalt

Digital am Sonntag Digital am Sonntag, Nr. 57: Statistik und Satan

Dieses Wochenende geht es um Glauben und Zweifel. Entgegen den Versprechungen von «Big Data» verhindern auch riesige Datenberge grundlegende Fehlannahmen nicht. Und: Wer ist schuld, wenn ein Game-Projekt scheitert? Der Leibhaftige höchstpersönlich.

Die fehlgeleiteten Versprechungen von «Big Data»

Unternehmen oder Staaten sammeln riesige Berge von Daten. Sie versprechen sich, mit Hilfe von cleveren, oft selbst-lernenden Programmen aus diesen Daten Erkenntnisse gewinnen. Das sind die Glaubenssätze von «Big Data»: Je mehr Daten, desto besser die Erkenntnis; je mehr Daten und je bessere Programme, desto mehr «automatische», überraschende Erkenntnisse. Auf die man nicht gekommen wäre, ohne die riesige Menge an Daten zu haben.

Box aufklappen Box zuklappen

Am Wochenende hat man Zeit. Deshalb stellen wir hier jeden Freitag die Artikel zu Digital-Themen zusammen, die wir lesens- und bedenkenswert finden. Setzt euch zu uns in die bequemen Sessel dieser «chambre de réflexion digitale»!

Habt auch ihr einen Tipp? Sagt es uns.

Tim Harford zeigt nun in der «Financial Times» auf, dass Statistik schwierig bleibt und dass viele dieser Hoffnungen, die mit «Big Data» verbunden werden, übertrieben oder gar fehlgeleitet sind.

Er listet eine Vielzahl von Problemen und Fehlschlüssen auf. Als erstes das klassische Missverständnis, auf das alle immer hereinfallen: eine Korrelation bedeute einen Kausalzusammenhang.

They cared about ­correlation rather than causation. This is common in big data analysis. Figuring out what causes what is hard (impossible, some say). Figuring out what is correlated with what is much cheaper and easier.

Darauf können «Big Data»-Befürworter noch entgegnen: Es ist ja egal, ob man den Grund kennt. Denn wenn man weiss, dass zwei Dinge gleichzeitig auftreten (korrelieren), dann reicht diese Erkenntnis, um vorhersagen zu können: Tritt das eine auf, wird auch das andere nicht weit sein.

Nein, meint Harford, denn das sei nicht das einzige Problem. Dazu komme «sampling bias»: Die Auswahl der Proben verfälscht unabsichtlich das Resultat. Hier erliegen «Big Data»-Befürworter oft der Illusion zu glauben, sie hätten so viele Proben, einen so grossen Datenberg, dass es keine Verfälschung mehr gebe.

Harford erläutert diesen Fehler am Beispiel einer App namens «Street Bump», die Erschütterungen misst und so Schlaglöcher auf Strassen kartografiert. Denn die App misst zwar schon alle Schlaglöcher; jedoch nur auf Strassen, wo sich auch Leute mit Smartphones bewegen. Damit ist trotz der Datenmenge und der scheinbaren Vollständigkeit die Probe eben doch beeinflusst:

What Street Bump really produces, is a map of potholes that systematically favours young, affluent areas where more people own smartphones.

Also: Die Menge der Daten allein beseitigt grundlegende Fehlannahmen nicht. Im Gegenteil: Sie kann sie verschleiern.

Spielentwickler gegen Satan

Colin Campbell erzählt feinfühlig im Game-Blog «Polygon» eine unglaubliche Geschichte: Die Macher des Spiels «Bible Chronicles: The Call of Abraham» glauben, dass Satan persönlich sie daran hindert, dieses fertig zu stellen.

Das Spiel verfehlte auf der Crowdfunding-Plattform Kickstarter das Spendenziel. Campbell stellt den Machern diese Frage:

Are you telling me that Satan is literally working to confound your plans to release this game? You're saying that the actual Devil is scheming against you?

Und einer der Mitgründer antwortet:

I believe that, 100 percent.

Und wenn man einmal davon ausgeht, mit seiner kleinen Game-Design-Bude im direkten Kampf mit dem Leibhaftigen zu stehen, dann ist es nur noch logisch, wenn ein weiterer Beteiligter am Spiel diesen Kampf noch dramatischer darstellt:

If Satan is rallying some of his resources to forestall, delay, or kill this project, I think, this must be a perceived threat to his kingdom.

Trotz solch extremer Aussagen verkneift sich Campbell jede Wertung und stellt lediglich die Gedankenwelt der Macher hinter dem Abraham-Spiel dar – eine bei diesem Thema durchaus nicht selbstverständliche journalistische Leistung.

Meistgelesene Artikel