Zum Inhalt springen

Wikipedias Zukunft Wikidata: Das ganze Wissen der Welt vernetzen

Eine neue Datenbank soll Antworten auf Fragen finden, die Wikipedia nicht kennt. Etwa: Gemälde mit Instrumenten.

Vor 20 Jahren war revolutionär, wie Wikipedia geschrieben wurde: Über das damals noch neue Internet arbeiteten Freiwillige an unzähligen Artikeln. Entstanden ist so ein zuverlässiges Nachschlagewerk der Superlative. Allein die englische Ausgabe würde gedruckt mehr als 2'800 Bände umfassen.

Das Potenzial des Computers ausschöpfen

So eindrücklich diese Zahlen sind, Wikipedia bleibt eine Sammlung von einzelnen Artikeln. Zwar kann man in der digitalen Version nach Begriffen suchen, dennoch gibt es unzählige Fragen, die das Nachschlagewerk nicht beantworten kann, zum Beispiel: Auf welchen Gemälden aus dem 17. Jahrhundert sind Holzblasinstrumente abgebildet?

Stilleben: Noten, Flöten, eine Zeitung.
Legende: Wikidata findet Gemälde, auf denen Holzblasinstrumente abgebildet sind, so etwa dieses Werk von Edward Collier, ca. 1699. Wikimedia

Während Wikipedia aus einzelnen Artikeln und somit aus Freitext besteht, ist Wikidata aus genormten Einträgen aufgebaut, die strengen Regeln folgen. Jeder Eintrag besteht aus zahlreichen einfachen Aussagen.

Zum Beispiel der zu Johann Sebastian Bach : Zuerst wird festgehalten, dass es sich um einen Menschen handelt, danach werden die Vornamen aufgezählt, gefolgt vom Geburtsdatum und dem Geburtsort Eisenach . Ein Link führt zum Wikidata-Eintrag zu dieser Stadt. Auch der besteht aus zahlreichen Aussagen, etwa zur geografischen Lage 50°58'29"N, 10°19'28"E , oder genauen Angaben zur Einwohnerzahl.

Für den Computer gemacht

Auf Menschen wirkt das staubtrocken. Maschinen aber finden Dank dieser rigiden Struktur Antworten auf Fragen, die kein Nachschlagewerk liefern kann: Welchen grossen Städten der Welt steht eine Frau als Bürgermeisterin vor?

Tabelle mit grossen Städten, denen eine Bürgermeisterin vorsteht.
Legende: Wikidata kombiniert einzelne Einträge und findet die grössten Städte mit einer Bürgermeisterin. Wikidata

Die Antworten sind nur so zuverlässig wie die Daten in der Bank. Wie Wikipedia ist auch Wikidata für alle offen: Wer will, kann neue Objekte erfassen und mit bestehenden Angaben verlinken.

Bei einer Anfrage gibt es deshalb keine Garantie auf Vollständigkeit. Doch schon heute umfass Wikidata mehr als 90 Millionen Einträge, ein Vielfaches der 6.2 Millionen Artikel in der englischsprachigen Wikipedia

Zusammenarbeit mit den Profis

Neben interessierten Laien möchte Wikimedia vor allem auch mit Gallerien, Bibilotheken, Archiven und Museen zusammenarbeiten. Das macht Sinn: Wenn alle grossen Museen der Welt ihre Bestände in der neuen Datenbank erfassen, dann hilft das nicht nur der Öffentlichkeit, sondern auch den Museen selbst, zum Beispiel beim Planen einer neuen Ausstellung.

Das New Yorker Metropolitan Museum of Art erfasst seit mehreren Jahren automatisiert Teile der Sammlung in der neuen Datenbank. Dabei hilft Bilderkennungssoftware bei der Beschreibung der Inhalte.

Schon heute kann man sich von Wikidata anzeigen lassen, wo auf der Welt welches Werk von Picasso zu finden ist:

Europakarte mit Punkten, die für ein Museum mit Werken Picassos stehen.
Legende: Wikidata weiss, in welchem Museum Picassos Werke zu sehen sind und zeigt das Resultat auf einer Weltkarte an (Ausschnit). Wikidata

Fragen ist (zu) kompliziert

Solche Fragen muss man in der Abfragesprache SPARQL formulieren – nicht nur für Laien eine grosse Hürde. SPARQL erinnert zwar auf den ersten Blick an die Sprache SQL, seit vier Jahrzehnten der Standard bei der Suche in konventionellen Datenbanken.

Doch um raffinierte Suchanfragen formulieren zu können ist die Lernkurve bei SPARQL steil. Wikidata stellt darum dutzende Beispielfragen zur Verfügung, die man auf die eigenen Bedürfnisse anpassen kann. Auch eine vereinfachte Such ist in Arbeit.

Gelingt das und wächst die Datensammlung so schnell wie in den letzten Jahren, so ist es gut möglich, dass in 20 Jahren der Nobody Wikidata dem Star Wikipedia den Rang ablaufen wird.

Meistgelesene Artikel