Vorurteil bestätigt: Wikipedia hat ein Neoludditenproblem

Rein subjektiv war das Phänomen schon länger bekannt, dass das Mitmachlexikon Wikipedia einen Schwerpunkt auf den Geisteswissenschaft legt und Themen der Naturwissenschafen und Informatik stiefmütterlich bis gar nicht behandelt. Belastbare Fakten zu dieser Thesen fehlten jedoch. Um an Daten zu gelangen, kann man versuchen die Anzahl der Artikel pro Kategorie zu zählen. Den Wikipedia Kategoriebaum gibt es unter https://de.wikipedia.org/w/index.php?title=Spezial:Kategorienbaum und ein Tool um die zugeordnenten Seiten zu zählen gibt es ebenfalls: https://tools.wmflabs.org/erwin85/categorycount.php leider hat das jedoch den Nachteil — ähnlich wie bei Catscan — dass es bei zu vielen Kategorien aus Performancegründen (wie es heißt) keine Resultate liefert. Für die Kategorie Informatik wird zwar angezeigt, dass sich aktuell 34826 Artikel darunter befinden, aber wenn man die selbe Abfrage für „Biowissenschaften“ ausführt erhält man als Trefferzahl 0 angezeigt, obwohl das nicht stimmt.

Ergiebiger ist hingegen das folgende Paper:

On the Evolution of Wikipedia: Dynamics of Categories and Articles, https://pdfs.semanticscholar.org/dea9/142b39bdc2c3738e0f9cb7c6d117750ef2f7.pdf

Darin findet sich auf Seite 2 rechts oben, eine Unterteilung der Artikel für das Jahr 2014 für die englische Wikipedia. Danach beschäftigen sich nur 20% aller Artikel mit Themen aus dem Bereich Technologie und Naturwissenschaft, während der Rest sich mit eher weichen Dingen wie Orte/Landschaften, Sprache, Kunst, Menschen, Politik, Geschichte, Sport oder Recht auseinandersetzt. Also im weitesten Sinne sich mit Geistenswissenschaftlichen und schönen Dingen beschäftigt die nichts mit Naturwissenschaften und Technologie im engeren Sinne zu tun haben. Wie das bei der deutschen Wikipedia ist, ist unklar, aber vermutlich wird die Verteilung ähnlich sein.

Mit dieser Statistik ist es möglich aufgrund von validen Daten ein offenenes Geheimnis zu verraten. Nähmlich, dass die Wikipedia rein anzahlmäßig eine Neoludditen-Enzyklopädie ist. Aus welchen Gründen auch immer beschäftigen sich die Artikel überwiegend mit Nicht-Naturwissenschaftlichen Themen. Dort durchaus kontrovers und auf einem sehr hohen Niveau, nur stellt sich die Frage ob diese Einengung des Spektrums sinnvoll ist. Zur Erinnerung: die Naturwissenschaften und die Technologie gilt zu Recht als die echte Wissenschaft. Sie basiert nicht auf ausgedachten Märchen und kulturellen Bräuchen sondern ist an harten Fakten interessiert. Dass diese so wichtige Naturiwisschaft bei Wikipedia als Randerscheinung gepflegt wird ist ein Skandal. Böse formuliert ist Wikipedia eine Art von Kirchenlexikon wo Wissenschaft eine Außenseiterposition einnimmt. Das jedenfalls besagt die erhobene Statistik.

Aber nicht nur von der Anzahl her, auch inhaltlich weißt Wikipedia erhebliche Defizite bei Naturwissenschaftlich/technisch Themen auf. Schaut man sich nach belieben eine Anzahl von Artikeln an, so stellt man fest, dass diese nicht nur kürzer sondern auch deutlich schlechter recherchiert sind als die geisteswissenschaftlichen Pendants. Ein so wichtiges Lemmo wie „Relativitätstheorie“ hat in der deutschen Wikipedia geradeeinmal 4 Einzelnachweise, wovon eines auf ein Filmlexikon verweist. Und bei „elektromagnetische Welle“ wird in den mageren 5 Einzelnachweisen aus einem Aufatz zitiert, der völlig veraltet ist. In das Lemma „Doppelspaltexperiment“ wagt man kaum hineinzuschauen, dort sind ebenfalls ganze 5 Quellen angegeben und man merkt dem Text an, dass der Autor nicht vom Fach ist.

Und das betrifft ein Fach namens Physik, was eine reiche Tradition besitzt. Bei neueren Fächern aus den Naturwissenschaften wie Informatik sieht es noch schlechter aus. Rechnet man alle Artikel der Mathematik und Informatik zusammen sind das bezogen auf die 2 Mio Artikel die die deutsche Wikipedia aktuell hat, gerade einmal 2,5%. Anders formuliert, 97,5% der Arikel in der Wikipedia haben nichts, aber auch gar nichts, mit Computern oder Rechnen zu tun. Hier sieht man einmal die wahren Verhältnisse und wer die Macht hat innerhalb der Wikipedia.

Aber womöglich stimmt die Statistik gar nicht, vielleicht ist Wikipedia doch techniklastig? Wer es einmal selber testen will, braucht sich nur die „Letzten Änderungen“ anzuschauen. Den Button dafür gibt es gleich auf der Hauptseite links in der Navigationsseite. Man kann dort quasi live mitverfolgen, was gerade editiert wird in Wikipedia. Da finden sich Artikel wie „Schloss Sandersdorf“, „Pfarrkirchen Heiligen Kreuz“, „Portwein“, „Fußballmannschaft der B-Jugend“ und lauter solche Sachen. Man muss schon sehr lange suchen, bis man ein Thema findet was entfernt etwas mit Naturwissenschaft zu tun hat. Ganz weit unten findet sich beispielsweise der Eintrag „Vespa“ der editiert wurde. Die Vespa ist ein technisch-kommerzielles Produkt vom Mopedhersteller Piaggio. Das ist zwar kein naturwissenschaftliches Thema im engeren Sinne, geht aber ungefähr in diese Richtung. Nur, das ist ein Artikel unter hunderten, und gesichtet wurde er auch noch nicht. Vermutlich wird dieser ähnlich wie alles andere was sich mit Physik und Technik beschäftigt in einen Queue geschoben um dann dann nach 30 Tagen in einen Löschantrag verwandelt zu werden.

STATISTIK
Auf die Abbildung in „On the Evolution of Wikipedia: Dynamics of Categories and Articles“, https://pdfs.semanticscholar.org/dea9/142b39bdc2c3738e0f9cb7c6d117750ef2f7.pdf wurde schon verwiesen. Machen wir dochmal das ganze etwas ausführlicher. Es findet sich dort ein Tortendiagramm was die Artikelanzahl in Bezug auf die Kategorien setzt:

Wenn man das Diagramm untergliedert in Social Science (Health, Law, Sports, Geography, Agriculture, Politics, People, Arts, History, Language, Environment) und Hard-Science (Nature, Technology, Medicine) kommt man auf eine 80 zu 20 Verteilung. Das heißt, 80% der Wikipedia Artikel beschäftigen sich mit leichtem Wissen und dem kulturellem Amüsierbetrieb der Menschheit und nur 20% können als evidenzbasierte harte Wissenschaft bezeichnet werden, wo also mindestens eine mathematisch Formel drin vorkommt und Themen behandelt werden, die etwas mit bleibender Erkenntnis zu tun haben.

Diese Statistik ist deshalb so interessant weil sie im Gegensatz zu dem steht wie Wikipedia in der Öffentlichkeit wahrgenommen werden möchte. Im Regelfall bemüht sich die Wikimedia Foundation nach außen hin das Bild einer seriösen wissenschaftlichen Enzyklopädie mit einem Schwerpunkt bei den Naturwissenschaften zu zeichnen. Dieses Trugbild lässt sich jedoch durch die Fakten nicht untermauern. Im Gegenteil, es liegt der Verdacht nahe, als ob es komplett erfunden wurde, um Seriösität vorzutäuschen wo keine da ist. Die eigentliche Stärke von Wikipedia liegt eher im geisteswissenschatlichen Bereich. Also überall dort wo es darum geht, geschichtliche Fakten einzuordnen, gesellschaftliche Theman aufzubereiten oder über Britney Spears zu informieren.

Keineswegs darf man den Fehler machen, Wikipedia als unwissenschaftlich zu bezeichnen. Ganz im Gegenteil: die Fächer Literaturwissenschaft, Recht und Politik werden auf universitärem Niveau in der Wikipedia behandelt. Es schreiben dort Experten auf ihrem Gebiet und die zitierte Literatur ist reichhaltig. Die Schwäche besteht jedoch darin, dass die Naturwissenschaften weitaus weniger intensiv aufbereitet wurden, nicht nur dass dort viele Artikel komplett fehlen sondern die vorhandenen Texte erhalten auch weitaus weniger Zuwendung als es nötig wäre. Die Gefahr die bei Wikipedia besteht ist, dass sich dieses Mißverhältnis weiter verstärkt und irgendwann Physik, Biologie, Mathematik und Informatik komplett aus Wikipedia rausgedrängt werden. Das also ihr Anteil am Gesamtumfang abnimmt und die inhaltliche Qualität leidet.

Wikipedia ist das Produkt von Leuten, die daran mitarbeiten. Demzufolge ist die Ursache für die Krise mangelndes Fachwissen und Interesse seitens der Autoren. Wenn nur 20% aller Artikel etwas mit Naturwissenschaft und Technik zu tun haben ist es wahrscheinlich, dass auch nur 20% der Autoren diesem Sujet entstammen. Offenbar ist Wikipedia nicht besonders attraktiv für Naturwissenschaftler und da gibt es sich selbst-verstärkende Regelkreise. Je weniger naturwissenschaftlich interessierte Autoren bei Wikipedia mitwirken, desto schwerer haben es die verbleibenden sich Gehör zu verschaffen. Man kann das schön in den Löschdiskussionen verfolgen wo darüber entschieden wird, was relevant ist und was nicht. Am 7. Feb 2017 landete das Lemma „Gesichtsfeld (Fotografie)“ und am 25. Jan 2017 „Nanotechniker“ in der gefürchteten Löschdiskussion. Nach welchen Kriterien dann entschieden wird ist simpel: alles was nicht in die Wikipedia hineinpasst wird gelöscht. Und was das ist, ist natürlich das was schon da ist, das heißt Geisteswissenschaftlichen Themen jeder Art sind willkommen, aber alles was irgendwie nach Mathematik, Physik oder Technik klingt wird erstmal als nicht relevant bezeichnet.

Böse formuliert, kann man in Wikipedia alles schreiben solange man sich damit im geisteswissenschaftlichen Kanon bewegt. Man muss Technik und Mathematik kritisch bis ablehnend gegenüberstehen und schon steigt man auf in der Wikipedia-Hierarchie bis zum Oberadmin. In der Vergangenheit gab es schon mehrere Versuche Alternativen zu Wikipedia ins Leben zu rufen unter der Annahme das Wikipedia einen Bias besitzt, den man nicht akzeptiert. Wie wäre es mal mit einem Gegenlexikon was sich nur mit naturwissenschaftlichen Themen beschäftigt und wo das Verhältnis genau andersherum ist, also 80% für Mathematik und Informatik und nur 20% für die Sozialwissenschaften?

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s