Wikipedia vs. academic publishing

http://www.sciencemag.org/news/2014/07/1-scientific-publishing

A comparison between the Wikipedia project and the scientific community is not an easy task. But it is possible. The similarity is that both are driven by surprisingly little amount of people. A study in PLOS One http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0101698 has observed the details how many scientific authors are really publishing a paper. The most important insight is, that only 150608 scientist have published at least one paper a year. As active authors with at least 3 papers per year can be counted only 40k scientists worldwide.

Perhaps the study is not very exact, the tables and figures are a little confusing, and the study researched a very long time period. But is seems to be comprehensible that the number of active science-authors is smaller than 100k worldwide. In comparison, the Wikipedia english version, has nearly 20k active volunteers. And the trend is constant, also in future and also under openscience condition, the number of active researchers who are publishing something will not change significantly.

The interesting fact is, that the 100k active worldwide scientific authors are 100% not independent who are writing at home an amateur science article, but they are well funded persons who are working for big universities. Instead of describing the facts neutral, the myth of citizen science and academic social networks is spread out. And some advanced openaccess advocates claims, that something has to change. That can be seen as a joke, nothing has to change in the academic publishing system. It works perfectly and it is absolutely right, that Nature rejects 90% of all incoming manuscripts.

Open Science

The mistake which are done by Wikipedia and Academic social networks is to ask what should be made different to improve the situation and to motivate young people for engagement. The consequence are projects, which have in mind to increase the number of authors, to lower the barrier to publish something, to improve the visibility of written papers. Instead of follow a goal, the first step would be to analyse the current situation neutral. The question is not who should future of science look like and who we can destroy Elsevier, the more useful question would be, where is the science community today? Is the system broken or not?

My impression is, that the amount of active wikipedia authors and the number of active academic authors are some kind of nature-law which is constant and not changeable by a marketing campaign. Instead of bringing science forward it is time to say that science works. The workflow of paper based high-funded journals is the right one. The quality control is necessary and there is no need for improvements. The supervisor of Ijad Madisch who said “Drop this Firlefanz!” out of his head was right. He understood the publishing system better and ResearchGate will never be a success.

Advertisements

Autorenschwund bei Wikipedia

https://de.wikipedia.org/wiki/Wikipedia:Kurier Dass die Anzahl der Wikipedianer mit mehr als 5 Edits im Monat gesunken ist auf aktuell 4618 ist kein Problem. Laut der Tabelle lag der Höchststand bei 8700 und das sind eben normale Schwankungen. Auch im Linux Kernel arbeiten relativ wenig Leute mit. Laut der letzten Hochrechnung sind rund um Linux Torvalds nicht mehr als 3000 Developer damit beschäftigt neue Treiber einzupflegen. Und Linux gedeiht prächtig. Die Maßzahl für den Erfolg von Wikipedia ist die Anzahl der roten Links. Wenn Wikipedia nicht mehr nachkommt, die Rotlinks in lesbare Artikel umzuwandeln wäre es schlimm. Aber das ist nicht der Fall. Nur relativ selten gibt es unerschlossenes Gebiete. Zumindest in den Geisteswissenschaften. Im Bereich der Wirtschaft und Informatik sieht es nicht ganz so gut aus. Dort herscht in der Tat akuter Autorenmangel. Soweit ich weiß besteht das komplette Informatik-Portal in der deutschen Wikipedia aktuell nur aus 10 Leuten, da wäre ein wenig Nachwuchs sicherlich nicht verkehrt.

Ich glaube aber nicht, dass man irgendwas tun kann um diesen Nachwuchs zu generieren. Weil Wikipedia laut Defintion auf freiwilliger MItarbeit basiert und wer keine Lust hat, einen Artikel zu schreiben der hat eben keine Lust. Überhaupt glaube ich, dass der Flaschenhals weniger Wikipedia als solches ist, sondern dass man die Sphäre der akademischen Veröffentlichungen in seiner Gesamtheit betrachten muss. Der Engpass liegt eher im Bereich OpenAccess. Also dort, wo wissenschaftliche Forschung betrieben wird die auf Google Scholar publiziert wird. Mehr als diese Sphäre abzubilden kann Wikipedia nicht leisten. In der Hilfe ist das Prinzip ziemlich gut klargestellt worden: Wikipedia zitiert wissenschaftliche Quellen. Und wo diese nicht existieren kann man auch keine Artikel schreiben. Würde man mehr Quellen online haben, könnte auch das darauf aufbauende Lexikon umfangreicher sein und das heißt, man würde auch mehr Wikipedianer benötigen die die Texte verfassen.

Agressivität in der Wikipedia steigt an

Wer mit Wikipedia bisher keine nähere Bekanntschaft gemacht hat oder davon ausging, dass es dort eine „healthy community“ gibt, die sich unterstützt wird entsetzt feststellen, dass innerhalb des Lexikons ein sehr rauer Umgangston herscht. Live miterleben kann man diesen auf der Vandalismus-Meldungsseite https://de.wikipedia.org/wiki/Wikipedia:Vandalismusmeldung Aber sind das womöglich nur die Schattenseiten und nicht repräsentativ? Eher im Gegenteil, so aggressiv wie auf der Vandalismusseite geht auch in anderen Bereichen zu, daher stellt sich die Frage: wie halten das die Admins aus, sich jeden Tag dieser Aggressivität zu stellen bzw. selbst welche auszuüben? Blättern man ein wenig durch die Vandalismus-Seiten durch, so stellt man fest, dass anders als zunächst gedacht offenbar die Admins sogar ausgesprochen gerne sich mit derlei Dingen beschäftigen. Es gibt sogar eine Unterseite namens „Trollübersicht“ wo langjährige Zerstörer der Wikipedia ausführlicher vorgestellt werden, teilweise mit psychographischen Profilen. Anders formuliert, dafür dass die Vandalismusseite angeblich die Schattenseiten des Lexikons repräsentieren geht es dort erstaunlich munter und lustig zu. Ich glaube, das hat etwas damit zu tun, dass die Rollen klar verteilt sind. Das heißt, alle Beteiligten wissen um die Spielregeln und haben das ganze zu einem Wettbewerb erweitert. Das betrifft die Trolle auf der einen Seite, die natürlich wissen, dass sie Unsinn in die Wikipedia hineinschreiben und damit offizielle oder inoffizielle Guidelines verletzen. Sie machen es, weil es unglaublich gut tut, gegen die weltweit angesehende Wikipedia mal so richtig zu stänkern. Und auf der anderen Seite gibt es die Wikipedia-Admins, die natürlich ebenso wissen, dass sie unter Feuer stehen, aber eine breite Palette an Erfahrung und Tools an der Hand haben, um 6 Stunden sperren, oder 24 Stunden sperren zu verteilen und die es ebenfalls als Genugtuung empfinden mal so richtig schön vom Leder zu ziehen. Kurz gesagt, das haben sich zwei Seiten gesucht und gefunden, die zueinander passen. Das ganze funktioniert wie ein Katz-und-Maus spiel was schon seit ewigkeiten existiert, und bis in alle Ewigkeit die Beteiligten fasziniert.

Die Textbeiträge auf der VAndlismusseite folgen einem sehr eigenen Diskursstil, ja fast wie bei einem Gedicht ist dort zu lesen:
– Kleiner Timmy on Trolltour
– für 6 Stunden gesperrt, Begründung war: Unsinnige Bearbeitungen
– Editwaer mit mehreren Beteiligten
– keine Besserung erkennbar

Sozial entlastend wirkt auch, dass ein Diskurs zwischen beiden Seiten nicht erwünscht ist und auch komplett unwahrschenlich erscheint. Man hat ein wenig den Eindruck, als ob da sich zwei Seiten im Schützengraben gegenübersitzen, und das einzige was ausgiebig tun ist Dauerfeuer zu geben. Das ganze ist nicht etwa ein Ziel, sondern es ist die Beobachtung. Egal ob man die Vandalismusseite an Heiligabend, an einem Montag oder in 3 Jahren nochmal aufruft, es ist immer dasselbe Bild. Die einzige erkennbare Währung in diesem Spiel sind Lulz, also die Schadenfreude es der Gegenseite mal wieder so richtig besorgt zu haben. Wobei Lulz als Fun wohl beide Seiten (Hase und Igel) haben, sonst würden sie nicht aus ausdauernd dabei sein. Offenbar macht es einerseits unglaublich viel Spaß, seine Zerstörungswut an der ehrwürdigen Wikipedia auszulassen und genausau macht es Spaß, User und IP dafür zu maßregeln (am besten von oben herab).

Nur zugern würde ich persönlich für eine der beiden Seiten Partei ergreifen. Aber dafür ist das Schauspiel viel zu kostbar. Vielmehr ist das Gegeneinander und die unversöhnliche Härte die fasziniert, es ist vergleichbar mit der Futurebörse in Chicago wo sich die Händler anschreien. Es geht ähnlich wie in dem Roman von Frank Norris nicht nur um die Sache an sich, sondern es spielen immer auch persönliche Motive eine wichtige Rolle. Ähnlich wie beim Kartenspiel kann daraus ein Sucht werden, wo es um die Interaktion als solche geht, wo also das Trolling bzw. das Gegentrolling zum Lebensinhalt wird. Im Wikipedia Sprech wird von notorischen Wiederholungstrollen gesprochen, aber auch die Gegenseite zeichnet sich durch eine Konstanz und Vehemenz aus. So ähnlich wie bei einem einarmigen Banditen kann man den Automaten dazu verwenden, um dem Alltag zu entfliehen, sich also für einige Stunde in die Parallelwelt des Vandalismus flüchten.

Kurzanleitung um einen Wikipedia Artikel zu schreiben

Die Abläufe um einen Wikipedia Artikel zu schreiben sind übersichtlich und wenn man es praktisch ausprobiert lernt man sehr viel darüber was wissenschaftliches Schreiben ausmacht. Schritt 1 besteht darin, zunächst einmal ein Thema zu identifzieren. Im Optimalfall gibt es dazu noch keinen Wikipedia Artikel und man hat selbst keine Ahnung davon, so dass man neugierig recherchieren kann. Das Ergebnis der Recherche vermerkt man im Literaturverwaltungsprogramm Jabref. Während man die Paper dort einfügt kann man sich parallel dazu Stichpunkte machen, also Kurzexzerpte erstellen für wichtige Informationen. Als Verweis dient der Bibtex-Key.

Nachdem man die Literatur bewältigt hat beginnt der schwerste Teil: das Schreiben eines eigenen Artikels. Üblicherweise sitzt man vor dem leeren Blatt und will natürlich gleich beim ersten Mal den großen Wurf machen, weiß aber nicht so recht wie man beginnen soll. Das beste ist sich vorzustellen, dass man zu einem Youtube-Video einen Kommentar verfasst. Und den Text schreibt man dann hin. Dabei lieber etwas umgangssprachlicher formulieren. Das Niveau dieser Texte zu erhöhen kann man später immernoch. Es ist sogar erstaunlich simpel, weil man lediglich die Rechtschreibung verbessern muss und Literaturangaben hinzufügt und schon wird aus einem flappsigen Kommentar ein lesenswerter Text. Den lädt man zu Wikipedia hoch.

Was man vermeiden sollte, ist sogenanntes Live-Editing. Also im Webbrowser gleich einen Artikel erstellen, dort zwei Sätze reinschreiben und das dann iterativ durch mehrere Wikipedia-Edits zu verbessern. Besser ist es, den Text offline zu schreiben und dann die 10 kb große Textdatei mittels Copy&Paste ins Fenster hineinzukopieren. Der Vorteil ist, dass eine derartige Änderung als kraftvoller / mächtiger wahrgenommen wird.

UPDATE1
Vor 7 Tagen habe ich den neu erstellten Inmoov-Artikel zu Wikipedia hochgeladen. Einen Löschantrag gab es zwar noch nicht, aber dafür wartet der Text jetzt auf eine Sichtung. Die Erfahrung mit Wikipedia hat gezeigt, dass sinnvolle Änderungen sofort freigeschaltet werden, das heißt 7 Tage ist schon relativ lange also mag Wikipedia meinen Text vermutlich nicht. Viel machen kann man da aktuell nicht. Jetzt heißt es warten, bis zu 40 Tagen kann die Sichtung dauern, was dann passiert steht in den Sternen.

UPDATE2
10 Tage nach dem Upload des Artikels gab es heute den ersehnten Sichter-Vermerk. Das heißt, der Text ist jetzt in der regulären Wikipedia freigeschaltet und kann dort angeschaut werden https://de.wikipedia.org/wiki/InMoov. Laut Statistik sind es aktuell 3 Visits am Tag. Da Wikipedia bei Google ein sehr gutes Ranking hat, dürfte das niedrige Leserinteresse allein dem Thema geschuldet sein. Aber egal, nach 1 Jahr wären es dann schon 1000 Abrufe, für ein Robotik-Thema ein guter Wert.

Sun Tzu und die Kunst ein Lexikon zu schreiben

Sun Tzu sagt, jede Schlacht ist geschlagen bevor sie begonnen hat. Im Beispiel von Wikipedia heißt das, dass man bevor einen Text überhaupt dort einstellt man wissen sollte, wie darauf die Gegenseite reagiert. Um das herauszufinden habe ich folgendes Python Script erstellt:

# -*- coding: utf-8 -*-
'''
Created on 22.02.2017
Wikipedia Check
@author: Manuel Rodriguez
'''
class Quality: 
  def __init__(self):
    self.sentences = input('How much sentences? ')
    self.sources = input('How much sources from Google Scholar? ')
    self.doi = input('... from that with a DOI number? ')
    self.orthography = input('Is orthography correct? (0=no, 1=yes) ')
    self.quotationmarks = input('Are the quotation marks changed from"that" to „that“? (0=no, 1=yes) ')
    self.result()
  def result(self):
    self.neededcitation = 5
    self.neededdoi = 0.5
    count1 = 1.0 * self.sources / self.sentences
    count2 = 1.0 * self.doi / self.sources
    cond1,cond2,cond3,cond4=False,False,False,False
    if count1 >= (1.0*1 / self.neededcitation): cond1 = True 
    if count2 >= (1.0*self.neededdoi): cond2 = True
    if self.orthography==1: cond3=True
    if self.quotationmarks==1: cond4=True
    print "\nResult: ",
    if cond1==True and cond2==True and cond3==True and cond4==True:
      print "Text is great, please upload. Sighting can take up to 40 days"
    else: 
      print "Textquality is bad, Don't upload. The problems are:"
      if cond1==False: print "- number of sources"
      if cond2==False: print "- number of DOI"
      if cond3==False: print "- orthography"
      if cond4==False: print "- quotation marks"
 
if __name__ == "__main__":
  myQuality = Quality()

Nachdem man das Programm mit „python check.py“ startet muss man auf der Komamndozeile einige Fragen beantworten: Anzahl der Sätze, Anzahl Quellen, Anzahl Quelllen mit DOI Nummer, Rechtschreibung korrekt? und Anführungszeichen korrekt? Dann wird überprüft ob die Wikipedia-Qualitätskriterien erfüllt sind und entweder erscheint dann, dass alles super ist oder eben nicht. Der Check bietet eine erste Möglichkeit grob einzuschätzen ob sich ein Upload überhaupt lohnt. Vielleicht mal ein kleines Beispiel.

Auf meiner Festplatte habe ich schon einen kleinen Wikipedia Artikel geschrieben über ein Thema was interessant ist, und wozu es noch keinen Artikel bei Wikipedia gibt. Wenn ich jetzt das Programm starte, gebe ich bei Anzahl Sätze wahrheitsgemäß „10“ ein, bei Anzahl Quellen „1“ bei Anzahl Quellen mit einer DOI Nummer „0“, bei Rechtschreibung und Anführungszeichen beidesmal eine „0“ für nicht eingehalten. Die Software rechnet dann ein wenig und es wird ausgegeben, dass die Textqualität zu niedrig ist. Jetzt könnte ich natürlich den Text trotzdem zu Wikipedia hochladen. Nur, die Wahrscheinlichkeit ist hoch, dass es Stress gibt. Entweder gibt es einen Löschantrag oder ein erfahrener Admin hat daran etwas auszusetzen. Insofern ist es besser auf den Upload zu verzichten. Das ist zwar schade aber nicht zu ändern.

Wer sich den Sourcecode näher anschaut wird relativ schnell bemerken was man eingeben muss, damit die Software den Text für perfekt hält: man muss alle 5 Sätze mindestens eine Quelle haben und es müssen 50% DOI Quellen sein. Bei den Fragen 4 und 5 muss man beidesmal „1“ eingeben. Und ja, darüber kann man den Check austricksen.

Kritik an Wikipedia

https://de.wikipedia.org/w/index.php?limit=50&title=Spezial%3ABeitr%C3%A4ge&contribs=user&target=ManuelRodriguez&namespace=0&tagfilter=&year=2017&month=-1

Inzwischen bin ich ca. 2 Monate bei Wikipedia neu dabei und habe insgesamt 8 Edits durchgeführt. Zeit für ein kleines Resüme was mir in dieser Zeit aufgefallen ist. Bei Wikipedia gibt es derzeit zwei große Kritikpunkte. Einmal ist das Verhältnis von Naturwissenschaften zu Geistenwissenschaft nicht ausgewogen, sondern 80% aller Wikipedia Einträge sind aus den Geisteswissenschaften. Übrigens hat sich in den letzten 2 Jahren das Verhältnis sogar noch verschlechtert, das heißt, die Naturwissenschaften verlieren leicht. Der zweite Kritikpunkt betrifft dass zu wenig wert auf wissenschaftliche Belege gelegt wird und stattdessen aus Newsportalen wie Spiegel Online, Heise.de und aus Tageszeitungen zitiert wird.

Das eigentliche Problem von Wikipedia ist jedoch, dass die oben genannte Punkte nicht als Problem erkannt werden. Stattdessen glaubt die Community, dass andere Dinge in der Schieflage sind. Häufig wird als Problem bei Wikipedia verortet, dass dort bezahltes Schreiben stattfindet, dass bei umstrittenen Themen Verschwörungstheorien ausgebreitet werden oder dass der Frauenanteil zu niedrig wäre. Das sind jedoch alles keine wirklichen Probleme.

Aber ich will nicht zuviel kritisieren sondern auch sagen, was mir an Wikipedia gut gefällt. Beispielsweise das Ranking in Suchmaschinen. Wenn man es einmal fertiggebracht hat, einen Edit an der Wikipedia-Eingangskontrolle vorbeizuschmuggeln hat man im Regalfall ein Super-Ranking bei Google. Gibt man das Stichwort in die Suchmaske ein, wird der Wikipedia Artikel im Regelfall auf Platz 1 angezeigt. Ein Durchschnitts-Wikipedia Artikel hat 50-150 Hits am Tag, was höher ist als die meisten Blogs erzielen und höher ist als die meisten wissenschaftlichen Paper auf Arxiv erzielen. Ebenfalls angenehm ist die Markup-Sprache Wikisyntax mit der man die Formatierungen festlegt. Das Einbinden von Grafiken ist leicht, Inhaltsverzeichnisse werden automatisch erzeugt und wenn man sich einmal an die Literaturvorlage gewöhnt hat wird man nichts anderes mehr wollen.

Als sehr mächtig hat sich auch das Kategoriesystem erwiesen. Es handelt sich um hierbei um hierarchiche Tags um Artikel zu gruppieren was vergleichbar ist mit der Dewey-Dezimalklassifikation aus Bibliotheken. Apropos Übersicht: auch die Volltextsuche über alle Artikel hinweg funktioniert perfekt. Die dahinterstehenden Server reagieren wirklich prompt.

Soweit mein kleiner Rückblick auf 2 Monate Wikipedia. Mal sehen ob ich nach weiteren 2 Monaten immernoch lächeln kann oder ob bis dahin alle meine Edits zurückgesetzt wurden. …

Applaus für Wikipedia

Wikipedia ist seinem Ruf als technophobe Mitmachenzyklopädie wieder vollumfänglich gerecht geworden. Darunter leiden musste diesmal der Eintrag „Shadow Robot Company“. Für alle, die nicht mit ROS, den Arbeiten von Emo Todorov oder dem Moley Kitchen Robot vertraut sind sei gesagt, dass es nicht irgendein Unternehmen ist, sondern es ist DAS Unternehmen. Aber das weiß Wikipedia selber am allerbesten und genau deshalb gab es pünktlich am 24. Jan 2017 auch den Löschantrag: https://de.wikipedia.org/wiki/Wikipedia:L%C3%B6schkandidaten/24._Januar_2017#Shadow_Robot_Company

Da kann man nur Beifall klatschen für soviel gebündelten Zorn gegenüber Robotik und Künstlicher Intelligenz. Schon Ned Ludd hat gesagt, dass man alles kaputt machen soll, was nach Technik aussieht, das gilt insbesondere für Technik die vergöttert wird, die man selber nicht versteht und die womöglich vom Teufel besessen ist. All das trifft auf die Shadow Dexterous Hand vollumfänglich zu, insofern ist die Entscheidung von Wikipedia stimmig.

Was kommt als nächstes? Gute Kandidaten die man ebenfalls noch aus Wikipedia rauslöschen könnte um das Lexikon von Robotik und Künstlicher Intelligenz zu reinigen wären: ROS, LISP, Rethink Robotics, C++, IBM oder dwave. Es bleibt abzuwarten wo der Hexenhammer als nächstes zuschlägt, es wird mit Sicherheit eines von diesen Tech-Lemmas sein.

Bravo liebe Wikipedia. Immer weiter so mit dem Kreuzzug gegenüber der Moderne. Dass die Themen aus Physik, Mathematik und Informatik schon immer nachlässig recherchiert wurden war bekannt. Das Portal Informatik ist innerhalb von Wikipedia in einem echt üblen Zustand. Aber das man jetzt auch noch aktiv Artikel löscht ist schon etwas besonderes. Wikipedia sammelt damit Pluspunkte bei den Hardcore-Neoludditen welche den Naturwissenschaften skeptisch bis ablehnend gegenüberstehen und sich bei den Geisteswissenschaften, also Literatur, Geschichte, Philosophie und Theologie zu Hause fühlen.