Warum sich Academia.edu bisher nicht hat durchsetzen können

Obwohl das Social Network „Academia.edu“ schon länger existiert ist bisher der große Durchbruch ausgeblieben. Stattdessen werden die Nachteile thematisiert, wie dass es ein kommerzieller Dienst ist, dass es dort Werbung gibt oder keine Langzeitarchivierung unterstützt wird. Der eigentliche Grund warum Academia.edu bisher nur wenig Traffic erzeugt ist ein anderer. Um dort etwas hochladen zu können — das klingt banal — aber man braucht zunächst einmal eine PDF Datei. Und genau daran mangelt es. Das hat weniger etwas mit dem Dienst selber zu tun, sondern mit den Leuten die ihn potenziell nutzen. Schauen wir uns einmal die Standard-Pipeline von Wissenschaftlern an, die wissenschaftliche Texte verfassen. Zunächst einmal fällt auf, dass praktisch kein Wissenschaftler mehrere vorgeschriebene PDF Paper auf seiner Festplatte lagert die er prinzipiell zu Academia.edu hochladen könnte. Der Grund ist, dass der Erstellungsvorgang sehr ineffizient und langwierig ist und es sich niemand leisten kann, mal eben so einige Texte irgendwo einzustellen. Üblicherweise kommen bei der Texterstellung Programme wie MS-Word oder TeX zum Einsatz. Ersteres ist besonders bei Wirtschafts- und Sozialwissenschaftlern bekannt. Um damit einen längeren Text zu verfassen der wissenschaftlichen Ansprüchen genügt (inkl. Abbildungen, Fußnoten, Literaturangaben) muss man schon sehr viel Zeit einplanen. Die durchschnittliche Dauer bis ein solcher Text fertig ist liegt bei 12 Monaten. Währrenddessen kämpfen die Wissenchaftler regelrecht mit ihrem Text und dem Textprogramm und wenn die fertige Fassung aus dem Drucker kommt wird sie buchstäblich mit Goldstaub verglichen, soviel Schweiß steckt da drin. Aber nicht viel anders ist es bei Usern von TeX. Sie glauben zwar mit LaTeX etwas besseres zu haben, aber die Texterstellung ist nicht weniger mühselig. Gerade wenn man in LaTeX mathematische Formeln setzen will, muss man sehr viel Aufwand treiben. Und das fertig erzeugte PDF Dokument erfüllt selten die Qualitätsanforderung. Bei sogenannten „underfull hboxes“ heißt es manuell nachzukorrigieren, so dass sich auch hier die Abgabe nach hinten verzögern. Hinzu kommt gerade bei Wissenschaftlern ein übersteigertes Qualitätsverständnis, so dass ihren Text dutzendfach korrekturlesen und dann noch von weitern Leuten gegenlesen lassen um ja keine Fehler einzubauen.

Nicht etwa die Publikationskosten selber, also die APC Gebühr, welche bei Academia.edu 0 US$, bei OpenAccess Zeitschriften rund 3000 US$ und bei Elsevier rund 5000 US$ beträgt ist das Problem, sondern die eigentlichen Kosten entstehen durch den Workflow der Textproduktion selber. Die meisten Wissenschaftler arbeiten nach dem Selbstverständnis wenig aber hohe Qualität zu produzieren. Sie schreiben genau ein Paper im Jahr, einige nutzen nochnichtmal MS-Word, sondern schreiben es mit der Schreibmaschine. Die Sekräterin der Uni schreibt es dann nochmal mit MS-Word, sendet es zu Elsevier und die konvertieren das Manuskript dann man Pagemaker ins PDF Format. Logisch, dass der Workflow sehr aufwendig ist und logisch dass Wissenschaftler nicht einfach mal einige Paper auf Vorrat schreiben die sie dann ins großflächig ins Internet blasen können.

Es ist Ausdruck von Hilfslosigkeit wenn man über den Publishing Prozess als solchen diskutiert und Elsevier und Academia.edu gegeneinander ausspielt. So nach dem Motto: der High-Quality Content ist in unbegrenztem Umfang vorhanden nur die Publisher sind entweder zu kommerziell oder zu anti-kommerziell und daran scheitert es dann. Der eigentliche Flaschenhals sind jedoch die Autoren. Also jene Leute die zunächst einmal das PDF als solches erstellen.

Schaue ich mir meine eigene Publikationsliste bei Academia.edu einmal an, so fällt vor allem eines auf: sie ist unglaublich lang. Man hat fast den Eindruck, das wäre kein Repository sondern ein WordPress-Blog. Das Geheimnis hinter der Quanitität heißt Lyx in Verbindung mit einem reduziertem Qualitätsanspruch. Mit dem Textprogramm Lyx lassen sich ohne Probleme mehrere Paper gleichzeitig schreiben, man muss da auch nichts einstellen sondern man merkt das Programm fast gar nicht. Man tippt wie bei einem Nurtext-Editor einfach seinen Content ein und 1 Monat später hat man dann das herzeigbare PDF Dokument inkl. Literaturangaben, Bildern und Sourcecode. Der zweite Trick ist das reduzierte Qualitätsbewusstsein. Das het nichts mit einer konkreten Software zu tun sondern bedeutet dass man ein wissenschaftliches Paper so schreibt als wäre es ein Kommentar in einem Forum, inkl. Rechtschreibfehler, unbelegten Aussagen und verworrener Gliederung. Wenn man das anschließede Korrekturlesen weglässt kann man sehr viel Zeit einsparen. Diese wird dann investiert in das Schreiben des nächsten Papers. Selbstverständlich kann man die Lowlevel-Qualität überall sehen, ich glaube meine Dokumente haben im Durchschnitt 100 Rechtschreibfehler und ebensoviele Grammatikprobleme. Aber mich stört das nicht. Was mich hingegen stört ist wenn ich anfangen würde, Satz für Satz durchzugehen die Rechtschreibung zu checken, Dinge prägnanter zu formulieren und den Text ins Reine schreiben. Dabei würde unendlich viel Zeit draufgehen. Vermutlich arbeiten die meisten Wissenschaftler nach dieser Methode, das führt dazu, dass sie eben nicht einen hohen Output generieren sondern ähnlich wie in einer Manufaktur jedes Dokument ein Kunstwerk ist.

Advertisements

Ist github das bessere Academia.edu?

Academia.edu wird von vielen noch nicht als die beste Publishing Plattform für ihre wissenschaftliche Paper angesehen. Der Grund ist, dass man nicht so ohne weiteres das PDF Dokument wieder herunterladen kann und das man dort auch keinen Sourcecode hosten kann. Manchmal wird stattdessen nach einem github für Akademiker gerufen. Doch so etwas gibt es schon. Bei github kann man über den Button „upload file“ nicht nur eine Java oder C++ Datei hochladen sondern man staune auch ein komplettes PDF Paper. Das wird dann ganz normal im Online Directory angezeigt. Der Vorteil ist, dass es von Google indiziert wird und ganz wichtig sich jeder der möchte das PDF File auch wieder herunterladen kann. Hinzukommt, dass unter der selben URL auch gleich noch der Sourcecode des Projektes befindet.

Nach eigener Aussage hat Academia.edu derzeit 50 Mio User während github über 20 Mio User verfügt. Aber der Unterschied ist, dass sich auf github unique Content befindet also nur dort der Sourcecode liegt, während Academia.edu böse formuliert nur die selben Paper enthält die woanders auch schon online sind. Insofern besitzt github schon heute eine echte Community während Academia.edu erst noch eine aufbaut. Schauen wir uns einmal die Funktionen an von Academia.edu welche speziell auf Akademiker zugeschnitten sind. Objektiv betrachtet sind das exakt 0. Man kann zwar beim Paperupload in das Abstract Feld irgendwas einfüllen, aber im Regelfall werden Paper ohnehin über eine Volltextsuche gefunden und nicht über den Abstract. Und gerade diese ist bei Academia.edu grottenschlecht. Ganz anders bei github. Dort hat man einiges an Erfahrung in dieser Richtung und weiß was die computerbeigeisterten Nutzer sich wünschen. Desweiteren stellt ich die Frage ob ein moderners wissenschaftlichen Dokument noch ohne Sourcecode im Anhang auskommt, selbst in den Geisteswissenschaften wird heute schon mit Python gearbeitet wenn auch noch sehr vorsichtig. Und die Nummer #1 in Sachen Sourcecodehosting ist uneinholbar jener Dienst der den süßen Kraken im Logo hat. Wer will kann dort nicht nur seine Paper hochladen sondern auch noch ein Wiki und einen Issuetracker hinzunehmen, das ist alles standardmäßig schon online. Es wurde ursprünglich entwickelt zur Dokumentation von Softwareprojekte lässt sich aber auch für wissenschaftlichen Centent verwenden. Bei Academia.edu gibt es nichts davon. Technisch gesehen ist github also die bessere Plattform für das Hosten von OpenAccess Content. Es gibt jedoch auch einen Punkt der github als Dokumentenhoster spricht: es wird von google Scholar nicht als wissenschaftliche Quelle anerkannt. Vermutlich gilt es dort als Blog / private Webseite.

Neues Paper online

https://www.academia.edu/34630552/Robot-Control-System_mit_objektorientierter_Programmierung

Nach wie vor muss ich sagen, dass der Upload Button von Academia.edu einfach nur weltklasse ist. Wenn man da draufklickt, kann man in unter als 1 Minute ein komplettes PDF hochlanden, inkl. Ausfüllen des Abstract-Buttons und Einordnung in die korrekte Kategorie. Bis es dann tatsächlich online einsehbar ist, dauert es zwar nochmal einige Tage aber die Upload Prozedur als solches ist vorbildlich gelöst. Kein anderer Anbieter zuvor (Springer Verlag oder Arxiv) besaß ein derart kompromisslose Upload Funktion. Im Grunde ist das ganze wirklich darauf ausgelegt, etwas zu publizieren und nicht nur den wissenschaftlichen Prozess zu simulieren. Ob es dann gelesen wird, steht auf einem anderen Blatt. Vermutlich eher nicht. Doch kommen wir zu den Inhalten. In meinem neuen Paper geht es wiedereinmal um Robotik. Diesmal habe ich das Projekt im Codeumfang massiv ausgebaut was über Objektorientierte Programmierung gelang. Das ganze kann man sich als Trafficsimulation vorstellen, bei dem mehrere Roboter im Kreis fahren und es auch noch Ampeln gibt. So ähnlich wie das Traffic-Plugin für Unity, nur eben in Python und pygame realisiert. Der Sourcecode und das UML Diagramm ist im Anhang des Papers enthalten.

Warum die Wissenschaft einen kommerziellen Preprint Server braucht

Wer sich näher mit Academia.edu beschäftigtt wird feststellen, dass dahinter keine Universität steckt sondern ein kommerzielles Unternehmen. Das kann für die Qualität von wissenschaftlicher Forschung nichts gutes bedeuten, so der wage Verdacht. Und in der Tat, normalerweise wird Wissenschaft nicht-kommerziell durchgeführt, an Universitäten die dem Gemeinwohl verpflichtet sind. Das Problem ist, dass es in der Praxis leider nicht funktioniert, wenn man nicht-kommerzielle Preprint Server betreiben will. Schauen wir uns dazu das Paradebeispiel Arxiv etwas genauer an. Auf https://arxiv.org/help/submit wird erläutert wie man dort etwas hochlädt. Das Problem dabei ist, dass man sich nicht wirklich an die breite Öffentlichkeit richtet, sondern Arxiv eingebunden ist in den Universitären Complex. Oben im Banner steht schon drin, dass es der Cornell University zugeordnet ist und im Text erfährt man, dass bevor man etwas hochladen kann, man sich zunächst registrieren muss und das wiederum erfordert, dass man an einer Universität eingeschrieben ist. Genau genommen ist Arxiv also kein öffentliches Portal sondern funktioniert so ähnlich, als wenn sich Studenten eine Uni-Homepage anlegen. Wo sie also unterhalb der Uni-Domäne Webspace verwenden um ihre Forschungspaper vorzustellen. Wenn sie die Uni verlassen, erlischt die Domäne natürlich.

Auch die weiteren Submission Guidelines von Arxiv machen eher den Eindruck, als ob die Öffentlichkeit möglichst abgeschreckt werden soll. Da finden sich altmodische Öffnungszeiten, wann man überhaupt etwas hochladen darf, und einige Nutzer wissen zu berichten, dass manchmal Paper sogar rejected werden, ohne klare Gründe dafür. Der typische Arxiv-Nutzer, also für wen das Portal gemacht wurde, ist ein ordentlicher Professor an der Cornell Universität und benutzt Arxiv als internes Publishing-System um sich mit Fachkollegen auszutauschen. Und genau hier gibt es das Problem. Dadurch, dass Arxiv sich selbst als nicht-kommerzielles universitäres Projekt definiert hat die Öffentlichkeit keinen Zugriff darauf. Sie kann dort weder etwas hochladen, noch etwas herunterladen. Der Grund dafür ist, dass Universitäten eben nicht in der öffentlichkeit stehen wie ein Supermarkt oder eine Tankstelle, sondern Universität sind sehr abgelegen. Um eine Bibliothek oder einen Hörsaal zu besuchen muss man Mitglied sein, vergleichbar mit einem Gentleman-Club. Und im Regelfall erlischt diese Mitgliedschaft irgendwann auch wieder. Das heißt, wer sein Diplom in der Tasche hat, ist nicht länger Student.

Die Schwierigkeit mit Arxiv ist, dass es dem universitären Komplex zugeordnet ist. Es ist angegliedert an eine Forschungsinstitution und einer Universität zugeordnet. Das mag inhaltlich vernünftig sein, weil es schließlich um Bildung geht, hat jedoch den Nachteil, dass Arxiv den Zielen von Universitäten untergeordnet ist. Leider haben Universitäten als Hauptziel nicht das Publizieren von Papern, sondern das ist nur eine Aufgabe unter vielen. Darüber hinaus geht es auch im Lehrveranstaltungen und staatliche Forschungsprojekte. Besser ist es, wenn man einen Preprint Server gründet, der nur für das Publizieren von Papern zuständig ist und sonst keine weiteren Aufgaben hat. Also ein eigenständiges kommerzielles Unternehmen. So eine Art von Buchhandlung nur eben für OpenAccess Paper.

Das Selbstverständnis von Arxiv kann man auf https://arxiv.org/help/primer nachlesen. Aus Sicht von Arxiv und der dahinterstehenden Universitäten macht das durchaus Sinn. Ich würde sogar sagen, dass Arxiv eine sehr gute Seite ist. Das Problem ist nur, dass für den Wissenschaftsprozess keinen Sinn macht. Weil das was Arxiv als Guidleines besitzt viel zu schwerfällig ist, keine klaren Ziele verfolgt und vor allem nicht auf Massenuploads von PDF Papern ausgelegt ist. Arxiv dafür zu kritisieren geht in die falsche Richtung. Weil Arxiv ja gerade nicht den Upload vereinfachen kann oder sich für nicht-universitätsangehörige öffnen kann. Das würde nicht funktionieren. Sondern die Antwort liegt darin, einen eigenen ständigen Preprint Server zu gründen, der etwas anderes ist als Arxiv. Also soetwas wie ResearchGate bzw. Academia.edu. Beide Projekte sind from-scratch entstanden, ohne dass da im Hintergrund eine Universität steht. Sondern es handelt sich um Business-Modelle die mit Startup Capitel finanziert wurden. Am ehesten vergleichbar mit dem Red Hat Konzern.

Wann ist ein Text fertig?

[1] In der obigen Abbildung ist die Rohversion eines Papers zu sehen, an dem ich gerade schreibe. Bisher besteht es aus 25 Seiten, allerdings ist unklar wann der richtige Zeitpunkt ist, es tatsächlich abzugeben bzw. ins Netz zu stellen. Klar, ich könnte nach der Methode verfahren „publish or perish“ und möglichst sofort auf den Upload Knopf drücken. Leider hat die Vergangenheit gezeigt, dass nachdem das Paper erstmal online war, noch weitere Kapitel hinzugekommen sind, die sich dann nicht mehr einfügen lassen. Eine bessere Strategie besteht darin, den Umfang des Papers zu beobachten. Man muss jeden Tag notieren, wieviele Wörter das Paper hat, und wenn der Zuwachs nur noch minimal ausfällt oder gar zum Stillstand kommt ist es Zeit für den Upload.

* 19. Juli 2017, 26145 Wörter
* 20. Juli 2017, 27154 Wörter
* 21. Juli 2017, 28036 Wörter
* 22. Juli 2017, 28200 Wörter
* 23. Juli 2017, 28198 Wörter

Das hört sich jetzt ein wenig merkwürdig an, aber Paper haben die Angewohnheit ein Eigenleben zu führen. Damit ist gemeint, selbst wenn man sich vornimmt es auf einem Stand x einzufrieren wird daraus meist nichts. Plötzlich hat man doch noch eine Idee und muss diese noch unbedingt hineinbringen. Besser ist es, wenn man den Fortgang der Textproduktion möglichst neutral beobachtet und die Abgabe an einem gleichbleibenden Word-Count festmacht. Motto: wenn der Umfang längere Zeit konstant bleibt ist es wahrscheinlich, dass es auch in Zukunft so bleiben wird.

Zumindest eine Entscheidung ist ausgesprochen simpel: ob man das Paper nochmal Korrektur lesen sollte oder ob man Absätze wieder streichen sollte. Die Antwort ist nein. Rechtschreibkontrolle bringt nichts und Absätze löschen geht gar nicht. Die Idee ist es vielmehr ein unfertiges und umständliches Paper online zu stellen. Um es dann in einem größeren Abstand von 1 Jahr nochmal komplett neu schreiben zu können. Das heißt, das was in dem Paper drinsteht ist ohnehin nicht der Weisheit letzter Schuss, selbst wenn man da noch 2-3 Rechtschreibfehler ausmerzt. Und das sich daran die Leser stören, ist auch nicht zu erwarten, weil die Leser ohnehin das Gesamtwerk beurteilen, also wieviel Mühe man sich gegegeben hat.

Post von Academia.edu

Heute habe ich eine E-Mail von Academia.edu erhalten. Darin wurde stolz verkündet dass man jetzt einen wichtigen Meilenstein erreicht hat weil die Marke von 50 Mio Mitgliedern überschritten wurde, diese haben 18 Mio Paper auf die Plattform hochgeladen und mehr als 850 Mio Menschen weltweit haben die Paper gelesen. Dann gibt es noch das Zitat eines Professors von der Princton University der sagt, dass er unmittelbar nach einem Upload 20 Visits auf sein Paper erhalten haben, was mehr ist als normalerweise üblich.

Soweit zu den guten Dingen. Was jedoch von Seitens Academia.edu nicht thematisiert wird ist die Frage, ob diese 20 Visits auf das Paper in Wahrheit ein Shitstorm waren. Sowas wird als „academic mobbing“ bezeichnet und bedeutet, dass man nicht etwa wohlwollend zitiert wird, sondern dass sich ein sozialer Druck aufbaut. Auch die von Academia.edu so hochgehaltene Möglichkeit eines Peer-Reviews kann sich unbeabsichtigt in einen Pranger verwandeln. Für meinen Teil kann ich sagen, bisher zum Glück davon verschont geblieben worden zu sein. Meine Paper erzielen 0 Visits und das ist gut so.

In Deutschland wurde im Jahr 2008 ein ähnliches Projekt gestartet, es nannte sich Schulradar:

„SchulRadar ist ein deutschsprachiges Internetportal zum Meinungsaustausch über Grund- und weiterführende Schulen in Deutschland. Eltern können auf der Plattform Noten für die Schulen ihrer Kinder vergeben. […]

Viele Schuldirektionen sind aus diesen Gründen der Plattform gegenüber skeptisch eingestellt – Kritik an Schulen an sich sei angebracht, aber nicht auf diese Weise.“ https://de.wikipedia.org/wiki/SchulRadar

Unpublished manuscript wie formatieren in Lyx?

Eigentlich sollte man denken die Aufgabe ist simpel. Es geht geht um die Frage wo der kleine Zusatz „Unpublished manuscript“ im Lyx Dokument hingehört. In der Standard Article Klasse gibt es nur Felder für Titel, Autor und Datum. Nicht jedoch für Publisher. Man kann zwar bei Lyx auch andere Templates verwenden (ACM SIGGRAPH, Elsevier und alles was das Herz begehrt), doch die sind mir allesamt too much. Ich will ja kein eigenes Journal rausbringen sondern nur meinen Artikel formatieren. Was man jedoch machen kann, ist das Feld „Adresse“ zu nutzen um dort dann dezent darauf hinzuweisen, dass das Manuscript noch keinen Verlag hat und auch nie einen finden wird. Das sieht zwar unglaublich häßlich aus, aber dafür wird der Zusatz relativ weit oben positioniert.

Eigentlich wollte ich ursprünglich noch auf die Titelseite den kompletten Bibtex-Key mit aufnehmen damit das Dokument leichter zitiert werden kann, aber andererseits will ich meine Leser auch nicht für doof verkaufen. Vermutlich können sie den Bibtex Eintrag wenn sie ihn benötigen mittels Zotero, Jabref oder womit auch immer selber erzeugen. Letztlich muss ich zwar ein wenig auf formale Dinge achten, aber zunächst einmal bin ich der Autor und nicht ein externer Parser der das Dokument referenziert. In der Summe bin ich mit dem Ergebnis jedenfalls zufrieden, das Paper hat 50 Seiten, ist schön mit Literatur bestückt und hat im Anhang sogar noch den Sourcecode. Was will man mehr?

Ok, die Rechtschreibung ist miserabel, der Inhalt ist eher Standardkost und die Abbildungen sind lustlos abfotografierte Screenshots, aber jedes Paper ist besser als gar kein Paper. Oh pardon, es heißt „unpublished manuscript“, das ist mir wichtig. Wir wollen die Begriffe schön auseinanderhalten und demzufolge wird das PDF auch in der richtigen Kategorie bei Academia.edu erscheinen, nähmlich in der Sektion Draft.

Leser wird es dort keine finden. Ich vermute mal, dass die Abrufzahl insgesamt weniger als 10 sein dürfte. Aber ehrlich gesagt ist mir das egal, weil das etwas mit dem Thema zu tun hat. Wie der Titel schon vermuten lässt ist das ein komplettes Randthema wozu es bisher nur wenig Publikationen gibt. Aufgeregt bin ich aber trotzdem ein wenig. Ich weiß nicht ob ihr das kennt, wenn man kurz davor ist das Paper hochzuladen, ist das immer so ein Gefühl wie bei Weihnachten. Ich weiß, der Vergleich hinkt aber es ist so ähnlich, als wenn man einen Wikipedia-Artikel geschrieben hat, den dutzendfach Korrekturgelesen hat, und jetzt mit dem Finger über dem Submit-Button schwebt und sich überwinden muss. Weil, ist das ganze erstmal online gibt es kein Zurück mehr. Man steht ganz oben auf dem 10 Meter Brett und jetzt muss der Salto sitzen, sonst wird man ausgelacht.