Sun Tzu und die Kunst ein Lexikon zu schreiben

Sun Tzu sagt, jede Schlacht ist geschlagen bevor sie begonnen hat. Im Beispiel von Wikipedia heißt das, dass man bevor einen Text überhaupt dort einstellt man wissen sollte, wie darauf die Gegenseite reagiert. Um das herauszufinden habe ich folgendes Python Script erstellt:

# -*- coding: utf-8 -*-
'''
Created on 22.02.2017
Wikipedia Check
@author: Manuel Rodriguez
'''
class Quality: 
  def __init__(self):
    self.sentences = input('How much sentences? ')
    self.sources = input('How much sources from Google Scholar? ')
    self.doi = input('... from that with a DOI number? ')
    self.orthography = input('Is orthography correct? (0=no, 1=yes) ')
    self.quotationmarks = input('Are the quotation marks changed from"that" to „that“? (0=no, 1=yes) ')
    self.result()
  def result(self):
    self.neededcitation = 5
    self.neededdoi = 0.5
    count1 = 1.0 * self.sources / self.sentences
    count2 = 1.0 * self.doi / self.sources
    cond1,cond2,cond3,cond4=False,False,False,False
    if count1 >= (1.0*1 / self.neededcitation): cond1 = True 
    if count2 >= (1.0*self.neededdoi): cond2 = True
    if self.orthography==1: cond3=True
    if self.quotationmarks==1: cond4=True
    print "\nResult: ",
    if cond1==True and cond2==True and cond3==True and cond4==True:
      print "Text is great, please upload. Sighting can take up to 40 days"
    else: 
      print "Textquality is bad, Don't upload. The problems are:"
      if cond1==False: print "- number of sources"
      if cond2==False: print "- number of DOI"
      if cond3==False: print "- orthography"
      if cond4==False: print "- quotation marks"
 
if __name__ == "__main__":
  myQuality = Quality()

Nachdem man das Programm mit „python check.py“ startet muss man auf der Komamndozeile einige Fragen beantworten: Anzahl der Sätze, Anzahl Quellen, Anzahl Quelllen mit DOI Nummer, Rechtschreibung korrekt? und Anführungszeichen korrekt? Dann wird überprüft ob die Wikipedia-Qualitätskriterien erfüllt sind und entweder erscheint dann, dass alles super ist oder eben nicht. Der Check bietet eine erste Möglichkeit grob einzuschätzen ob sich ein Upload überhaupt lohnt. Vielleicht mal ein kleines Beispiel.

Auf meiner Festplatte habe ich schon einen kleinen Wikipedia Artikel geschrieben über ein Thema was interessant ist, und wozu es noch keinen Artikel bei Wikipedia gibt. Wenn ich jetzt das Programm starte, gebe ich bei Anzahl Sätze wahrheitsgemäß „10“ ein, bei Anzahl Quellen „1“ bei Anzahl Quellen mit einer DOI Nummer „0“, bei Rechtschreibung und Anführungszeichen beidesmal eine „0“ für nicht eingehalten. Die Software rechnet dann ein wenig und es wird ausgegeben, dass die Textqualität zu niedrig ist. Jetzt könnte ich natürlich den Text trotzdem zu Wikipedia hochladen. Nur, die Wahrscheinlichkeit ist hoch, dass es Stress gibt. Entweder gibt es einen Löschantrag oder ein erfahrener Admin hat daran etwas auszusetzen. Insofern ist es besser auf den Upload zu verzichten. Das ist zwar schade aber nicht zu ändern.

Wer sich den Sourcecode näher anschaut wird relativ schnell bemerken was man eingeben muss, damit die Software den Text für perfekt hält: man muss alle 5 Sätze mindestens eine Quelle haben und es müssen 50% DOI Quellen sein. Bei den Fragen 4 und 5 muss man beidesmal „1“ eingeben. Und ja, darüber kann man den Check austricksen.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s