How many users has Stackoverflow?

In relationship to the world population surprisingly less. I would guess the number of active users over the years was 400k. That is equal to 0.0057% of the world. But these users have created a lot of traffic on the website and many more passive readers have consumed the information. So it is overall the same game like in Weblogs and Wikipedia. A small amount of engaged people (less than 1%) is writing the content for 99% of the people. But, that is normal because somebody must stand up and go forward.

A detailed statistics about the users is given at https://stackexchange.com/leagues/1/alltime/stackoverflow The interesting table is the number of users with a reputation change with more than 50+. That are active users who are getting some upvotes. In the last year, only 120k users get such an upvote. So it is the case, that the users are changing over the year. The interesting aspect is, that most stackoverflow question are non-AI (Artificial Intelligence) related. The typical issue has to do with C/Java/PHP/C++ programming. So Stackoverflow is reflecting mainstream computing from a developer perspective. Ontopic is everything what is done in industry for game-development, html-coding and app-development. The typical Stackoverflow poster is developer for an android game or at least is trying to learn it.

From a pessimistic point of view, the user count on Stackoverflow answers the question what is wrong with the world. If around 400k users have posted something on Stackoverflow, that is equal to maximum worldwide. A bigger website which also deals with programming question is not out there. So we must note, that not more than 400k people are available worldwide who can program or learn to program. Compared to the overall population that is a minority. Or to make the point clear, if we are asking per random 100 people how much of them can program in HTML, 0 of them will answer with yes. 0.0057% means, that from 100 people only 0.006 are familiar with programming languages.

Advertisements

Podcast directory

In a last blogpost I’ve linked to a newly found podcast which is in English. In the meantime I’ve found another cool link. This time, not for another podcast, but for a whole directory of podcasts https://player.fm/series/talking-robots-the-podcast-on-robotics-and-artificial-intelligence They have many of them about robotics, history of computing and so on. It is a bit like the itunes store, but available in every browser and without installing additional software. As far as i can see, the website is some sort of Freemium portal. Most of the content can by played with a simple playback button in the webbrowser directly. Here is everything on one place, which makes it easy to search for topics. As far as i can see, everything is in English and the linked podcast alone has over 30 episodes. It is equal to the German podcast universe, but every thing is bigger and with more episodes.

Bug: Google drive is showing too much

The Google Drive service is connected to the Google account. Most people have perhaps such an account but they don’t use it. I’ve tested out the Google drive service a bit and uploaded a test document in the PDF format. A simple click on “share” is enough for getting a citable url which can be posted online so that everybody can download the file. So nice so good, the problem is, that in the sharing folder of Google drive the file is not shown. Only in a submenu in the settings the user can see, if his file is accessible online or not.

About the Google drive service is not very much known. In press statement, Google said, that around 2 trillion !! files or hosted in the cloud. If I understand the idea correct it is a replacement for dropbox which supports working in teams. For example, it is possible to share a Google docs file publicly, so that everyone can comment and edit the file. This goes into the direction of Academia.edu in which the so called Draft session allows a similar feature.

Perhaps a small explanation about the term “Share”. It is a word, which is used in context of social networks. The term share consists of many actions together. First, the user uploads a file from his local computer to the internet, secondly he set the option, that the file is accessible for reading, and third he is posting the link to the URL into a discussion group to get comments and likes. Sometimes Google Drive is also called a Deepweb, because if 100 Million people each have such online-drive with their private files, then the overall information is huge, but not public visible.

In the second step, i have deleted my test-pdf-file. The URL for the document was:

https://drive.google.com/open?id=1XCTdtUJYX7p9-FKp9iOLtyYlXOR9F9Yr

And after the deletion of the file, the url is not longer valid, right? No, that is what the customer expects, that deletion means the opposite. If I’m entering the URL into the Webbrowser I can the retrieve the pdf file normal:

Admittedly, the test document contains no important information. It was created with Libreoffce and apart from a simple “Hello World” no other data are in it. But, why is the URL working even after I deleted the file? I do not believe, that Google made a mistake. I believe, that the Internet or my computer was hijacked by somebody how wants to present Google drive in a wrong light.

What is the average download usage in GB?

According to the German Bundesnetzagentur https://www.bundesnetzagentur.de/SharedDocs/Downloads/DE/Allgemeines/Bundesnetzagentur/Publikationen/Berichte/2017/JB2016.pdf;jsessionid=E86CA52C6876C189F779907FC2D5D9D0?__blob=publicationFile&v=1 page 55 the average user consumes 60 Gigabyte on a monthly base. A survey from the united states come to the conclusion that the average usage amount was 190 GB per month per household, http://www.telecompetitor.com/igr-average-monthly-broadband-usage-is-190-gigabytes-monthly-per-household/ So what need the average citizen in reality? With todays video-compression techniques likes H.264 and VP8 the needed bandwith is reduced drastically. A videoclip generates in one hour around 700 MB traffic in normal 480p resolution. So if the PC plays in background 8 hours youtube-clips per day, it will produce 168 GB traffic per month. And that is only for watching one stream in 480p. If a person has two devices and he uses modern technology which is able to playback in 1080p quality (which even cheap Android tablets and lowend Notebooks can do) the monthly traffic counter will be much higher. So, what are the Germans are doing with their internet connection that they only need 60 GB? Are they are using sophisticated compression techniques which is more advanced than H.264?

Testbericht Chromium

Der Chromebrowser hat was den Marktanteil angeht, im Laufe der Zeit immer mehr Boden gutgemacht. Weltweit ist er inzwischen auf Platz 1. In Deutschland ist hingegen Firefox traiditionell sehr stark so dass man hierzulande von Gleichstand spricht zwischen Firefox und Chrome. Warum Firefox in Germany beliebter ist hat damit zu tun, dass Chrome den Ruf besitzt, den Datenschutz nicht zu beachten und haufenweise wertvolle Userdaten an Google zu senden. Ob das wirklich passiert? Mit hoher Wahrscheinlichkeit. Laut der Anzeige zu Upload/Download Statistik wurden allein heute schon 70 MB ins Internet gesendet, ohne dass ich irgendwas tatsächlich gesendet hätte. Diese Datenmenge fließt also im Hintergrund irgendwie ab.

Unterstellen wir mal, dass das nicht schlimm ist dann ist Chrome eigentlich ein sehr schöner Browser. Er ist deutlich schneller in der Anzeige von Webseiten als Firefox. Das betrifft einmal PDF Paper aber vor allem trifft das für Youtube Videos zu. Fängt bei Firefox gerne mal der Lüfter an zu rühren, wenn man die Videos in höherer Auflösung abgespielt werden, bleibt bei Chrome alles angenehm ruhig. Das dürfte der Verwendung von Webkit geschuldet sein, einer Bibliothek die exzessiv die OpenGL Schnittstelle nutzt und ursprünglich von Apple entwickelt wurde. Ebenfalls gut gelöst wurde bei Chrome die Taskanzeige. Man kann dort schön für jeden Tab einblenden wieviel CPU Ressourcen benötigt werden.

Ob in der Summe Chrome der bessere Browser ist, sei mal dahingestellt, aber zumindest macht es die Plattform eine Weiterentwicklung leichter. Das heißt, man kann davon ausgehen, dass die zukünftige Weiterentwicklung bei Chrome ein wenig mehr am technisch möglichen verläuft als das bei Firefox der Fall ist wo man seit Jahren mit Altlasten zu kämpfen hat. Nach wie vor ist bei Ubuntu übrigens Firefox vorinstalliert und nicht Chrome.

Vielleicht noch etwas zum Browser selber. Der größte Unterschied besteht darin, dass Chrome praktisch keinerlei Menüleiste mitbringt. Es gibt zwar irgendwelche Menüpunkte aber scheinbar wird darüber nicht der Browser gesteuert. Auch soetwas wie ein Settings-Menü im eigentlichen Sinne gibt es nicht. Wenn man irgendwas verstellen will, muss man Google fragen und dort gibt es dann irgendwelche Geheimen URLs die man eintippt um dort dann was zu verändern. Anders gesagt, Chrome entmündigt den Anwender total. Vermutlich steuert Google den Browser aus der Ferne und der PC ist nur das Anzeigegerät für den Enduser. Der Köder, damit die Leute das super finden ist das butterweiche Scrolling. So sanft und unklompiziert war das Browsen mit Firefox nie. Vermutlich hat der extrem hohe Marktanteil von Chrome dazu geführt, dass sehr viel Manpower in die Software gesteckt wurde. Gerüchten zufolge basiert auch der Safari Browser von Apple auf der Webkit-Engine genauso wie Opera.

Die Podcaster schießen sich selber ins Bein

Nach langem Suchen habe ich endlich einen neuen Technik-Podcast auf Deutsch gefunden: Geekstammtisch heißt er. Und eigentlich wollte ich jetzt mal schön von oben herab ablästern was da inhaltlich alles falsch erzählt wurde. Also schön kritisch als Zuschauer sein. Leider bin ich gar nicht soweit gekommen. Die Folge 004 in der es über C ging, und wo mit Sicherheit auch viel zu kritisieren wäre ist online gar nicht mehr einsehbar http://podlist.de/podcast/episode/geekstammtisch/gst004-ich-dachte-c-ist-fertig

Das heißt, offenbar ist man der zu erwarteten Kritik aus der Community zuvorgekomme und hat sich selbst entschlossen, die mp3 Datei vom Server zu nehmen. Schade eigentlich. Und hier liegt das eigentliche Problem. Wenn die Autoren selber ihre Beiträge schon löschen aus welchen Gründen auch immer, kommt man gar nicht in den Genuss inhaltliche Kritik anbringen zu können. Ein wenig erinnnerte das an Pofacs der vor allem dadurch auffiel, dass er heute weder für Fans noch für Kritiker abrufbar ist.

Das DARPA Paradox

Als Paradoxon wird in den Naturwissenschaften eine Beobachtung bezeichnet, welche der ursprünglichen Annahme widerspricht. Also etwas aufzeigt, was so nicht da sein dürfte. Die ursprüngliche Annahme darüber wer oder was die DARPA ist lautet landläufig, dass es sich dabei um eine ultrageheime militärische Behörde handelt welche für die US-Streitkräfte Technologie entwickelt. So eine Art von Q-Abteilung wie bei James Bond. Man könnte die DARPA auch als Zentrum des militärisch-industriellen Komplexes bezeichnen, worüber die USA ihren technischen Vorspruch sicherstellen.

Wenn diese Annahme korrekt wäre, dürfte es keine oder allenfalls falsche Angaben in der Öffentlichkeit geben woran die DARPA forscht, wer die Forschung ausführt und wie man diese Technologie in konkrete Produkte überführt. Und hier gibt es das eingangs zitierte Paradoxon. Google Scholar findet unter https://scholar.google.de/scholar?hl=de&q=DARPA&btnG=&lr= nicht weniger als 244000 Paper die allesamt von der DARPA gesponsert wurden, bei denen die allergeheimsten Geheimnisse verraten werden. Anmelden um sie einzusehen muss man sich nicht. Ja die Paper sind sogar leichter aufzurufen als die Status-Updates bei einem Facebook Freund. Jetzt mag man sagen, dass das keine richtige Paper wären sondern reine Propaganda, also politisches Bla Bla. Doch schaut man man im Detail hinein, was dort thematisiert wird und wie das geschieht so handelt es sich um Forschungspaper. Genauer gesagt um Erwachsenenbildung die mit wissenschaftlichem Anspruch geschrieben wurde, und die Querverweise enthält. Fast hat man den Eindruck, einem großen verteilten Schulbuch gegenüberzustehen. Wenn man dann noch die Google Websuche bemüht https://www.google.de/search?client=ubuntu&channel=fs&q=darpa+filetype%3Apdf&ie=utf-8&oe=utf-8&gfe_rd=cr&ei=PBohWfCNLM_PXr-kkUA finden sich dort sogar 462000 Darpa Paper, wobei es sicherlich Doppelungen gibt, aber nicht nur.

Anders ausgedrückt, wenn die DARPA wirklich ein supergeheimer Militär-Apparat wäre, dann gibt es da ein riesiges Leck. Aber vielleicht weiß die Behörde ja gar nicht, dass all ihre Informationen frei zugänglich im Internet stehen und sogar der Quellcode der bei der letzten Darpa Robotics Challange eingesetzt wurde, mittlerweile bei Github bereitsteht? Natürlich wird sie es wissen, sondern eher heißt die Schlussfolgerung dass die ursprüngliche Annahme darüber wer oder was die Darpa ist falsch ist.

An dieser Stelle ein kleiner Exkurs zum Plato Computersystem, https://de.wikipedia.org/wiki/Plato_(Computersystem) Es handelt sich um ein computerunterstütztes Lernsystem.was Leuten ohne universitären Background eine höhere Bildung zukommen lassen wollte. Der Sinn von Plato war nicht etwa Geheimhaltung sondern dessen Gegenteil: möglichst viele Leute anzusprechen.

Es ist unklar wie die Nutzungszahlen der DARPA Paper sind. Fakt ist jedoch, dass rein technisch gesehen sie von potenziell 7 Milliarden Leuten gelesen werden können, so fern sie English verstehen und sie dafür interessieren. Man könnte die Darpa Paper durchaus mit Wikipedia vergleichen, der Sprachduktus ist vergleichbar und ähnlich wie bei Wikipedia gibt es einen pädagogischen Anspruch. Also die Leute darüber zu bilden. Jetzt könnte man natürlich einwenden, dass es sich um eine mißbräuchliche Nutzung handeln würde, wenn man sich wahllos durch DARPA Paper durchklickt worin Steahlt-Technologie, medizinische Forschung und Robotik thematisiert wurde. Nur, eine explizite Paywall oder Zutrittsbarrieren gibt es keine. Wenn ich Google Scholar richtig verstanden habe, gibt es da nochnichtmal ein Cookies was überprüft wieviele man von diesen Papern schon gelesen hat. Sondern die Paper-Hosting-Server sind dermaßen exponiert im Internet hingestellt als wäre es ein Ubuntu-Update-Server wo man also mit hohem Traffic Aufkommen rechnet.

In einem Paper über das Plato-computer-based-education system (Misselt, A Lynn: “Implementation and Operation of Computer-Based Education”, 1980, dtic-document) wird die Gründung von Plato untersucht:

“A program of implementation of one advanced form of CBE (Computer-Based Education), the PLATO system, was begun by DARPA in the 1960s.”

Weiterhin verweist das Paper auf ein sogenanntes “ARPA/PLATO project”, offenbar sollte das ARPA Net weniger ein Computerverbund für militäreinrichtungen sein, sondern eher als Computer-based-training ausgelegt sein.

Interessant ist auch der zeitliche Zusammenhang zwischen dem ARPANet und dem Plato Computersystem. Beides entstand Anfang der 1970’er als Forschungsverbund in den USA. Wurde das Arpanet noch für weitere Dinge als nur das Plato-System genutzt?