Aufnahme in den Google Index nur auf Anfrage

Vor einiger Zeit hatte ich darauf hingewiesen, dass mein Weblog noch nicht im Google Index enthalten ist. Zum Beweis habe ich dazu probeweise einen Halbsatz aus einem älteren Blogbeitrag kopiert, diesen in Anführungszeichen gesetzt und das bei Google als Suchanfrage eingegeben. Es wurde jedoch kein Treffer zurückgegeben, das heißt, wenn jemand explizit mein Blog finden wollte, wäre es selbst dann ihm nicht gelungen.

Inzwischen habe ich die URL manuell zu google übermittelt (submit URL) und siehe da, plötzlich wird der Halbsatz gefunden. Ich kann jetzt aus einem beliebigen Post einen Textstring bei Google eingeben und erhalte dann mein Blog angezeigt als den einzigsten Treffer. Zugegeben, damit ist zwar noch nicht für Traffic gesorgt weil es nachwie vor den Pagerank gibt, aber zumindest ist so sichergestellt, dass mein Blog zumindest an der allerletzten Position erscheint was schomal besser ist, als überhaupt nicht im Index aufzutauchen. Danke Google.

Weniger auf Zack ist die Suchmachine Bing. Auch dort habe ich manuell meine URL übermittelt, nur wenn ich dort einen Halbsatz als Textstring eingebe wird mein Blog nicht gefunden. Rein technisch gesehen müsste es dort ebenfalls als einziger Treffer angezeigt werden, aber nichts da.

Der Witz ist, dass laut der Statistik des Blogs der Crawler gar nicht vorbeigeschaut hat. Es war also nicht so, dass nach dem URL Submit der Traffic einmalig hochging und ein Bot alle Seiten eingelesen hat, sondern laut Traffic kam nie ein Google Robot vorbei. Vielmehr scheint der URL Submit bewirkt zu haben, dass die ohnehin vorhandenen Daten aus der Google Datenbank freigeschaltet wurden, so dass auch der Normaluser nach Eingabe des Textstrings das Blog angezeigt bekommt. Vermutlich hat Google zwei Datenbanken und bekommt es nicht hin, diese anständig zu synchronisieren. Es gibt dafür in Linux den Befehl „sync“ mit dem man unterschiedliche Datenbestände zusammenführen kann, aber das nur als kleiner Tipp für die Google Mitarbeiter die vermutlich immernoch noch mit mechanischen Schreibmaschinen und dreifach Formularen arbeiten.

Desweiteren ist es nach wie vor so, dass keineswegs alle meine Blogartikel über Google angezeigt werden, sondern in einigen Fällen kann ich immernoch einen Textstring eingeben und bekomme keine Resultate zurück obwohl der Textstring 1:1 aus meinem Blog rauskopiert ist. Womöglich muss man nochmal den Submit URL Button drücken oder vielleicht gibt es irgendwo noch einen zweiten Button? Was aber ebenfalls darauf hindeutet, dass Google keinen Plan hat.

Ehrlich gesagt sehe ich nicht ein, wiso ich mich als Blogger mit diesem SEO Kram herumärgern soll. Normalerweise ist das eine Sache zwischen dem Anbieter WordPress, der Werbeindustrie die fleißig Banner einblendet und Google der mit dem Aussphähen von Kundendaten Geld verdient. Wenn ich jetzt noch a) dafür sorgen muss überhaupt gecrawlt zu werden und b) vielleicht auch noch Google sagen soll, wie es den Pagerank für meine Seite berechnet, dann kann ich gleich meine eigene Suchmaschine gründen. Also eigentlich ist die Sache sehr simpel. Mein Blog hier ist das beste Blog in der Welt und muss auf Platz 1 geranked werden, wenn jemand nach Robotik in der Sprache Deutsch sucht. Ich weiß dass, weil ich mir manuell die deutsche Blogosphäre angeschaut habe, und es nirgendwo ein besseres Blog gibt. Wenn man jedoch den Begriff „Robotik“ bei Google eingibt, werden nur Larifari Webseiten angezeigt, die nichts substanzielles zur Thematik beitragen. Zum Beispiel eine Webseite der Uni Rostock die aus einem dünen Textabschnitt besteht wo eine Lehrveranstaltung geannnt wird, die man besuchen soll. Irgendwelche Volltexte oder gar die Lehrveranstaltung als Video gibt es dort nicht. Der Nutzwert für einen potenziellen Leser ist gleich Null. Was macht also so eine Webseite auf Platz 4 der Trefferliste?

Noch halbwegs einverstanden bin ich hingegen mit der Platzierung von hnf.de Dabei handelt es sich um ein Technikmuseum was auch einen Blog besitzt. Es gibt dort relativ viele Informationen und die Bilder sind auch von guter Qualität. Sowas ist nützlich. Jetzt wäre es natürlich spannend zu erfahren, an welcher Position mein eigener Blog angezeigt wird, leider geht das aus der Treffermenge nicht hervor. Und manuell durch die Liste zu klicken ist nicht so mein Ding. Es gibt aber auch Lichtblicke: wenn man als Suchwort eingibt „Robotik Künstliche Intelligenz“ und den Zeitraum festlegt auf „letzter Monat“ wird mein Blog in der Treffermenge erwähnt. Zwar nicht auf Platz 1 aber immerhin vor Webseiten wo man in Abofallen hineingezwängt wird.

Machen wir einen weiteren Test. Nach meiner Recherche ist Trollheaven das einzige deutsche Blog, wo beschrieben ist was DARRT „Diverse Action Rapidly-exploring Random Tree“ ist. Gibt man jetzt als informationshungriger Nutzer „DARRT“ bei Google an, wird jedoch das Blog nicht erwähnt. Stattdessen wird ein nichtssagender Wiki-Artikel angezeigt (darrt ist eine flektierte Form von darren) sowie ein Shop wo man Darrt-Pfeile kaufen kann. Anders gesagt, Google ist so ahnungslos was Wissenschaft der Gegenwart betrifft, dass es noch nichtmal erkannt hat, dass es hier um ein Robotik-Thema geht wozu es Unmengen an Fachliteratur gibt. Wenn Google nicht mein Blog sondern eines von diesen Papern angezeigt hätte, ok damit muss ich dann leben, so ist das eben wenn man Konkurrenz hat, aber Google ist per se noch gar nicht in der Lage die Suchanfrage zu verstehen, geschweige denn eine Lösung anzubieten. Wenn man auf die Sprache English wechselt wird zumindest weiter unten angezeigt, was in die richtige Richtung geht. So findet sich die DARRT Library aus ROS, und mit etwas Verspätung auch ein wissenschaftliches Paper. Aber dazwischen auch jede Menge Seiten, die überhaupt nichts mit DARRT zu tun haben.

Wenn man etwas näher recherchiert wird deutlich, warum mein DARRT Artikel nicht angezeigt wird. Dazu kopiere ich erneut einen Halbsatz als String in die Google Suchmaske um zu prüfen ob Google das Posting überhaupt schon indiziert hat. Ach schade, es wird nichts angezeigt. Wäre ja auch ein Wunder, wenn eine Webseite die ordnungsgemäß bei WordPress veröffentlicht wurde, und wovon die URL an Google übermittelt wurde, dann auch tatsächlich im Index auftaucht :-( Anders gesagt, dieser Artikel ist wohl einer derjenigen die trotz „Submit URL“ bis heute nicht als Volltext über google gefunden werden. Vermutlich müsste ich jetzt manuell erneut diese eine URL zu Google submitten, dann noch 2 Formulare ausfüllen und so weiter und so weiter. Kurz gesagt, ich glaube Google muss noch sehr viel Lernen in Sachen „Suchen im Internet“.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s