Am 27.02.2012 hat Google die monatliche Liste ihrer Updates und Veränderungen für den Februar 2012 veröffentlicht. Am 28. und 29. wird dort scheinbar nicht gearbeitet ;) Mit ca. 40 Punkten handelt es sich dabei um die bisher umfangreichste Veröffentlichung. Leider zeichnet sich generell der Trend ab, dass viele der veröffentlichten Infos nur bedingt für die Praxis relevant sind, denn häufig ist einfach nur von “Improvements” in bestimmten Bereichen die Rede (, die sich selten direkt erkennen lassen) – und das sehe scheinbar nicht nur ich so. Einige Punkte sind aber dennoch interessant und sollen deshalb im Folgenden kurz vorgestellt und erläutert werden.

Refreshed per-URL country information.

[Launch codename “longdew”, project codename “country-id data refresh”] We updated the country associations for URLs to use more recent data.

Übersetzt:

Wir haben unseren Algorithmus zur Erkennung von Länder-Assoziationen auf URL-Basis aktualisiert.

Ich würde die Aussage so interpretieren, dass Google anhand der URL identifiziert, welchem Land diese URL zugeordnet ist. Spontan fallen da natürlich die ccTLDs ein. Aber theoretisch könnten auch Subdomains und Folder (de.example.org, example.org/de/) Hinweise auf die geographische Zuordnung geben.

Weiterhin behandelt Google einige ccTLDs wie generische TLDs bzw. einigen ccTLDs kann in den Webmaster Tools eine geographische Lokation zugeordnet werden. Diese Endungen waren bisher: .ad .como .bz .cc .cd .co .dj .fm .gg .la .me .ms .nu .sc .sr .tv .tk .ws

[Quelle: Post auf Google+]

Sollte sich mit diesem Update daran etwas geändert haben, wäre es interessant hier genauer nachzuhaken. Pro-Tipp:  Jeden Freitag gibt es auf Google+ ein Webmaster Hangout mit John Müller (Google Schweiz Mitarbeiter), in dem man Antworten auf solche Fragen bekommen kann.

Data refresh for related searches signal.

[launch codename “Chicago”, project codename “Related Search”] One of the many signals we look at to generate the “Searches related to” section is the queries users type in succession. If users very often search for [apple] right after [banana], that’s a sign the two might be related. This update refreshes the model we use to generate these refinements, leading to more relevant queries to try.

Übersetzt:

Eines der vielen Signale, die wir bei der Generierung von “Verwandte Suchanfragen zu” nutzen, ist die Abfolge von Suchanfragen, die ein User eingibt. Wenn User oft nach [Apfel] suchen, nachdem sie nach [Banane] gesucht haben, dann ist das ein Signal dafür, dass diese beiden Terme verwandt sind. [...]

Die Erkennung von Synonymen und verwandten Termen ist im Informationen Retrieval eine ziemlich wichtige Funktion, weil es die Ergebnismenge zu einer Suchanfrage erhöht (genauer: der sog. Recall wird verbessert). Das ist insbesondere bei Web-Suchmaschinen wichtig, weil es keine definierte Terminologie gibt und “jeder schreiben kann, was er will” (und dabei auch die Wörter benutzen kann, die er möchte). Einige Algorithmen, die in diesem Bereich bereits durch die SEO Szene gegeistert sind, umfassen pLDA und LSI (Achtung: keine Aussage, ob solche Algorithmen eingesetzt werden oder nicht!).

Interessant an dieser Info ist die Tatsache, dass Google offiziell angibt, Informationen auf Basis des Suchverhaltens zur Erkennung von verwandten Begriffen zu verwenden. Denkt man einen Schritt weiter, dann kann dieser Algorithmus auch auf Brands angewandt werden, die sich in einer bestimmten Nische etablieren wollen. Beispiel: Suche nach ([Handy] gefolgt von Suche nach [Samsung]. Wenn man sich jetzt noch erinnert, dass andere Algorithmen, die auf dieser Informationsbasis beruhen, manipulierbar sind (siehe Google Suggest Autocomplete Manipulation), dann halte ich das für eine recht Interessante Info.

Link evaluation

We often use characteristics of links to help us figure out the topic of a linked page. We have changed the way in which we evaluate links; in particular, we are turning off a method of link analysis that we used for several years. We often rearchitect or turn off parts of our scoring in order to keep our system maintainable, clean and understandable.

Übersetzt:

Wir benutzen häufig Charakteristika von Links um das Thema der verlinkten Seite zu erkennen. Wir haben nun die Art und Weise der Evaluation von Links verändert; insbesondere haben wir eine Methode entfernt, die wir mehrere Jahre lang genutzt haben. Wir verändern oder entfernen häufig Teile in unserem Bewertungsmechanismus um unser System wartbar, sauber und verständlich zu halten.

Schwammiger könnte man es kaum formulieren und im Prinzip ist die Info vollkommen nichtssagend. (In der SEO Sphäre gibt es bereits wilde Spekulationen darüber, welcher Faktor gemeint sein könnte.) Ich führe das hier nur deshalb auf, weil es gerade vorletzte Woche den Beitrag Ein paar Tipps und Anmerkungen zum Linkbuilding im deutschen Google Webmaster Blog gab, bei dem Google durschienen ließ, dass sie sich der heutigen (unerwünschten) SEO Praktiken im Linkbuilding durchaus bewusst sind.

Es ist schwer zu sagen, ob es nun einen direkten Zusammenhang zwischen dem Blogpost und der obigen Info gibt. Zumal allein die Erkenntnis, dass in der Praxis Linkbuilding Methoden angewandt werden, die den Webmaster Guidelines widersprechen, wohl weder neu ist, noch etwas darüber aussagt, dass Google auch in der Lage ist, dies zu verhindern. Ich persönliche gewinne jedoch den Eindruck, dass sich dieses Thema bei Google langsam aber sicher einen Prioritätsstatus erarbeitet. Mehr dazu bei den Internetkapitänen.

Weitere Updates im Februar 2012

Die restliche Updates fallen Großteils in den “Wir haben etwas verbessert/verändert(, ihr werdet es aber vermutlich nicht merken und auch keine Learnings daraus generieren können)” Bereich. Beispiele: Größerer Image Search Index, Verbesserung bei Megasitelinks, Entfernung von zwei Klassifizierungselementen für Freshness, etc.

Speziell den Updates im Bereich Images hat sich Martin gewidmet.