Experimente mit dem Canonical Meta-Tag

Bereits im Februar hat Google den Canonical Meta-Tag eingeführt. Zweck der Anweisung soll sein, das Duplicate Content-Problem zu lösen. Dazu fügt man im HEAD-Bereich der HTML-Seite eine Anweisung ein, die den Suchmaschinen (Google, Yahoo und Microsoft) mitteilt, dass die Originalversion dieser Seite womöglich unter eine anderen URL zu finden ist. Diese andere URL wird dabei natürlich ebenfalls angegeben. Der Canonical Meta-Tag sieht demnach dann so aus:

<link rel=“canonical“ href=“http://www.example.com/original/“ />

Soweit die langweilige Einführung zur Syntax des Canonical Tags. Spannend wird es, wenn der von URL-Umbauten genervte SEO hofft, sich – oder seinen noch mehr genervten Kunden – damit eine Konsolidierung der URLs ersparen zu können. Es soll Beratungsprojekte geben, in denen dem SEO bereits das Wort „Duplicate Content“ verboten wurde …

Zwar schreibt Google in seinem Webmaster Blog über den Canonical Meta-Tag:

It also helps to make sure that properties such as link popularity are consolidated to your preferred version.
(Er hilft auch zu gewährleisten, dass solche Größen wie etwa Link Popularity auf die bevorzugte Version übertragen werden.)

Allerdings glaube ich den Mitteilungen aus dem Hause Google erst dann, wenn ich die aufgestellten Behauptungen selbst experimentell überprüfen konnte. Also habe ich vor etlichen Wochen einen kleinen Versuch aufgebaut, um die genaue Wirkungsweise des Canonical Tag zu überprüfen. Dazu erstellte ich eine Kopie namens copy.html einer bereits existierenden Seite (original.html). Diese copy.html habe ich leicht verändert: Ich habe den Titel etwas modifiziert und einen kurzen Satz mit einem recht außergewöhnlichen Wort („WORT_A“) eingefügt; ebenso den entsprechenden Canonical Meta-Tag: <link rel=“canonical“ href=“original.html“>. Das Original wie die Kopie liegen auf der selben Domain. Um Googles Behauptung, der Canonical Tag würde „Link Juice“ weiterreichen, zu überprüfen, habe ich von einer fremden Domain einen Link auf die copy.html gesetzt. Der Linktext besteht dabei aus einem weiteren recht seltenen Wort: „WORT_B“. Das Szenario ist in dieser Grafik zusammengefasst:

canonical-experiment

Nachdem ich Google nun einige Wochen Zeit gelassen habe, meine Konstruktion entsprechend zu würdigen, bestätigt sich im Wesentlich das, was Google behauptet:

  • Die Seite copy.html wird von Google nicht aufgenommen.
  • WORT_A wird auf der Domain, auf der das Experiment durchgeführt wurde, nicht gefunden.
  • WORT_B hingegen wird gefunden – und zwar auf der Seite original.html.

Ganz offensichtlich „biegt“ der Canonical Meta-Tag den Link, der auf copy.html zeigt, auf die Originalseite um und weist den Linktext der original.html zu. Interessant ist auch noch ein kleiner Nebeneffekt: Die Website, auf der die Tests durchgeführt wurden, ist noch unter einer anderen Domain zu erreichen. Von dieser Spiegeldomain war bislang in Google nichts zu finden. Seit dem Experiment ist die copy.html unter der Spiegeldomain zu finden – auch bei einer Suche nach dem nur auf copy.html enthaltenen WORT_A. Anscheinend schließt Google die copy.html nur auf der Domain von einer Indexierung aus, auf der auch das Original liegt.

Was machen denn eigentlich die anderen Suchmaschinen? Yahoo nimmt „brav“ die copy.html auf und findet diese Seite sowohl unter WORT_A als auch unter WORT_B. Microsofts Live Search hingegen macht’s genau anders herum: Hier ist die copy.html überhaupt nicht zu finden, und die Versuchswebsite taucht weder für WORT_A noch für WORT_B auf. Es scheint so, als würde Yahoo den Canonical Metatag gar nicht beachten, während Microsoft das „canonical“ als „noindex“ interpretiert.

Natürlich ist mit dem Experiment noch nicht geklärt, ob durch das Umbiegen womöglich etwas Linkpower verloren geht. Ich würde das eigentlich erwarten. Trotzdem stimmt mich das Ergebnis bei Google zuversichtlich, dass manche Optimierungen großer Redaktionssysteme, die häufig extreme Duplicate-Content-Generatoren sind, mithilfe des Canonical Meta-Tag einfacher durchgeführt werden können.

Newsletter-Anmeldung

*Pflichtfeld
– Anzeige –

14 thoughts on “Experimente mit dem Canonical Meta-Tag

  • 19. Mai 2009 at 08:27
    Permalink

    Hallo Stefan,
    eine gut zusammengefasste Überprüfung. Sehr lustig auch was du alles so im Alltag erlebst: „Es soll Beratungsprojekte geben, in denen dem SEO bereits das Wort “Duplicate Content” verboten wurde …“
    Ich hoffe demnächst mehr aus dem Kanal zu lesen *zwinker*
    Grüße

    Gerald

  • Pingback: Experiment zum Canonical-Tag von Google | abtwittern

  • Pingback: rel=”canonical” | Oblogatorisch

  • Pingback: affiliate-tik.de

  • 19. Mai 2009 at 13:48
    Permalink

    Sehr gute Beschreibung der Tag-Wirkungsweise bei Primus Google.
    Mehr solcher Praxistests bitte 🙂

  • Pingback: Ermis-Net Social Bookmarking Service

  • 20. Mai 2009 at 09:48
    Permalink

    Besten Dank für den Test. Ich hatte bisher kaum Auswirkungen vom Canonical-Tag gespürt. Was die Domains angeht: Hast Du Erfahrungen wie das mit http und https aussieht? Ich habe eine Seite die über beides mit gleichen Inhalten erreichbar ist. Der Canonical-Tag lenkt nun alles auf http um. Bringt das was, oder sieht Google das als andere Domain an?

  • Pingback: Fresh From Twitter today

  • Pingback: Notizen bei Twitter von heute

  • 21. Mai 2009 at 13:22
    Permalink

    So richtig ist bei mir jetzt noch nicht angekommen. Ich versteh auch nicht Richtig was Google damit bezwecken möchte.

  • 21. Mai 2009 at 15:59
    Permalink

    @Horst: Mit http und https in Sachen Duplicate Content habe ich noch keine eigenen Erfahrungen machen können. Kann dazu nicht sinnvoll weiterhelfen.
    @Marc: Das ist einfach ein Hinweis an Google, welche von mehreren quasi identischen Seiten Google zum Indexieren nutzen soll.

  • Pingback: Canonical tag Experiment

  • 27. Mai 2009 at 11:17
    Permalink

    Danke für den sehr guten Test! All-in-one-SEO für WordPress hat in einer der letzten Versionen ebenfalls den Canonical-Tag eingeführt. Das DC-Problem auf WordPress-Blogs (Tag- und Kategorienseiten!) ist damit zwar noch nicht gelöst, aber immerhin sind die Artikel damit sauber.

    Die Tag-Seiten habe ich auch mit All-in-one-SEO auf noindex, follow gesetzt. Seitdem nimmt die Anzahl der Tag-Seiten im Index stetig ab und die Bouncerate aus der Organic Search ist auch rückläufig. 🙂

  • Pingback: Suchmaschinen & SEO – Mai 2009 - Inhouse SEO

Comments are closed.