Duplicate Content
Duplicate Content (engl. to duplicate = doppeln) bezeichnet in Abgrenzung zu Unique Content Inhalte, die doppelt und unter verschiedenen URLs im digitalen Raum existieren. Gerade im SEO (Suchmaschinenoptimierung) handelt es sich dabei um ein häufig auftretendes Problem: Im schlechtesten Fall führt Duplicate Content zu einem schlechteren Ranking einer Website und all ihrer Inhalte bei Google, Bing und Co. – eine sogenannte Abstrafung bzw. Penalty.
Ursache & Wirkung: Wie sich Duplicate Content im SEO auswirkt
Als Webseitenbetreiber:in ist SEO ein unerlässliches Instrument, mit dem du dich auseinandersetzen musst, wenn du eine digitale Sichtbarkeit aufbauen möchtest. Mit hoher Wahrscheinlichkeit gehört Duplicate Content dann auch zu den Dingen, um die du dich kümmern musst. Normalerweise bevorzugen und belohnen Suchmaschinen wie zum Beispiel Google, Bing, Ecosia und Co. einzigartige Inhalte, die den Nutzer:innen einen Mehrwert liefern. Sie möchten in den Suchergebnissen den am besten passenden Treffer zu jeder Suchanfrage liefern.
Um genau das zu erreichen, führen Google und Co. regelmäßige Crawls durch, bei denen Millionen von Websites und Domains durchsucht werden. Dabei werden die Websites unter verschiedenen Gesichtspunkten analysiert und bewertet, um anschließend entsprechend indexiert und letztendlich gerankt zu werden. Kommt es nun vor, dass verschiedene Websites Duplicate Content, also exakt dieselben Inhalte, bieten, so können die Suchmaschinen nur schwer ermitteln, welche davon die höchste Relevanz für Suchende hat. Die Folge: Die Relevanz wird aufgeteilt, sodass alle Seiten mit dem identischen Inhalt Positionen im Ranking einbüßen und somit niedriger in den Suchergebnissen positioniert sind. Im härtesten Fall wird eine Seite ggf. gar nicht erst indexiert, wenn eine Suchmaschine merkt, dass bereits eine andere Seite genau diesen Content aufweist.
Interner vs. externer Duplicate Content und was Google damit zu tun hat
Nicht immer ist Duplicate Content negativ, für manche Websites macht er strukturell sogar Sinn. Um das besser zu verstehen, hilft die Unterscheidung von internem und externem Duplicate Content.
Interner Duplicate Content
Zu internem Duplicate Content kommt es häufig durch mehrere Varianten einer URL, die zur selben Domain gehören. Zu den beliebtesten Quellen für dieses Vorkommnis zählen:
- interne Suchergebnisseiten
- Übersichtsseiten für Tags, Filter und Kategorien
- Produktseiten, die verschiedenen Kategorien zugeordnet wurden
- Artikel, wenn sie verschiedenen Kategorien zugeordnet wurden
- Paginationen (Seitennummerierungen)
- unterschiedliche Versionen der Webseite (z. B. Druck- oder Archivversion)
- externe mobile Webseite mit exakt demselben Inhalt
Doppelte Inhalte dieser Art entstehen in der Regel nicht absichtlich. Kein:e Webmaster:in der Welt kreiert diese Form von Duplicate Content, um den Algorithmus zu eigenen Gunsten zu manipulieren. Selbst für Google sind interne Duplikate meist kein Problem, allerdings bedarf es dabei etwas Hilfe. Als Webseitenbetreiber:in musst du Suchmaschinen bei der Priorisierung der URLs unterstützen. Wie das funktioniert, zeigen wir weiter unten. Prinzipiell gilt dennoch: Achte auch intern darauf, so wenig Duplicate Content wie möglich zu erzeugen, da es auch vorkommen kann, dass Suchmaschinen sie nicht richtig zuordnen können!
Externer Duplicate Content
Unter externem Duplicate Content fassen wir Inhalte zusammen, die auf verschiedenen Domains ähnlich oder sogar identisch auftauchen. Mögliche Manifestationen sind zum Beispiel:
- Diebstahl bzw. Kopie von Content
- wortgleiche Verbreitungen von vorgefertigten Pressemitteilungen
- verschiedene Webseiten starten gemeinsame Content Kooperationen und teilen gleiche Inhalte
- gerade kurz nach einem Domain Umzug
- Content Verbreitung über RSS Feeds
Du siehst: Auch wenn du nicht Verursacher:in des externen Duplicate Contents bist, so kannst du negativ davon beeinflusst werden. Solche Fälle strafen Suchmaschinen nämlich meist noch härter und deutlich wahrscheinlicher ab als interne Doppelungen.
Neben der offensichtlichen Gefahr eines Abrutschens in den Suchergebnissen bei Google und Co. kommt noch eine weitere hinzu: Wer ohne Erlaubnis und mutwillig Inhalte anderer Seiten kopiert und für sich nutzt, begeht eine Urheberrechtsverletzung. Dabei ist es unerheblich, ob es sich um Texte, Bilder oder den Quellcode von Webseiten handelt. Allerdings kommt es nur soweit, wenn die Urheber Webseite nachweisen kann, dass die Content Diebe ihre Inhalte dupliziert hat.
Wie unterscheiden Google und Co. Duplicate Content vom Original?
Die Algorithmen von Google entwickeln sich mit jedem Google Core Update weiter und sind fähig, Originale gut von Duplikaten zu unterscheiden. Wenn du und deine Webseite also Urheber:in eines Inhalts sind, wird Google euch mit hoher Wahrscheinlichkeit als solche erkennen. Bis heute geben die großen Suchmaschinen allerdings nicht preis, wie sie dies bei ihren Crawls feststellen.
Es gibt allerdings ein paar Indizien, anhand derer Original und Duplicate Content differenziert werden können. Das Beste: Du musst nicht einmal zu den SEO Expert:innen zählen, um diese Unterscheidung zu machen! Hier ein paar Beispiele für Kriterien:
- Das Veröffentlichungsdatum des Originals liegt deutlich vor dem des Duplikats. Falls es nicht direkt auf der Webseite ersichtlich ist, kannst du es über den Quellcode überprüfen.
- Originale weisen meist deutlich bessere Social Signals auf.
- Ein schneller Blick in Tools wie Sistrix oder Semrush verrät: Das Original hat eine höhere Link- und Domain Popularität als die Seite mit dem Duplicate Content
Tipps und Strategien, mit denen du Duplicate Content vermeiden kannst
Gerade zum Launch einer Website oder einer neuen Domain in Kombination mit wenig Erfahrung in puncto CMS (Content Management System) und SEO ist ungewollter Duplicate Content keine Seltenheit. Das ist halb so schlimm, solange du schnell genug Maßnahmen initiierst, mit denen Duplikate zukünftig effektiv vermieden werden. Wir haben sechs einfache Tipps und Strategien für dich vorbereitet, mit denen du sowohl internen als auch externen (vor allem den, den du selbst verursachst) Duplicate Content vermeiden kannst.
1. Canonical Tags bzw. rel=canonical nutzen
Eine Möglichkeit, internen Duplicate Content zu haben, ohne dass er sich negativ auf deine Website auswirkt, sind Canonicals. Mit ihnen fasst du ähnliche/identische Inhalte zusammen und signalisierst Google und Co., welche URLs sie als Original behandeln sollen. Wird eine spezifische Seite als Canonical ausgewiesen, so bekommt sie den Linkjuice sowie die “Rankingpower” der Kopien zugewiesen.
In den meisten CMS kannst du Canonicals mit ein paar simplen Klicks automatisch ausweisen. Jedoch kann es auch sein, dass du ein sogenanntes rel=canonical manuell in den HTML Code der jeweiligen Duplicate Content Seiten einpflegen musst. Das rel=canonical Attribut verweist auf das Original und zeigt dem Crawler der Suchmaschinen an, welcher Inhalt ins Ranking einsteigen und damit in den Suchergebnissen auftauchen soll.
2. 301 Redirects einsetzen
Ist es bereits zu spät und der interne Duplicate Content ist entstanden und sowohl das Original als auch das Duplikat sind bereits gerankt, so ist das noch kein Weltuntergang. Im Gegenteil, warum das vermeintlich Negative nicht sogar ins Positive umleiten? Apropos leiten: 301 Redirects, also eine Art Umleitung von der Kopie zum Original, ist eine effektive Methode, um Duplicate Content noch in sinnvollen Traffic für deine Website umzumünzen.
Nehmen wir zum Beispiel an, du hast mehrere Seiten, die einen ähnlichen Inhalt behandeln und zum gleichen Keyword in den Suchergebnissen auftauchen. Lege in diesem Fall die potenteste Seite fest (idealerweise jene, die am höchsten rankt) und leite die anderen Seiten per 301 Redirect auf sie um. So profitierst du gleich doppelt: Sie konkurrieren nicht mehr im Ranking um dasselbe Keyword und sie geben dem Ziel des Redirects eine höhere Relevanz. Das signalisiert Suchmaschinen, dass es sich lohnt, diese Seite höher in den Suchergebnissen zu platzieren.
3. Textbausteine niemals zweimal nutzen
Du erstellst gerade mehrere neue Landingpages für deine Produkte/Services und denkst, es sei eine gute Idee, essenzielle Textbausteine einfach mehrfach zu verwenden? Leider falsch, denn schon das nehmen Google und Co. als Duplicate Content wahr. Aus SEO Sicht bedeutet das, dass sich diese neuen Landingpages also gegenseitig im Ranking behindern werden.
4. Bei verschiedenen Sprachversionen: rel=”alternate” hreflang=”x” Attribut nutzen
Laut dem SEO Toolanbieter Sistrix werden Inhalte, die in verschiedenen Sprachversionen vorliegen, nicht als Duplicate Content gewertet. Speziell bei großen Online Shops, die mehrsprachige Webseiten haben, dürfte das für Erleichterung sorgen. Was ist aber mit kleineren Seiten mit weitaus weniger Authority und Sichtbarkeit? Um auf der sicheren Seite zu sein, solltest du mit rel=”alternate” hreflang=”x” Attributen arbeiten.
Technisch funktioniert das Attribut ähnlich wie die Canonicals: Mit dem Befehl rel=”alternate” hreflang=”x” im HTML Header der Website definierst du spezifische Seiten als mehrsprachigen Inhalt. Da du hier auch das Original, also sozusagen auch das Canonical festlegst, wissen Suchmaschinen und ihre Crawler, dass es sich um wissentlich entstandene doppelte Inhalte handelt und wie diese bewertet werden sollen.
5. Seiten nicht indexieren lassen mit “noindex” Meta Tags
Eine relativ einfache wie auch wirkungsvolle Methode, Duplicate Content Seiten zu haben, ohne dass sie sich negativ auf das Ranking auswirken, ist ein “noindex” Vermerk in den Meta Tags. Im CMS gibt es dafür meist ein entsprechendes Plugin wie zum Beispiel Yoast SEO oder das All in One SEO Pack, bei denen du den “noindex” Vermerk mit nur einem Klick aktivierst.
Es ist prinzipiell ganz einfach: Wird eine Seite, auf der sich Duplicate Content befindet, nicht indexiert, so gibt es keine negativen Auswirkungen im Ranking. Wenn die Seite nicht nur mit noindex versehen, sondern auch auf nofollow gesetzt werden soll, setzt du durch Klicken bei “Sollen Suchmaschinen Links auf dieser Seite folgen?” auf “nein” und nutzt damit zusätzlich ein sogenanntes “nofollow Attribut.”
6. Zitate immer als solche kennzeichnen – auch im Quellcode
Falls du auf deiner eigenen Webseite einmal Inhalte oder Textbausteine anderer Urheber:innen verwendest, solltest du diese immer als Zitat kennzeichnen. In technischer Hinsicht reicht hier allerdings nicht einfach ein bloßer Verweis. Damit ein Zitat nicht als Duplicate Content gewertet wird, musst du es semantisch richtig im Quellcode ausweisen.
Der Duplicate Content Check: Doppelte Inhalte schnell und einfach erkennen
Ohne SEO Erfahrung und ohne Kenntnisse im Umgang mit Webseiten ist es anfangs schwierig, Duplicate Content schnell zu erkennen. Es gibt allerdings Indizien für doppelte Inhalte, die du mit einfachen Mitteln prüfen kannst. Hier ein paar Beispiele:
- Eine einfache Suchanfrage mit einem kopierten Textabschnitt. Liefert diese Anfrage Ergebnisse mehrerer verschiedener Domains, ist das ein sicheres Zeichen für Duplicate Content
- Rankingeinbrüche einer Seite: Stellst du bspw. über ein SEO Tool fest, dass eine Landingpage einen drastischen Einbruch im Ranking erlebt, ist das ein Indiz für Duplicate Content. In diesem Fall hat deine Seite meist eine passive Rolle, da eine andere Webseite deine Inhalte übernommen hat.
- Nutze die URL Abfrage von Tools wie zum Beispiel Copyscape, Grammarly, Copyleaks und Co. Teilweise hast du hier kostenlos die Möglichkeit, Seiten auf Duplicate Content zu checken und siehst auch, auf welchen Domains der Inhalt noch auftaucht.
Der Umgang mit Duplicate Content im Content Marketing
Duplicate Content ist ein übliches Problem in der Suchmaschinenoptimierung, die wiederum ein wichtiger Teil des Content Marketings ist. Dort ist die Maxime, einzigartige Inhalte zu erschaffen, die User:innen entlang der Customer Journey bis zur Conversion und darüber hinaus begleiten. Duplicate Content ist dort nicht förderlich, zumal es genau das Gegenteil von dem bewirkt, was Content Marketing erreichen will.
Um die im Rahmen einer Content Marketing Kampagne erstellten Inhalte an die Spitze der Suchergebnisse zu führen, braucht es ein hohes Maß an Relevanz. Duplicate Content liefert diese eben nicht, weshalb während jeder Kampagne vor allem Texte für Websites so erstellt werden, dass sie Unique Content Maßstäbe erfüllen und jedem Suchmaschinen Crawl bedenkenlos meistern.