Duplicate content

Duplicate content is in het Nederlands gezegd: ‘dubbele inhoud’. Dit betekent dat er op twee verschillende webpagina’s bijna, ongeveer of precies dezelfde content staat. Uit schattingen blijkt dat ongeveer 30% van alles op het web duplicate content is. In eerste instantie klinkt dit als enorm veel, maar eigenlijk is dit best logisch. 

Stel je voor: twee onafhankelijke Online Marketeers proberen in hun eigen woorden uit te leggen wat ‘Duplicate Content’ betekent. De uitleg van de ene marketeer zal grotendeels overeenkomen met de uitleg van de andere marketeer, echter zullen ze waarschijnlijk niet 100% overeenkomen. Dit is ook wat er in veel gevallen op het web gebeurd. Daarnaast zijn er natuurlijk uitzonderingen, want er zijn verschillende soorten duplicate content, de een schadelijker dan de ander, deze volgen later in dit artikel.

In dit artikel leggen we het volgende uit:

  • hoe schadelijk duplicate content voor je website is;
  • wat interne en externe duplicate content is;
  • hoe je duplicate content kan checken;
  • hoe je dubbele inhoud van je website vermijdt;

Hoe schadelijk is duplicate content binnen SEO?

Duplicate content kan schadelijk zijn voor je rankings, dit kan komen door verschillende zaken:

  • De zoekmachine weet niet welke pagina het moet indexeren of juist moet uitsluiten. 

Zoekmachines zoals Google willen een goede bezoekerservaring bieden, daarom zullen zoekmachines zelden versies met dezelfde inhoud tonen.

De zoekmachine weet niet welke pagina de ‘juiste’ is waardoor de zoekmachine zelf zal moeten kiezen welke pagina ze indexeren. Zoekmachines kiezen in de meeste gevallen de domeinen met de sterkste autoriteit.

Google geeft zelf aan dat ze echter niet optreden met behulp van zogeheten ‘penalty’s’. Dit zegt Google zelf: dubbele inhoud op een site is geen reden om stappen tegen die site te ondernemen, tenzij het erop lijkt dat de dubbele inhoud is bedoeld om te misleiden en om de resultaten van zoekmachines te manipuleren.

 

Interne duplicate content

Interne duplicate content wordt meestal onbedoeld veroorzaakt binnen je eigen website. Dit heeft dus niks te maken met kopiëren van content, maar ligt meestal aan verschillende (technische) zaken binnen de URL-structuur van je website. Hieronder staan de meest voorkomende oorzaken:

Bijna identieke URL’s met hetzelfde doel

In veel webshops kun je via verschillende manieren op dezelfde bestemmingspagina komen door gebruik te maken van het bezoekerspaneel. Zo krijg je:

  • voorbeeldwebshop.nl/telefoons/apple/iphone-12
  • voorbeeldwebshop.nl/merken/apple/iphone-12

Bijna identieke URL’s met een ander doel

Veel webshops hebben producten die verkrijgbaar zijn in verschillende kleuren, hierdoor komen de URL’s voor een groot deel overeen.

  • voorbeeldshop.nl/truien//blauw
  • voorbeeldshop.nl/truien/rood

HTTP & HTTPS / www. vs geen-www.

Er zijn veel websites die verschillende versies van hun domein live hebben staan met dezelfde content, bijvoorbeeld ‘www.seeders.nl’ en ‘seeders.nl’. 

Google kiest in bovenstaande gevallen welke pagina ze indexeren, echter is het voor de robots van Google lastig om te zien welke pagina het ‘origineel’ is waardoor dit vaak leidt tot slechte of dalende rankings. Ook zijn hier andere oplossingen voor, hier komen we later op terug.

Externe duplicate content

Externe duplicate content ontstaat wanneer verschillende websites elkaar kopiëren of wanneer de content erg op elkaar lijkt. Een voorbeeld hiervan is bedrijf X dat aan dropshipping doet. Bedrijf X haalt haar spullen bij een Chinese leverancier. Echter heeft deze Chinese leverancier veel meer klanten waaraan hij spullen levert. De Chinese leverancier stuurt bij alle producten een productomschrijving mee naar zijn klanten. Veel van deze klanten zijn ook dropshippers, en plaatsen de meegestuurde productomschrijving op hun website bij het desbetreffende product. Bedrijf X plaatst deze omschrijving ook op hun website. Voila, nu is er duplicate content ontstaan. Hierdoor zal Google moeite hebben met het indexeren en verdelen van de rankings onder deze bedrijven. Dit is maar een voorbeeld, maar je kunt je vast voorstellen dat er op nog veel meer manieren externe duplicate content kan ontstaan.

Duplicate content checken

Om erachter te komen hoeveel duplicate content jouw website heeft, kan je meerdere tools gebruiken. 

Siteliner

Om je website intern te checken op duplicate content kun je de tool van Siteliner gebruiken. Bij deze gratis tool voer je simpelweg de URL van je website of pagina in. Vervolgens krijg je een rapport met data waarin de hoeveelheid duplicate content te vinden is. 

uitdraai duplicate content siteliner

Incognito-venster van Google

Om te checken of je website lijdt aan duplicate content is het beste om een  kopie maken van de eerste 10 tot 15 woorden van de tekst op een van jouw pagina’s. Vervolgens plak je deze incognito in Google’s zoekbalk. Als jouw pagina bovenaan in de ranking staat denkt Google dat jouw content de originele bron is. Is dit niet het geval, dan is er sprake van een duplicate content probleem. Herhaal dit proces met verschillende pagina’s van je website.

Stap 1: kopieer het eerste deel van je content

check duplicate content selecteren tekst

Stap 2: plak de tekst in een incognito venster en check of de pagina bovenaan staat

Copyscape

Ook kun je externe duplicate content en plagiaat checken met een gratis tool genaamd Copyscape. Met Copyscape kan je automatisch meldingen laten binnenkomen wanneer de tool vermoedt dat een externe website content van je website heeft gekopieerd.

duplicate content check copyscape

Tips om duplicate content te vermijden

We weten nu dat duplicate content schadelijk kan zijn voor je rankings. Om dalende rankings te voorkomen zijn er een aantal dingen die je kunt ondernemen.

Structuur aanpassen

Het allerbeste om duplicate content te vermijden is het zorgen voor een sublieme site-structuur. Dit zorgt er in de meeste gevallen vanzelf voor dat duplicate content geminimaliseerd wordt. Wanneer je echter al een volledige pagina structuur hebt staan is dit niet in een handomdraai geregeld. Indien andere oplossingen slecht toepasbaar zijn is een herstructurering van je website wel iets wat je goed in overweging moet nemen.

Uniek zijn

Om externe duplicate content te minimaliseren is het noodzakelijk dat je unieke content publiceert. Google beloond unieke content, daarnaast is het belangrijk dat content regelmatig geupdate wordt. Schrijf vooral op je eigen manier en onderbouw dit met bronnen.

Sterk domein opbouwen

Google ziet domeinen met een sterke autoriteit eerder als originele bron van duplicate content dan domeinen met een zwakkere autoriteit. Dit is niet in alle gevallen zo, Google kijkt bijvoorbeeld ook naar de publicatiedatum van content. Echter zorgt een sterk domein wel voor een sterke positie in het wereldwijde web, dat bestaat uit een groot netwerk met dubbele content.

301-redirect

Met behulp van een 301-redirect geef je alle linkwaarde die duplicate pagina’s genereren door aan één pagina. De overige pagina’s gebruik je dus niet meer. Echter werkt deze manier niet bij filter pagina’s door de unieke parameters die samen een URL vormen.

Canonical tag

Een canonical tag is een label waarmee je aan zoekmachines aangeeft welke pagina de originele bron van je webpagina is. Om dit visueel uit te werken gebruiken we voorbeeld 1 onder het kopje ‘Interne duplicate content’. Als je wil aangeven dat voorbeeldwebshop.nl/telefoons/apple/iphone-12 de originele pagina is dan voeg je aan pagina voorbeeldwebshop.nl/merken/apple/iphone-12 een canonical tag toe met de link van de originele pagina. Het is belangrijk dat er canonical tags staan ingesteld op pagina’s waar duplicate content kan voorkomen. Echter is een canonical tag geen 100% zekerheid tot slagen, de zoekmachine kiest zelf of ze hier wat mee doen of niet.

Auteur

Tiemen de Jonge