Duplikacja treści – co to jest i jak wpływa na SEO?

Negatywny wpływ na pozycję witryny w wyszukiwarce mają często niepozorne błędy. Jednym z nich jest duplikacja treści. Z artykułu dowiesz się, jak sprawdzić, czy ktoś kopiuje Twoje artykuły, poznasz konsekwencje duplicate content oraz wskazówki, jak samemu unikać tego zjawiska.

Czego dowiesz się z artykułu?

Co to jest duplikacja treści?
Duplicate content – przyczyny
Powielanie treści a SEO
Jak poradzić sobie z duplikacją treści?
Jak wykryć duplikację treści?
Duplikacja treści – podsumowanie

Co to jest duplikacja treści?

Duplicate content to powielanie treści w internecie. To sytuacja, gdy identyczny lub bardzo podobny tekst znajduje się pod większą ilością adresów URL. Najczęściej takie powielanie treści nie jest zamierzone, jednak powoduje zamieszanie wśród botów wyszukiwarek i dla dobra pozycjonowania strony lepiej go unikać. Wyróżnia się zewnętrzną i wewnętrzną duplikację treści.

Zewnętrzna duplikacja treści to kopiowanie tekstów z innych stron internetowych. Możemy sami do tego doprowadzić, na przykład udostępniając na naszych kanałach social media te same informacje co na blogu. Niestety, często jesteśmy nieświadomi tego, że ktoś (na przykład konkurencja) przekopiował nasze teksty na swoje media. Zdarza się również, że duplikacja treści następuje automatycznie – tworzą ją programy, które pobierają z danej strony teksty, a także opisy produktów, zdjęć czy informacje na temat konkretnej osoby lub firmy. Nieświadomie możesz to nawet robić Ty sam – zamieszczając ten sam artykuł na swoim blogu i w serwisie partnera czy kopiując opisy ze strony producenta.

Wewnętrzna duplikacja treści jest mniej szkodliwa dla pozycjonowania i polega na powielaniu tej samej treści w obrębie własnej strony www. W obu przypadkach duplicate content warto eliminować. Stąd ważna jest przede wszystkim świadomość, że treści są powielane, czy to przez nas samych (na przykład publikując ten sam opis na kilku podstronach), automatycznie za pomocą różnych narzędzi, czy świadomie przez osoby trzecie. Najczęściej mamy z nim do czynienia z powtarzalnych na stronach internetowych powodów.

Duplicate content – przyczyny

Problem duplikacji treści jest dość powszechny. Powodują go nie tylko błędy ludzkie czy nierespektowanie praw autorskich, ale również błędy techniczne. Aby eliminować duplicate content, należy znać jego przyczyny. Kilka z nich znajdziesz poniżej.

Identyczne wersje językowe
Niestety niewiele osób zdaje sobie sprawę z tego, że tworzenie różnych wersji językowych strony może powodować jej duplikację. Dlatego tak ważne jest prawidłowe zaimplementowanie atrybutu „href lang”. Wykorzystanie do tego celu parametrów w skrypcie powoduje, że wersja polska i na przykład niemiecka występują pod tym samym adresem. Poza tym zdarza się, że nie wszystkie podstrony są tłumaczone w serwisie i wówczas w dwóch miejscach pojawia się ta sama treść.
Kopiowanie opisów produktów
Częstym powodem duplicate content są opisy produktów w sklepach internetowych, które pochodzą ze strony producenta. Kopiowanie tekstów i wklejanie ich do siebie na stronę nie jest dobrym rozwiązaniem. Należy przygotować oddzielny opis na każdą podstronę produktu. Nie należy umieszczać go też w social mediach czy na innych podstronach produktowych, ponieważ Google traktuje takie zabiegi jak duplikację.

Przeczytaj także:
Zasady pozycjonowania w Google – 10 najważniejszych technik SEO
Powielone znaczniki title i meta
W sytuacji gdy oddzielne podstrony nie otrzymają osobnych znaczników title i różnorodnych tagów meta description, następuje duplikacja znaczników, która negatywnie wpływa na pozycjonowanie www.
Publikowanie tych samych treści
Powielanie treści, która negatywnie wpływa na kondycję witryny, często jest spowodowane niewiedzą nas samych. Nie można publikować na blogu, w sklepie, na Facebooku i Instagramie tych samych tekstów, nawet fragmentarycznie. Są one postrzegane jako duplikacja treści.
Kopiowanie treści z innych witryn
Warto pamiętać, że dla Google’a treść na Wikipedii będzie atrakcyjniejsza niż ta sama treść na naszej stronie. Content powinien być trafny, wartościowy, ale i unikatowy.
Oddzielne wersje tych samych stron
Jeżeli strona istnieje pod adresem http i https oraz www i bez www, a treść występuje w obu wersjach taka sama, jest to duplikacja treści. Dla Google'a fizycznie istnieją dwie oddzielne strony, ale z taką samą treścią, które rywalizują ze sobą o lepszą pozycję. Warto pomyśleć o wdrożeniu globalnego przekierowania z http na https.
Duplikacja Twoich treści przez inne strony
Czasami kopiowane mogą być artykuły na specjalistyczne tematy czy wyniki badań, ale również, jeśli sprzedajemy produkty np. w branży b2b, właściciele sklepów mogą kopiować opisy produktów od nas. Jest to nagminna sytuacja. Warto wówczas zastrzec teksty i jako producent bądź dystrybutor uczulać swoich klientów na zjawisko duplicate content.
Paginacja komentarzy
Nawet w tak popularnym Wordpressie istnieje problem z paginacją komentarzy. Stronicowanie komentarzy prowadzi do zduplikowania treści w adresie URL artykułu, który występuje wraz z ponumerowaniem stron komentarzy.
Adresy UTM
Śledzenie adresów URL, a więc tworzenie na potrzeby monitorowania działań marketingowych oddzielnych adresów URL może przyczyniać się do powielania treści. Sytuacja odnosi się nie tylko do adresów UTM, ale do wszystkich innych oznaczeń adresu URL, które służą do jego różnicowania, jednak nie wpływają na jego istotną część. Mowa tutaj na przykład o sortowaniu, które powoduje, że ta sama treść pojawia się pod kilkoma bardzo podobnymi, ale finalnie różnymi adresami URL. Rozwiązaniem w tym przypadku jest kanonizowanie adresów URL.

Przeczytaj także:
Tagi UTM – jak poprawnie tagować linki?
Duplikacja treści na stronach kategorii
Kolejna duplikacja treści może zachodzić, gdy opis kategorii w sklepie internetowym pojawia się wielokrotnie w przypadku filtrowania, sortowania czy paginacji. Aby uniknąć tego błędu, wystarczy zastosować tag „no index” lub atrybut „rel=canonical”. Witrynie zaszkodzą również identyczne opisy kategorii produktów, na przykład gdy dany produkt jest przypisany do kilku kategorii, a niepoprawna struktura strony powoduje, że finalnie ta sama treść występuje na więcej niż jednym adresie URL.
Zaindeksowana strona deweloperska
Jeśli Google zaindeksowało wersję „roboczą” strony, należy przeprowadzić przekierowanie 301 z wersji deweloperskiej na wersję finalną witryny. Jeśli wersja deweloperska jest nadal używana można zablokować ją w robots.txt. Warto przeanalizować powyższe przyczyny i sprawdzić, czy występują na Twojej stronie. To pozwoli na eliminację praktyk, które powodują duplikację treści i negatywnie wpływają na kondycję witryny.

Powielanie treści a SEO

Pozycjonowanie strony, gdy w obrębie witryny dochodzi do duplikacji treści, jest utrudnione. Google docenia unikalne, jakościowe i wartościowe teksty. Witryny z duplicate contentem mają mniejszy ruch organiczny, gdyż są negatywnie oceniane przez boty Google’a. Tak naprawdę roboty indeksujące nie mają świadomości, która strona jest oryginalna, więc najczęściej uznają jedną z nich za oryginał, a pozostałe są pomijane. Czasami zdarzają się sytuacje, kiedy na witryny ze zbyt dużą ilością duplikacji treści nakładane są kary lub są całkowicie usuwane z indeksu. Taka sytuacja następuje tylko wtedy, jeśli kopiowanie jest wyraźnie celowe. Niejednokrotnie Google odmawia indeksowania danej podstrony, czyli mając rozbudowaną witrynę z podstronami nieindeksowanymi, nie jesteśmy w stanie utrzymać jej dobrej kondycji. Kary ze strony Google i całkowite usunięcie z indeksu nie są popularnymi praktykami Google. Ale sam fakt, że posiadasz stronę, która ze względu na powielanie treści nie jest odbierana przez boty jako atrakcyjna dla użytkownika powoduje, że tracisz szansę na wyższe pozycje.

W oficjalnych wskazówkach dla webmasterów od Google możemy znaleźć następujące stwierdzenie:

"W rzadkich sytuacjach nasz algorytm może wybrać URL witryny zewnętrznej, w której bez Twojego pozwolenia umieszczono należącą do Ciebie treść. Jeśli stwierdzisz, że Twoje materiały są powielane w innej witrynie z naruszeniem praw autorskich, skontaktuj się z jej właścicielem i zażądaj ich usunięcia. Możesz też poprosić Google o usunięcie strony, która narusza Twoje prawa, z naszych wyników wyszukiwania".

Jak poradzić sobie z duplikacją treści?

Są trzy sposoby na radzenie sobie z powielaniem treści. Ważne jest, aby określić, który adres URL ma być brany pod uwagę przy indeksowaniu.

przekierowanie 301 – skonfigurowanie przekierowania 301 ze strony z duplikacją do tej oryginalnej najczęściej rozwiązuje problem. Takie strony przestają ze sobą konkurować w rankingu, wręcz przeciwnie łącząc siły, prowadzą do większej popularności wskazanej przez nas strony www.
atrybut rel=”canonical” – informuje on wyszukiwarkę, że dana strona powinna być traktowana jako kopia strony oryginalnej. Więc linki i siła rankingowa powinna być przypisana do oryginalnej strony, której adres URL podajemy.
meta robots „noindex” - to dobre rozwiązanie szczególnie w przypadku problemów z duplicate content wynikających z paginacji. Meta tag umożliwia indeksowanie linków na stronie, ale uniemożliwia uwzględnianie tych linków w indeksach. Może być dodany do nagłówka HTML każdej strony, którą należy wykluczyć z indeksowania.

Jak wykryć duplikację treści?

Najważniejsze to świadomość duplicate content i zlokalizowanie powielanych treści na stronie. Jest kilka narzędzi, które umożliwiają to:

Siteliner - to darmowe narzędzie do całościowej analizy strony za pierwszym razem, kolejne analizy wiążą się z niewielkimi opłatami. Narzędzie informuje, jaki procent strony jest duplikacją treści, podrzuca adresy URL, z którymi nasza strona ma powielone teksty, dzięki czemu jesteśmy w stanie namierzyć nielegalne praktyki kogoś z zewnątrz.
Screaming Frog - aplikacja, która potrafi wskazać powielone podstrony, meta tagi czy nagłówki. Posiada dwie wersje płatną i bezpłatną.
Copyscape - dostępny na zasadach podobnych do SIteliner i Screaming Frog, występuje w wersji darmowej i płatnej. Analizuje zewnętrzne duplikacje treści, zaznacza skopiowany tekst, podaje adresy URL do stron z podobną zawartością.

Google Search Console - pomaga w optymalizacji strony. Wystarczy wejść w zakładkę Stan i sprawdzić wyświetlające się ewentualnie błędy techniczne, na przyklad kiedy ta sama treść występuje pod różnymi adresami. Warto dodać, że Google Search Console to bezpłatne narzędzie.

Google Search Console - duplicate content

Ahrefs - pozwala na wykrycie duplikacji wewnętrznej na stronie.
wyszukiwarka Google - to mozolna, ale możliwa do wykonania praca, szczególnie gdy mamy do przeanalizowania krótki tekst, a nie całą stronę. Warto jego fragment wkleić do Google i zobaczyć, co się wyświetli.

Duplikacja treści – podsumowanie

Monitorowanie strony pod względem duplikacji treści oraz eliminacja praktyk, które do niej prowadzą, są bardzo ważne dla SEO witryny, ponieważ przekłada się to na zyski finansowe firmy. Wyświetlanie się strony w organicznych wynikach wyszukiwania przynosi długofalowe efekty, tj. niski koszt pozyskania leada, większą rozpoznawalność marki, lepszą widoczność strony w wyszukiwarce i wyższą sprzedaż. Duplikacja treści to jeden z czynników, który negatywnie wpływa na kondycję całej witryny. Sama świadomość przyczyn, które ją powodują, pozwala na przynajmniej częściową eliminację problemu, jakim jest powielanie treści. Kontrolowanie witryny pod tym kątem pozwala również monitorować działania konkurencji, co zawsze jest wskazane i wspiera rozwój biznesu.

Chcesz uniknąć duplikacji treści?

Zajmiemy się tym od A do Z

Duplikacja treści – co to jest i jak wpływa na SEO?

Co to jest duplikacja treści?

Duplicate content – przyczyny

Identyczne wersje językowe

Kopiowanie opisów produktów

Powielone znaczniki title i meta

Publikowanie tych samych treści

Kopiowanie treści z innych witryn

Oddzielne wersje tych samych stron

Duplikacja Twoich treści przez inne strony

Paginacja komentarzy

Adresy UTM

Duplikacja treści na stronach kategorii

Zaindeksowana strona deweloperska

Powielanie treści a SEO

Jak poradzić sobie z duplikacją treści?

Jak wykryć duplikację treści?

Duplikacja treści – podsumowanie