Psst... Avem o ofertă specială de Black Friday pentru tine. Vrei să aflii detaliile?
Primește oferta

Duplicarea continutului – Gasiti si rezolvati aceasta problema

SEO
Marcin CichockiMarcin Cichocki
Csaba PiroscaCsaba Pirosca
Publicat: 26.08.2021
Actualizat:
28.10.2024
14 minute

Continutul duplicat reprezinta o problema semnificativa, care poate reduce vizibilitatea subpaginilor si, astfel, poate diminua considerabil traficul organic catre un site. Aflati cum sa identificati continutul duplicat si sa il rezolvati eficient.

Concluziile principale
  • Continutul duplicat afecteaza negativ SEO, provocand confuzie in algoritmii Google, ceea ce poate duce la scaderea pozitiei unui site in cautarile organice.
  • Cauzele comune ale duplicarii continutului includ erori de paginare, descrieri identice de produse si categorii, precum si implementarea incorecta a certificatului SSL.
  • Identificarea continutului duplicat se poate realiza prin metode precum analiza manuala, crawlere web, Google Search Console si cautarea fragmentelor de continut in motorul de cautare.
  • Rezolvarea problemelor de continut duplicat include utilizarea redirectionarilor 301, a tag-ului rel=”noindex” si a metatag-ului rel=”canonical” pentru a indica versiunea corecta a continutului.
  • Utilizarea Visibility Analysis Senuto poate fi de ajutor in monitorizarea eficienta a vizibilitatii site-ului si in identificarea potentialelor probleme de continut duplicat.

Ce este continutul duplicat?

Continuntul duplicat este un fenomen care implica existenta aceluiasi continut (duplicat) pe subpagini din cadrul unui singur site – duplicare interna; sau pe diverse site-uri externe – duplicare externa. Astfel, atunci cand acelasi continut apare sub diferite URL-uri, ne confruntam cu fenomenul cunoscut sub numele de continut duplicat.

Duplicarea poate aparea ca urmare a unei erori, a furtului de continut sau prin crearea de erori in etapa de optimizare tehnica SEO a unui site sau magazin online.

Problema duplicarii externe a continutului in sectorul comertului electronic se rezuma, de obicei, la copierea nechibzuita a descrierilor de produse sau a categoriilor de pe site-urile producatorilor.

Duplicarea interna se intalneste, de obicei, ca urmare a publicarii unor descrieri identice care se refera la produse care difera doar prin detalii – cum ar fi marimea sau culoarea.

Încearcă Senuto Suite gratuit timp de 14 zile

Încearcă gratuit 14 zile

Care este diferenta dintre duplicarea continutului si canibalizarea?

Diferența dintre duplicarea continutului si canibalizarea cuvintelor cheie estedestul de importanta.

Duplicarea continutului se refera la orice continut identic care apare la mai multe URL-uri. Cu alte cuvinte, duplicarea continutului are loc atunci cand aceeasi bucată mai mare de text este prezenta pe doua, trei sau mai multe pagini in cadrul aceluiasi site sau intre site-uri diferite.

Canibalizarea cuvintelor cheie apare atunci cand pe un site sunt publicate diferite subpagini cu continut diferit, care sunt optimizate pentru aceleasi fraze de cuvinte cheie.

Canibalizarea cuvintelor cheie este un fenomen care poate afecta doar un singur site, in timp ce duplicarea continutului poate aparea atat in cadrul unui singur site, cat si intre site-uri externe.

Mai mult, duplicarea continutului poate duce simultan la canibalizarea cuvintelor cheie (aceleasi fraze-cheie in acelasi continut). Cu toate acestea, canibalizarea frazelor nu duce simultan la duplicarea continutului (aceleasi fraze-cheie, continut diferit).

Duplicarea de continut dauneaza SEO?

Categoric, da, duplicarea de continut dauneaza SEO. Si o face intr-un mod considerabil. Continutul duplicat afecteaza negativ vizibilitatea paginilor care contin acest tip de continut si poate duce la scaderea pozitiei site-ului in rezultatele cautarilor organice.

De ce dauneaza continutul duplicat SEO? Algoritmii Google, parcurgand mai multe URL-uri ale unui site cu acelasi continut, nu stiu care subpagina este mai importanta si pe care ar trebui sa o afiseze mai sus in rezultatele cautarii.

Ca urmare, Google se poate comporta in mai multe moduri:

  1. In primul rand, algoritmii Google pot afisa toate URL-urile una langa alta, dar in pozitii net inferioare (de exemplu, pe pagina a 2-a, a 3-a sau chiar a 4-a).
  2. In al doilea rand, Google poate selecta doar un singur URL dupa bunul sau plac si il poate afisa mai sus in raport cu celelalte URL-uri cu continut duplicat. Aceasta solutie poate duce la afisarea unui URL care nu este neaparat cel corect in partea de sus a rezultatelor cautarii.
  3. In al treilea rand, Google poate ignora pur si simplu orice URL cu continut duplicat, ceea ce duce la o scadere a ratingului intregului site.

Indiferent de modul in care Google trateaza subpaginile cu continut duplicat, puteti fi sigur ca reactia sa va afecta negativ vizibilitatea site-ului dvs., va reduce traficul organic si poate intrerupe traseul clientului prin pâlnie, diminuand astfel ratele de conversie.

Cauzele duplicarii continutului

Problema duplicarii continutului este destul de complexa si poate afecta magazinele online, blogurile, portalurile, precum si site-urile de carti de vizita. De fapt, continutul duplicat poate fi intalnit de oricine care publica continut online.

Asadar, care sunt cauzele duplicarii continutului? Printre cele mai frecvente se numara:

  • Paginarea executata necorespunzator (printre altele, neimplementarea autocanonicelor pe fiecare subpagina a paginarii).
  • duplicate categorie si descrieri de produse.
  • Implementarea incorecta a certificatului SSL.
  • Aparitia de subpagini sub diferite URL-uri.
  • Implementarea incorecta a versiunilor lingvistice pe site.
  • Indexarea paginilor de dezvoltare.
  • Parametrii GET incorecti.
  • Copierea unor bucati mari de continut din alte subpagini (in interiorul si in afara site-ului).
  • Duplicarea meta tag-urilor.

Paginare executata incorect

O paginare prost executata poate duce la multe probleme atat in ceea ce priveste UX, cat si SEO. Paginarea este utilizata de obicei pentru a imparti subpaginile unor categorii cu un numar mare de produse sau pentru a diviza publicatii extinse.

De cele mai multe ori, problema paginarii se datoreaza unor redirectionari de sub-pagini prost executate.

De exemplu, prima pagina cu paginare poate fi disponibila la doua adrese:

  • senuto.com/en/categorie
  • senuto.com/en/category?p=1

Astfel, exista o dublare a continutului intregii subpagini.

Problema paginarii incorecte poate fi rezolvata prin crearea unei redirectionari 301 de la adresa duplicata; adica adresa senuto.com/en/category?p=1 trebuie redirectionata catre senuto.com/en/category. Cu toate acestea, merita sa modificati scriptul astfel incat parametrul p=1 sa nu mai apara in URL.

Duplicarea descrierilor de categorii și produse

Duplicarea descrierilor produs si a descrierilor categoriilor este una dintre cele mai frecvente probleme. Duplicarea continutului pe subpaginile categoriilor poate aparea ca urmare a paginarii sau la setarea filtrelor si sortarea produselor dintr-o categorie.

In acest caz, puteti implementa, de asemenea, o eticheta link cu atributul rel setat la o valoare canonica. Noi o folosim pe paginile duplicate si includem in cod un link catre pagina principala a categoriei.

Duplicarea descrierilor de produse apare, de obicei, atunci cand o oferta de produse include mai multe articole care nu difera semnificativ – de exemplu, fire de diferite lungimi sau bare plate de dimensiuni diferite.

O eticheta rel=”canonical”, plasata pe fiecare pagina de produs duplicata, indicand spre produsul principal, poate fi o solutie pentru o astfel de situatie. O solutie alternativa poate fi implementarea unei sectiuni de feedback sau de comentarii. Acestea vor permite utilizatorilor sa imbogateasca continutul paginilor de produs cu continut unic, ceea ce va reduce sau va elimina complet problema continutului duplicat.

Continutul duplicat al descrierilor categoriilor si produselor poate aparea si ca urmare a copierii acestuia de pe site-ul web al producatorului. Intr-un astfel de caz, asigurati-va ca continutul de pe site-ul dvs. este 100% unic.

Implementare incorecta a certificatului SSL

Atunci cand implementati un certificat SSL pe site-ul dumneavoastra, asigurati-va ca efectuati o redirectionare de la HTTP la HTTPS in toate URL-urile. O greseala frecventa este fie de a nu efectua o astfel de redirectionare, fie de a o efectua doar la cateva adrese selectate (de exemplu, doar pe pagina principala).

In acest caz, pentru a evita continutul duplicat, implementati o redirectionare globala a tuturor URL-urilor de la HTTP la HTTPS.

Publicarea de subpagini sub diferite URL-uri

Publicarea subpaginilor unui site sub URL-uri diferite poate aparea din cauza unor erori tehnice majore sau minore.

Cel mai adesea, crearea de subpagini duplicate se datoreaza:

  • aparitiei acelorași produse in diferite categorii de produse (URL-ul contine numele categoriilor, deci produsul are adrese diferite),
  • legarii la aceeasi pagina cu si fara „.html”,
  • aparitiei categoriilor in locuri diferite in structura magazinului online.

In fiecare dintre cazurile descrise, solutia este de a efectua o redirectionare 301 de la subpaginile duplicate la URL-ul corect.

Implementarea incorecta a versiunilor lingvistice pe site

Duplicarea continutului ca urmare a implementarii versiunilor lingvistice pe un site apare atunci cand nu toate subpaginile sunt traduse. Astfel, in versiunea in limba straina a site-ului poate aparea un text publicat in poloneza, de exemplu – acelasi text care se afla deja pe site-ul „original”.

Pentru a rezolva aceasta problema, publicati continut unic tradus pe fiecare dintre subpaginile care urmeaza sa fie afisate intr-o limba straina. Pe de alta parte, atunci cand o anumita subpagina nu trebuie sa fie afisata intr-o anumita limba, puteti utiliza eticheta „noindex”.

Indexarea unui site de dezvoltare

Uneori, din greseala, o pagina de dezvoltare este indexata inainte de a fi publicata efectiv.

Daca site-ul nu este inca gata, atunci versiunea de dezvoltare trebuie blocata de la indexare prin introducerea tag-ului „noindex”.

Parametrii GET nevalabili

Parametrii GET sunt utilizati pentru a transfera date intre vizualizarile succesive ale subpaginilor in protocolul HTTP. Sirurile de caractere „type=new” sau „sort=up” sunt utilizate pentru a genera codul HTML in functie de preferintele clientului.

Problema numarului excesiv de parametri GET in URL-uri afecteaza in principal magazine web. Astfel, atunci cand sunt stabilite mai multe filtre de produse, sunt create urmatoarele URL-uri:

  • senuto.com/en?type=new&sort=up&page=2
  • senuto.com/en?page=2&type=new&sort=up
  • senuto.com/en?sort=up&page=2&type=new

In aceasta situatie, fiecare dintre URL-urile de mai sus duce la aceeasi pagina. Cel mai simplu mod de a rezolva aceasta problema este de a efectua canonical pe URL-ul corect.

Copierea unor bucati mai mari de continut din alte pagini

Copierea 1:1 a unor bucati mari de continut si publicarea lor pe propriul site nu este o idee buna. De obicei, Google afla rapid ca acest continut a fost copiat si limiteaza vizibilitatea subpaginii care a „imprumutat” continutul.

Daca continutul copiat provine de la o subpagina a aceluiasi site, atunci o reducere a vizibilitatii se poate abate asupra oricarei subpagini care a publicat continutul respectiv.

Raportează raportarea conținutului duplicat în instrumentul plagiarisma.net
Sursa: plagiarisma.net

Note: Duplicarea continutului in cadrul aceluiasi site poate rezulta si din aparitia aceluiasi text in subsolul paginii. In acest caz, o bucata mai lunga de text din footer poate fi folosita doar pe pagina principala si eliminata din celelalte subpagini.

De asemenea, puteti cadea victima duplicarii continutului fara a avea vreo vina. Este suficient ca cineva sa copieze continut de pe site-ul dvs. si sa il publice pe cont propriu. Intr-o astfel de situatie, merita sa incercati mai intai sa contactati proprietarul site-ului cu o cerere de eliminare a continutului duplicat. De asemenea, merita sa raportati problema furnizorului de gazduire.

Duplicarea meta tag-urilor

Copierea etichetelor Meta Title si Meta Description poarta, de asemenea, semnele distinctive ale continutului duplicat. In aceasta situatie, tag-urile inevitabile pot contribui la scaderea vizibilitatii site-ului.

Solutia la aceasta problema este simpla – trebuie doar sa creati continut unic pentru meta tag-uri.

Cum gasiti continutul duplicat pe site-ul dvs.?

Exista mai multe modalitati de a gasi eficient continutul duplicat in cadrul propriului site. Unele dintre cele mai comune solutii includ:

  • analiza manuala a site-ului,
  • scrawlere web,
  • Google Search Console,
  • insertia de fragmente de continut direct in motorul de cautare.

Analiza manuala a site-ului

Aceasta este solutia care necesita cel mai mult timp si se poate dovedi a fi o modalitate potrivita pentru a cauta continut duplicat pe site-uri mici. Cu toate acestea, pentru site-uri mai extinse, merita sa folositi celelalte metode descrise mai jos.

WebCrawlers

Sitebulb tool duplicate content report
Sursa: sitebulb.com

Cu ajutorul crawlerelor este posibil sa se adune informatii complete despre structura si continutul unui site. Aceste instrumente sunt un ajutor nepretuit atunci cand se realizeaza un audit de site web – inclusiv pentru continutul duplicat. Unele dintre cele mai frecvent utilizate crawlere includ:

  • ScreamingFrog
  • Sitebulb
  • NetPeak
  • Siteliner
  • DeepCrawl

 

SEO screaming frog duplicate content report
Sursa: screamingfrog.co.uk

Fiecare dintre crawlerele indicate permite găsirea relativ ușoară a URL-urilor cu conținut duplicat.

Google Search Console

In instrumentul Google Search Console, puteti verifica cu usurinta daca un site are continut duplicat. Pentru a verifica continutul duplicat, mergeti la fila „Status” (Stare) si apoi verificati mesajele din categorii: „Error” (Eroare), „Correct with warning” (Corectare cu avertisment).

De asemenea, puteti merge la fila „Eficacitate” si acolo verificati daca exista URL-uri duplicate. De exemplu, aparent doua URL-uri diferite, dar unul cu http si celalalt cu https.

 

Google search console duplicate content detection

 

Introducerea fragmentelor de conținut în motorul de căutare

De asemenea, puteti introduce fragmente de continut duplicat in motorul de cautare. Aceasta solutie se poate dovedi a fi o modalitate buna de a verifica paginile cheie ale site-ului dvs. – cum ar fi filele de oferta sau continutul blogului.

Cum sa verificati continutul duplicat de pe web?

Verificați dacă există conținut duplicat cu instrumentul copywritely
Sursa: copywritely.com

Pentru a verifica daca exista continut duplicat pe web, puteti utiliza unul dintre instrumente disponibile. Printre cele mai frecvent utilizate se numara Copyscape, Copywritely, Siteliner si Plagiarism. Tot ce trebuie sa faceti este sa introduceti un fragment de continut sau un URL, iar instrumentul selectat va cauta continutul respectiv pe web.

 

Plagiarisma content duplication checker tool panel
Sursă: Plagiarisma: Plagiarisma.net

Alternativ, puteti lipi un fragment de text direct intr-un motor de cautare si sa vedeti ce rezultate ofera Google.

Cum se rezolva problema continutului duplicat?

Problema continutului duplicat poate fi rezolvata in mai multe moduri. Unul dintre ele este de a efectua redirectii 301 de la subpaginile duplicate la URL-urile corecte. Cu aceasta solutie, este posibil sa se pastreze puterea subpaginilor duplicate, deoarece duplicatul nu este eliminat. In acelasi timp, redirectiile 301 sunt usor de realizat.

O alta solutie este implementarea tag-ului rel=”noindex”, blocand astfel indexarea subpaginii de catre Google. Nu uitati insa ca, prin utilizarea tag-ului „noindex”, veti scadea potentialul de vizibilitate al site-ului dumneavoastra.

A treia modalitate este de a utiliza metatag-ul rel=”canonical”. Canonical-urile functioneaza foarte bine, de exemplu, atunci cand publicati un numar mare de pagini de produse cu descrieri identice sau aproape identice. Prin utilizarea URL-urilor canonice, veti indica Google care este cel mai reprezentativ URL dintr-un set de subpagini duplicate.

In cazul continutului duplicat care rezulta din implementarea unor versiuni lingvistice diferite ale site-ului, merita neaparat sa folositi eticheta „hreflang”. In acest fel, ii veti indica lui Google diferentele dintre diferitele versiuni lingvistice ale site-ului.

Problema continutului duplicat poate fi rezolvata, de asemenea, prin crearea si publicarea unui continut unic pe fiecare subpagina duplicata.

Rezumat

Continutul duplicat este o problema semnificativa care afecteaza in special magazinele si site-urile web mai mari. Merita sa verificati in mod regulat daca nu exista o duplicare a continutului extern si intern si sa luati rapid masurile adecvate pentru a elimina problema. Continutul duplicat poate reduce in mod semnificativ vizibilitatea unui site in rezultatele cautarilor si, prin urmare, poate duce la o scadere a traficului organic.

FAQ

Conținutul duplicat reprezintă conținut identic sau foarte asemănător care apare la mai multe URL-uri, fie în cadrul aceluiași site (duplicare internă), fie pe site-uri diferite (duplicare externă). Acest fenomen poate apărea din greșeli, furt de conținut sau erori în optimizarea SEO.

Da, duplicarea de conținut afectează negativ SEO, deoarece algoritmii Google pot avea dificultăți în a determina care versiune a conținutului este cea mai relevantă, ceea ce poate duce la scăderea poziției site-ului în rezultatele căutărilor.

Printre cauzele comune ale duplicării conținutului se numără paginarea executată necorespunzător, duplicatele categoriilor și descrierilor de produse, implementarea incorectă a certificatului SSL, și copierea conținutului de pe alte site-uri.

Pentru a identifica conținutul duplicat, puteți utiliza analiza manuală a site-ului, crawlere web, Google Search Console sau inserția de fragmente de conținut direct în motorul de căutare. Aflați mai multe despre auditul SEO.

Problema conținutului duplicat poate fi rezolvată prin efectuarea redirecționărilor 301, implementarea tag-ului rel=”noindex” sau utilizarea metatag-ului rel=”canonical” pentru a indica versiunea preferată a conținutului. Aflați cum să evitați duplicarea conținutului.
Distribuie aceasta postare:  
Marcin Cichocki

Założyciel i CEO agencji contentowej Kuźnia Treści. Jego teksty trafiały między innymi na łamy: Newsweeka, Wyborczej, Forbesa, Business Insidera, Rzeczpospolitej i portalu Komputer Świat.

Csaba Pirosca

Experienced marketing manager, SEO specialist, and Local Partnership Manager at SENUTO, but above all, an out-of-the-box thinker, data lover, and a big Google fan!

Încearcă Senuto gratuit timp de 14 zile

Încearcă gratuit

Încearcă Senuto Suite gratuit timp de 14 zile

Încearcă gratuit 14 zile

Descoperă Senuto într-o oră de training online, gratuit

Alege o dată și conectează-te