Paginarea – un element crucial al indexării în motoarele de căutare

SEO Tutorials
Dawid MedwediukDawid Medwediuk
Publicat: 11.08.2017
13 minute

Orientările SEO privind paginarea, de exemplu, a categoriilor magazinului online sau a articolelor de pe blog, sunt un subiect recurent și există câteva abordări în acest sens. Vom discuta despre cum să abordăm paginarea pentru a ajuta crawlerele web să proceseze mai ușor conținutul.

Principalele concluzii
  • Utilizarea incorectă a tag-urilor canonice pe prima pagină de paginare poate duce la interpretarea greșită a conținutului de către crawlerele web, sugerând că toate paginile de paginare sunt duplicate ale primei pagini.
  • Atributele rel=”next” și rel=”prev” sunt esențiale pentru a indica relațiile dintre paginile de paginare, ajutând la o mai bună înțelegere a structurii site-ului de către motoarele de căutare.
  • Implementarea corectă a meta tag-ului „noindex, follow” pentru paginile secundare de paginare și utilizarea inteligentă a paginării în cazul scroll-ului infinit pot îmbunătăți indexarea conținutului de către motoarele de căutare.
  • Pentru a optimiza eficient activitățile SEO și de content marketing, inclusiv gestionarea paginării, Visibility Analysis cu Senuto oferă instrumente avansate și suport AI.
  • Decizia de a indexa sau nu paginile de paginare depinde de strategia de indexare adoptată, iar paginarea corect implementată nu ar trebui să împiedice crawlerea site-ului de către Googlebot.

Ce este paginarea?

Paginarea este pur și simplu împărțirea unei resurse specifice de pe un site web în pagini. Cel mai simplu exemplu pot fi categoriile din majoritatea magazinelor online, unde după ce se listează un anumit număr de produse, utilizatorul poate trece la următoarea parte a listei de produse. Un alt mod de a prezenta produsele în cadrul unei categorii este paginarea cu defilare infinită, unde atunci când utilizatorul derulează în jos, sunt afișate produse noi și noi. Același lucru este valabil și pentru bloguri. În general, nu contează ce resursă a unui site web este împărțită în părți, este mai mult vorba de modul în care o faceți și cum îl anunțați pe Googlebot de conținutul care urmează.

Încearcă Senuto Suite gratuit timp de 14 zile

Încearcă gratuit 14 zile

Lăsați crawlerele web să facă ceea ce fac

Una dintre greșelile de bază comise în timpul paginării este utilizarea tag-urilor canonice pe prima pagină de paginare. Și chiar dacă este justificată într-o situație, de obicei este făcută incorect.

Dacă, de exemplu, o categorie de produse este împărțită în câteva pagini, înseamnă că pagina de bază include un anumit număr de produse, a doua pagină include un alt grup de produse, și așa mai departe, până la ultima pagină de paginare.

Paginile de paginare sunt după cum urmează:

https://website.com/ produs-categorie/pagina-2
https://website.com/ produs-categorie/pagină-3
https://website.com/product-category/page-4

etc.

prin urmare, nu are prea mult sens să folosiți astfel de legături canonice:

<link rel=„canonical” href=„https://website.com/product-category” />

datorită faptului că este o parte ulterioară a produselor dintr-o anumită categorie, paginile 2,3,4, etc. nu sunt duplicate ale paginii principale (dacă nu este cazul, atunci utilizarea unei legături canonice este rezonabilă).

Firește, puteți oferi linkuri canonice, dar la ele însele. Într-un astfel de caz, introduceți următoarele pe pagina https://website.com/product-category/ :

<link rel="canonical" href="https://website.com/product-category" />

și următoarele pe pagina https://website.com/product-category/page-2:

<link rel=„canonical” href=„https://website.com/product-category/page-2” />

O pagină cu tot conținutul

Există o excepție – o pagină de bază cu tot conținutul, împărțită suplimentar în câteva subpagini cu mai puțin conținut. Într-o astfel de situație, are sens să folosiți o legătură canonică. Este o practică utilizată adesea în articolele destul de lungi, cu mult conținut.

Astfel, paginile următoare:

https://website.com/product-category/page-1
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4

combinate într-o singură secvență logică vor include, de fapt, tot conținutul paginii de bază https://website.com/product-category/ pe care doriți să îl utilizați pentru indexarea în motoarele de căutare.

Această nefericită primă pagină de paginare…

O altă greșeală este duplicarea paginii de bază a categoriei https://website.com/product-category/ cu prima pagină de paginare https://website.com/product-category/page-1

În cazul în care pagina de bază include același conținut ca /page-1,atunci nu are rost să se facă un duplicat – anumite sisteme de gestionare a conținutului generează în mod normal (pe lângă o pagină de bază)prima pagină de paginare care începe cu /page-1;în acest caz, adresa ar trebui de ex. fi redirecționată către pagina de bază folosind Redirect 301, iar în cod ar trebui să furnizați un link nu către https://website.com/product-category/page-1 ci mai degrabă către https://website.com/product-category/

În caz contrar, veți întâmpina o problemă de redirecționare internă, irosind astfel bugetul de crawling al Googlebot pentru crawlingul unui anumit site web. Cu alte cuvinte, nu are rost să îl redirecționați cu un link intern folosind Redirect 301 când puteți face legătura direct către pagina de destinație folosind codul de stare HTTP 200.

Atributele rel=”next „andrel=”prev”_attributes

Dacă decideți să paginați după cum urmează:

https://website.com/product-category/
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4

atunci puteți indica relații între pagini individuale pentru un crawler. Furnizarea de linkuri relevante cu atribute rel în secțiunea <head>evidențiază pagini individuale dintr-o secvență.

Pe prima pagină (de bază), puneți următoarele:

<link rel=„next” href=„https://website.com/product-category/page-2”>

ca o altă pagină care conține o parte din aceeași resursă.

Pe pagina următoare, adică https://website.com/product-category/page-2,put următoarele:

<link rel=„prev” href=„https://website.com/product-category/”>
<link rel=„next” href=„https://website.com/product-category/page-3”>

Mergând mai departe, pe a treia pagină, adică https://website.com/product-category/page-3:

<link rel=„prev” href=„https://website.com/product-category/page/page-2”>
<link rel=„next” href=„https://website.com/product-category/page-4”>

Presupunând că /page-4 este ultimul din secvența de paginare, puneți acolo următoarele:

<link rel=„prev” href=„https://website.com/product-category/page-3”>

Este cea mai frecvent utilizată combinație de linkuri dintr-un titlu cu atributele „rel next/prev”. Există uneori atribute adăugate la link-uri „<a href=” în cod (de exemplu, sub listă), deși este mai bine să le puneți în secțiunea head> head> – cu cât mai repede un crawler își dă seama unde se află restul resursei, cu atât mai bine.

Trebuie să vă amintiți că legăturile cu atributele „rel next/prev” nu sunt directive absolute, adică pot, dar nu trebuie să fie luate în considerare în timpul parcurgerii unui site web. În plus, este vrednic să folosiți căi absolute către paginile următoare, deși directivele Google spun că „valorile pot fi căi absolute și căi relative.”Cu toate acestea, în cazul unei pagini cu parametri în URL, de exemplu, parametri de sortare, aceștia ar trebui să fie de asemenea puși în linkuri „rel next/prev” – de exemplu, pagina următoare:

https://website.com/product-category/page-3&sort=desc

va include următoarele linkuri în secțiunea <head>:

<link rel=„prev” href=„https://website.com/product-category/page-2&sort=desc”>
<link rel=„next” href=„https://website.com/product-category/page-4&sort=desc”>

ci o etichetă canonică care să arate doar către ea însăși (fără parametrul de sortare în ordine descrescătoare):

<link rel=„canonical” href=„https://website.com/product-category/page-3”/>

To index or not to index?

O altă problemă cu care ne confruntăm în timpul paginării este utilizarea greșită a meta-etichetelor robots. Google susținea căpaginile individuale trebuie considerate ca o secvență logică, ceea ce va duce la luarea în considerare a atributelor legăturilor lor și, în cele mai multe cazuri, va ajuta utilizatorul să afișeze prima pagină.Se întâmplă foarte des ca paginile individuale de paginare, în ciuda faptului că sunt conectate între ele cu legături cu atribute „rel next/prev”, să se afle în indexul motorului de căutare. Dacă aveți o problemă cu acest lucru, cel mai bine va fi să folosiți următoarele:

<meta name=„robots” contenit=„noindex, follow” />

pe paginile următoare, adică pe /page-2 și mai sus. Un web crawler va parcurge linkurile până la ultima pagină paginată, dar nu le va indexa.

So what_what_about_canonicals?

Din discuția cu John Mueller (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) reiese clar că nu trebuie să combinați meta tag-urile ‘no index’ cu canonicals care să arate spre un URL indexabil. Prin urmare, în acest caz, dacă o legătură canonică de pe o pagină de paginare direcționează către ea însăși, nu trebuie pus un meta tag ‘no index’ și invers.

Nu am observat nicio problemă în ceea ce privește crawling-ul paginărilor cu linkuri canonice către paginile în sine și meta tag-ul „no index”; totuși, Google vrea să decidă singur ce să indexeze și ce să nu indexeze, așa că poate ar trebui să lăsăm Google să o facă.

Paginarea și un site web XML sitemap

Iată un caz interesant: mai degrabă nu introduceți linkuri de paginare într-un sitemap.xml, ci doar adresa de bază a, de exemplu, unei categorii sau a articolului principal cu tot conținutul. În principiu, într-un sitemap XML trebuie introduse acele adrese pe care doriți să le indexați, deci dacă nu vă interesează indexarea paginilor, nu includeți acolo URL-uri către /page-2 și mai sus. Firește, dacă blocați cu o metaetichetă robots „no index”, este și mai simplu – nu le furnizați.

Paginile de paginare ca parametri

Dacă doriți să sprijiniți indexarea produselor/articolelor de la ultima pagină paginată, oferiți crawlerelor web acces nelimitat la paginile altor categorii dincolo de categoria de bază. Se întâmplă adesea ca pagini individuale să aibă parametrii „?page=” sau „?p=” și pot fi blocate din greșeală în robots.txt împreună cu restul parametrilor.

Este similar pentru parametrii URL în Google Search Console. Merită să-i arătați lui Googlebot că astfel de parametri sunt responsabili pentru împărțirea resurselor în pagini și să lăsați robotul să decidă.

Paginare și descrieri de categorii

O practică frecvent urmată este extinderea conținutului categoriilor, de exemplu în magazinele online. Se întâmplă adesea ca o descriere adăugată să fie afișată la toate URL-urile de paginare într-o formă neschimbată. Dacă toate paginile sunt tratate ca o secvență logică și sunt combinate într-un întreg prin atributele „rel next/prev”, atunci pare inutilă duplicarea aceluiași text pe /pagina-2, /pagina-3, etc.

Situația este similară în ceea ce privește produsele listate: fiecare pagină următoare afișează un nou set de produse, iar utilizatorul nu dorește nici să citească mereu aceeași descriere a categoriei pe fiecare pagină, nici să se uite mai departe la aceleași produse din cadrul categoriei. Există totuși o întrebare – cine citește descrierile categoriilor? Probabil că Googlebot o face, așa că nu-l hrăniți cu duplicate.

Aveți nevoie de paginare dacă folosiți un scroll infinit?

Se pare că paginarea este o opțiune viabilă și în soluția „infinite scroll”, în care, prin derularea în jos a listei de produse/articole dintr-o categorie, sunt afișate noi resurse. John Mueller (http://scrollsample.appspot.com/items) a oferit un exemplu sensibil: în timp ce se derulează lista, în URL sunt adăugați noi parametri care indică paginile următoare.

http://scrollsample.appspot.com/items?page=2
http://scrollsample.appspot.com/items?page=3

și așa mai departe și tot așa.

Evident, aici se folosesc linkuri cu atributele „rel next/prev” și se oferă un link canonic către sine; de exemplu, la http://scrollsample.appspot.com/items?page=5, este după cum urmează:

<link rel=„canonical” href=„/items?page=5” />
<link rel=„next” href=„/items?page=6”/>
<link rel=„prev” href=„/items?page=4”/>

Paginarea ca element al unei strategii de indexare

Decizia de a aplica o anumită soluție de paginare vă aparține în mod natural. Exemplele de mai sus nu sunt opțiuni perfecte în orice situație, deoarece este posibil să întâmpinați dificultăți tehnice, probleme legate de CMS sau pur și simplu este contrară unei strategii de indexare adoptate. Cu toate acestea, merită optimizată paginarea în așa măsură încât cel puțin să nu împiedice Googlebot să parcurgă site-ul web, precum și să favorizeze indexarea paginilor de produse/articole îngropate, care nu sunt atât de ușor accesibile în timpul unei singure vizite.

FAQ


Paginarea reprezintă împărțirea conținutului unui site web în mai multe pagini, pentru a facilita navigarea utilizatorilor și procesarea conținutului de către crawlerele web.


O greșeală comună este utilizarea tag-urilor canonice pe prima pagină de paginare, indicând incorect că toate paginile de paginare sunt duplicate ale paginii principale.


Atributele rel=”next” și rel=”prev” se folosesc pentru a indica relații între paginile individuale într-o secvență de paginare, ajutând crawlerele web să înțeleagă structura paginării.


Nu este necesar să indexăm toate paginile de paginare; se poate folosi meta tag-ul „noindex, follow” pentru paginile următoare, permițând crawlerele să parcurgă linkurile fără a le indexa.


Da, chiar și în cazul scroll-ului infinit, paginarea poate fi implementată prin adăugarea de parametri URL care indică paginile următoare, facilitând indexarea conținutului de către motoarele de căutare. Află mai multe despre importanța paginării.
Distribuie aceasta postare:  
Dawid Medwediuk

Od 2011 roku związany z Search Engine Marketingiem. Pasjonat SEO, nowych technologii i gadżetów.

Încearcă Senuto gratuit timp de 14 zile

Încearcă gratuit

Încearcă Senuto Suite gratuit timp de 14 zile

Încearcă gratuit 14 zile

Descoperă Senuto într-o oră de training online, gratuit

Alege o dată și conectează-te