Az oldalszámozásra vonatkozó SEO-irányelvek, pl. a webáruház kategóriáira vagy a blogcikkekre vonatkozóan, visszatérő téma, és többféle megközelítés létezik. Most arról fogunk beszélni, hogyan kezeljük a paginálást, hogy a webkúszók könnyebben feldolgozhassák a tartalmat.
Legfontosabb megállapítások
- A paginálás a weboldal tartalmának oldalankénti felosztását jelenti, ami növeli a tartalom feldolgozásának hatékonyságát és javítja a felhasználói élményt az SEO szempontjából.
- A kanonikus címkék helytelen használata, mint például az összes oldalra az alapoldalra mutató link, zavaró lehet a keresőmotorok számára; helyes alkalmazásuk elengedhetetlen a tartalom duplikációjának elkerülésére.
- „Noindex, follow” meta címkék használata ajánlott a paginált oldalakon, ha nem szeretnénk, hogy azokat a keresőmotorok indexeljék, de meg akarjuk őrizni a linkek követését.
- A Senuto Visibility Analysis segítségével optimalizálhatjuk a paginált tartalmat, biztosítva annak hatékony indexelését és a weboldal szerkezetének pontos megértését.
- Abszolút URL-ek használata a „rel=next/prev” linkekben növeli a keresőmotorok által végzett hatékony indexelést, segítve ezzel a weboldal SEO teljesítményét.
Mi az a paginálás?
A paginálás egyszerűen egy adott erőforrás oldalankénti felosztását jelenti egy weboldalon. A legegyszerűbb példa erre a webáruházak többségében megtalálható kategóriák lehetnek, ahol egy adott számú termék felsorolása után a felhasználó a terméklista következő részére léphet. Egy másik módja a termékek kategórián belüli bemutatásának a végtelen görgetéses paginálás, ahol a felhasználó lefelé görgetésekor újabb és újabb termékek jelennek meg. Ugyanez a helyzet a blogok esetében is. Általában nem számít, hogy egy weboldal melyik erőforrása van részekre osztva, sokkal inkább az hogyan csinálod, és hogyan értesíted a Googlebotot a következő tartalomról.
Próbáld ki a Senuto Suite-ot 14 napig ingyen
Próbáld ki a Senuto Suite-ot 14 napig ingyenLet let web crawlers do what they do
Az egyik alapvető hiba, amit a lapozás során elkövetnek, az a kanonikus címkék használata az első lapozási oldalon. És bár egy-egy helyzetben indokolt, általában mégis helytelenül végzik.
Ha például egy termékkategória több oldalra van felosztva, az azt jelenti, hogy az alapoldal egy bizonyos számú terméket tartalmaz, a második oldal egy másik termékcsoportot, és így tovább, egészen az utolsó paginálási oldalig.
A paginációs oldalak a következők:
https://website.com/ termékkategória/oldal-2
https://website.com/ termékkategória/3. oldal
https://website.com/product-category/page-4
stb.
ezért nem sok értelme van az ilyen kanonikus linkek használatának:
mivel egy adott kategória termékeinek további részéről van szó, a 2,3,4 stb. oldalak nem duplikátumai a főoldalnak (kivéve, ha ez nem így van, akkor a kanonikus link használata indokolt).
Természetesen lehet kanonikus linkeket adni, de magukra. Ilyen esetben a következőket írja be az oldalra https://website.com/product-category/ :
<link rel="canonical" href="https://website.com/product-category" />
és a következő az oldalon https://website.com/product-category/page-2:
Egy oldal az összes tartalommal
Van egy kivétel – egy alapoldal az összes tartalommal, ráadásul néhány kevesebb tartalommal rendelkező aloldalra osztva. Ilyen helyzetben van értelme kanonikus linket használni. Ezt a gyakorlatot gyakran használják meglehetősen hosszú, sok tartalommal rendelkező cikkeknél.
Így a következő oldalakon:
https://website.com/product-category/page-1.
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
egyetlen logikai sorozattá kombinálva valójában az összes olyan tartalmat tartalmazni fogja az alapoldalon https://website.com/product-category/, amelyet a keresőmotorok indexeléséhez használni szeretne.
Ez a szerencsétlen első oldallap…
Még egy hiba a kategória alapoldal https://website.com/product-category/ duplikálása az első paginációs oldallal https://website.com/product-category/page-1.
Ha az alapoldal ugyanazt a tartalmat tartalmazza, mint a /page-1,akkor felesleges duplikátumot készíteni – bizonyos tartalomkezelő rendszerek általában (az alapoldal mellett)az /page-1-gyel kezdődő első paginációs oldalt generálják;ilyen esetben a cím a címnek pl. átirányítani az alapoldalra a Redirect 301 segítségével, és a kódban nem a https://website.com/product-category/page-1, hanem a https://website.com/product-category/ linket kell megadni.
Ellenkező esetben belső átirányítási problémába ütközik, így a Googlebotnak az adott weboldal feltérképezésére szánt feltérképezési költségvetését pazarolja. Más szóval, nincs értelme belső linkkel átirányítani a 301-es átirányítással, amikor közvetlenül a céloldalra lehet linkelni a 200-as HTTP státuszkódú HTTP-oldal segítségével.
A rel=”next „andrel=”prev” attribútumok
Ha úgy dönt, hogy az alábbiak szerint oldallapozunk:
https://website.com/product-category/
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
akkor jelezheti az egyes oldalak közötti kapcsolatokat a lánctalpasok számára. A <head>szakaszban rel attribútummal ellátott releváns linkek megadása kiemeli a sorozat egyes oldalait.
Az első (alap)oldalra tegye a következőket:
mint egy másik oldal, amely ugyanannak az erőforrásnak egy részét tartalmazza.
A következő oldalon, azaz https://website.com/product-category/page-2,put a következőket:
Továbblépve, a harmadik oldalon, azaz https://website.com/product-category/page-3:
Feltételezve, hogy a /page-4 az utolsó a lapozási sorrendben, tegyük oda a következőket:
Ez a leggyakrabban használt linkkombináció a „rel next/prev” attribútumokkal ellátott címsorokban. A linkekhez néha a kódban (pl. a lista alatt) „<a href=” attribútumokat adnak, bár jobb, ha a<fej> részbe kerülnek – minél hamarabb kap egy lánctalpas fogalmat arról, hogy hol van az erőforrás többi része, annál jobb.
Nem szabad elfelejteni, hogy a „rel next/prev” attribútummal ellátott linkek nem abszolút direktívák, azaz figyelembe vehetők, de nem kötelező figyelembe venni őket egy weboldal feltérképezése során. Emellett érdemes abszolút elérési utakat használni a következő oldalakhoz, bár a Google irányelvei szerint „az értékek lehetnek abszolút elérési utak és relatív elérési utak.”Mégis, ha egy oldal URL-je paramétereket tartalmaz, pl. válogatási paramétereket, akkor ezeket is „rel next/prev” linkekbe kell tenni – például a következő oldalra:
https://website.com/product-category/page-3&sort=desc
a <head> részben a következő linkeket fogja tartalmazni:
hanem egy olyan kanonikus tag, amely csak önmagára mutat (a csökkenő sorrendbe rendezés paramétere nélkül):
Indexelni vagy nem indexelni?
Egy másik probléma, amivel a paginálás során szembesülünk, a robotok meta-címkékkel való visszaélés. A Google azt állította, hogyaz egyes oldalakat logikai sorrendnek kell tekinteni, ami a linkjeik attribútumainak figyelembevételét eredményezi, és a legtöbb esetben segít a felhasználónak az első oldal megjelenítésében.
Nagyon gyakran előfordul, hogy az egyes oldalakat a keresőmotorok indexében annak ellenére, hogy a „rel next/prev” attribútumokkal ellátott linkekkel kapcsolódnak egymáshoz, az egyes oldalakat paginálják. Ha ez problémát jelent, akkor a legjobb lesz a következőket használni:
A következő oldalakon, azaz a /page-2 és magasabb oldalakon. A webes lánctalpas program az utolsó oldalig feltérképezi a linkeket, de nem indexeli azokat.
So what about canonicals?
A John Muellerrel folytatott beszélgetésből (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) egyértelműen következik, hogy nem szabad „no index” meta tageket indexelhető URL-re mutató kanonikusokkal kombinálni. Tehát ebben az esetben, ha egy oldalszámozású oldalon egy kanonikus link önmagára irányít, akkor nem szabad ‘no index’ meta taget tenni, és fordítva.
Nem észleltem semmilyen problémát a paginált oldalak feltérképezésével kapcsolatban, ha a kanonikus linkek magukra az oldalakra mutatnak, és a ‘no index’ meta taget is; azonban a Google saját maga akarja eldönteni, hogy mit indexel és mit nem, így talán hagyni kellene, hogy a Google csinálja.
Pagination és egy weboldal XML sitemap
Itt van egy érdekes eset: a sitemap.xml-be inkább nem adunk meg paginációs linkeket, hanem csak például egy kategória vagy az összes tartalmat tartalmazó fő cikk alapcímét. Elvileg egy XML sitemapbe azokat a címeket kell beírni, amelyeket indexelni szeretnénk, tehát ha nem érdekel a paginációs indexelés, akkor ne írjuk be oda a /page-2 és magasabb URL-eket. Természetesen, ha „no index” robots meta taggel blokkolja, akkor még egyszerűbb – ne adja meg őket.
Pagination pages as parameters
Ha támogatni szeretné a termék/cikk indexelését az utolsó paginált oldaltól kezdve, biztosítson korlátlan hozzáférést a webkúszóknak az alapkategórián túli más kategóriák oldalaihoz. Gyakran előfordul, hogy az egyes oldalak „?page=” vagy „?p=” paraméterekkel rendelkeznek, és a robots.txt-ben a többi paraméterrel együtt tévesen blokkolhatók.
Hasonló a helyzet az URL-paraméterek esetében a Google Search Console-ban. Érdemes megmutatni a Googlebotnak, hogy az ilyen paraméterek felelősek az erőforrások oldalakra való felosztásáért, és hagyni, hogy a bot döntsön.
Kategóriák tagolása és leírása
Gyakran követett gyakorlat a kategóriák tartalmának bővítése, pl. webáruházakban. Gyakran előfordul, hogy a hozzáadott leírás változatlan formában jelenik meg az összes paginálási URL-nél. Ha az összes oldalt logikai sorozatként kezeljük, és a „rel next/prev” attribútumokkal egy egésszé egyesítjük, akkor feleslegesnek tűnik ugyanazt a szöveget megkettőzni a /page-2, /page-3 stb. oldalakon.
Hasonló a helyzet a felsorolt termékek esetében is: minden következő oldal új termékcsoportot jelenít meg, és a felhasználó nem akarja, hogy minden egyes oldalon mindig ugyanazt a kategórialeírást olvassa, és nem akarja, hogy a kategórián belül ugyanazokat a termékeket tovább nézegesse. Van azonban egy kérdés – ki olvassa a kategórialeírásokat? A Googlebot valószínűleg igen, ezért ne etesse duplikátumokkal.
Szükséged van-e oldalszámozásra, ha végtelen görgetést használsz?
Kiderült, hogy a paginálás a „végtelen görgetés” megoldásnál is járható út, ahol egy kategórián belül a termékek/cikkek listáját lefelé görgetve újabb források jelennek meg. John Mueller (http://scrollsample.appspot.com/items) adott egy értelmes példát: a lista görgetése közben a következő oldalakra mutató új paraméterek kerülnek hozzá az URL-hez.
http://scrollsample.appspot.com/items?page=2
http://scrollsample.appspot.com/items?page=3
és így tovább és így tovább.
Nyilvánvaló, hogy itt „rel next/prev” attribútummal ellátott linkeket használnak, és a megadott kanonikus link önmagára vonatkozik; például a http://scrollsample.appspot.com/items?page=5-nál ez a következőképpen néz ki:
A pagination mint az indexelési stratégia eleme
A döntés, hogy egy adott oldalszámozási megoldást alkalmazzunk, természetesen a tiéd. A fenti példák nem minden helyzetben jelentenek tökéletes lehetőséget, mert előfordulhat, hogy technikai nehézségekbe, CMS-problémákba ütközik, vagy egyszerűen csak ellentétes az elfogadott indexelési stratégiával. Érdemes azonban a paginálást olyan mértékben optimalizálni, hogy legalább ne akadályozza meg a Googlebotot a weboldal feltérképezésében, valamint elősegíti az eltemetett termék/cikk oldalak indexelését, amelyek nem olyan könnyen elérhetők egyetlen látogatás során.