Kanonizace je proces výběru reprezentativní – kanonické – adresy URL části obsahu. Kanonická adresa URL je tedy adresa URL stránky, kterou společnost Google vybrala jako nejreprezentativnější ze sady duplicitních stránek. Tento proces se často nazývá deduplikace a pomáhá společnosti Google zobrazovat ve výsledcích vyhledávání pouze jednu verzi jinak duplicitního obsahu.
Existuje mnoho důvodů, proč může mít stránka duplicitní obsah:
- regionální varianty: například obsah pro USA a Velkou Británii, který je dostupný z různých adres URL, ale v podstatě se jedná o stejný obsah ve stejném jazyce,
- varianty zařízení: například stránka s mobilní i desktopovou verzí,
- varianty protokolů: například verze stránky HTTP a HTTPS,
- funkce webu: například výsledky funkcí třídění a filtrování na stránce s kategoriemi,
- náhodné varianty: například demoverze webu omylem ponechaná přístupná pro crawlery.
Určitý duplicitní obsah na webu je normální a nejedná se o porušení zásad společnosti Google týkajících se spamu. Mít stejný obsah přístupný prostřednictvím mnoha různých adres URL však může být pro uživatele nepříjemné a může vám to ztížit sledování toho, jak si váš obsah vede ve výsledcích vyhledávání.
Jak Google indexuje a vybírá kanonickou adresu URL
Když Google indexuje stránku, určuje primární obsah (neboli ústřední bod) každé stránky. Pokud Google najde více stránek, které se zdají být stejné nebo jejichž primární obsah je velmi podobný, vybere stránku, která je na základě faktorů (nebo signálů) shromážděných procesem indexování objektivně nejúplnější a nejužitečnější pro uživatele vyhledávání, a označí ji jako kanonickou. Kanonická stránka bude procházena nejpravidelněji; duplicitní stránky jsou procházeny méně často, aby se snížilo zatížení stránek při procházení.
Při kanonizaci hraje roli několik faktorů: zda je stránka servírována prostřednictvím protokolu HTTP nebo HTTPS, přesměrování, přítomnost adresy URL v mapě stránek a anotace odkazů rel=”canonical”. Pomocí těchto technik můžete společnosti Google naznačit své preference, ale společnost Google může z různých důvodů vybrat jako kanonickou jinou stránku než vy. To znamená, že uvedení preference kanonické stránky je nápovědou, nikoli pravidlem.
Různé jazykové verze jedné stránky jsou považovány za duplicity pouze v případě, že primární obsah je ve stejném jazyce (to znamená, že pokud je přeložena pouze hlavička, patička a další nekritický text, ale tělo zůstává stejné, pak jsou stránky považovány za duplicity).
Google používá kanonickou stránku jako hlavní zdroj pro hodnocení obsahu a kvality. Výsledek vyhledávání Google obvykle odkazuje na kanonickou stránku, pokud některá z duplicit není pro uživatele vyhledávače výslovně vhodnější. Například výsledek vyhledávání bude pravděpodobně směřovat na mobilní stránku, pokud je uživatel na mobilním zařízení, i když je stránka pro stolní počítače označena jako kanonická.
Přečtěte si další informace o tom, jak uvést preferenci kanonické adresy URL a zda je to nutné.
Překlad, odborná a obsahová korektura: SEOPRAKTICKY.CZ
Použité zdroje
- What is URL Canonicalization | Google Search Central | Documentation | Google for Developers. Google for Developers – from AI and Cloud, to Mobile and Web [online]. Dostupné z: https://developers.google.com/search/docs/crawling-indexing/canonicalization
Související články
Procházení a indexování
- Mapy stránek
- Správa crawlingu
- Robots.txt
- Kanonizace
- Mobilní web a indexování podle mobilních zařízení
- AMP
- JavaScript
- Metadata stránek a obsahu
- Odstranění
- Přesuny a změny webu
Ranking a možnosti zobrazení ve výsledku vyhledávání
Monitorování a odstraňování chyb
Průvodce pro konkrétní stránky