Duplicitní URL jsou častým problémem zvláště u e-shopů, nikoli ale pouze jen u nich. Duplicita vzniká v momentě, kdy se stejný (či velice podobný) obsah nachází na dvou odlišných URL. V tento moment tady nastává problém tím, že roboti při vyhledávání nabízí primárně relevantní, unikátní a především neopakující se obsah.
V praxi si crawleři vybírají, které stránky zaindexují a které ne. Může se ovšem stát i to, že si vyberou zaindexovat všechny. V prvním případě je možné, že si vyberou stránku, která pro Váš cíl tak efektivní jako stránka, kterou nezaindexovali. V případě druhém hrozí, že obě zaindexované stránky se budou zobrazovat na nízkých pozicích. Duplicitní adresy jsou tedy svou vlastní konkurencí.
Druhy duplicitních URL
Homepage duplicity
Tyto duplicity běžně vznikají omylem a je dobré si ověřit, zda se tak nestalo i u Vašich stránek. Tyto duplicity se liší v minimálních detailech, kterých by si většina lidí ani nevšimla. Pro ilustraci pár příkladů:
http://www.pokus.cz
https://www.pokus.cz
či
http://www.pokus.cz/vzor
http://www.pokus.cz/vzor/
Produktové síto
Tento problém se týká primárně e-shopů. Typicky k tomu dochází během filtrování produktů. Jdeme-li na e-shop, který má možnost filtrovat podle kategorií, jako je značka, barva, velikost, cena a podobné.
Příklad:,
http://www.nábytkářství.cz/židle/ – toto je stránka kategorie, ve které můžeme najít židle
http://www.nábytkářství.cz/židle/barva-žlutá/ – na této stránce jsme opět v kategorii židlí, ovšem s přidaným filtrem barvy
Tyto dvě URL jsou odlišné a jejich indexace by proběhla odděleně. Je ovšem důležité si uvědomit zda to nebude plýtvání crawl budgetem. Tedy časem, který crawler stráví na našich stránkách. Je tedy důležité si položit otázku: „Skutečně prodáme tolik žlutých židlí, že je pro nás zásadní, aby byly zaindexované?“
Komplikace nastává v momentě, kdy máme více filtrů, které řadíme za sebe. Kombinace filtrů sice může být stejná, ale pořadí, ve kterém jsme je vybrali, je různé. Tedy vznikne více URL adres se stejným obsahem.
Struktura URL
Příklad:
http://www.nábytkářství.cz/nabytek-do-kuchyne/zidle-model-001/
http://www.nábytkářství.cz/nabytek-do-pracovny/zidle-model-001/
V obou případech uživatel došel na stránku jednoho produktu. Ovšem dvěma cestami. V tento moment pro jeden daný produkt existují dvě URL adresy a nastává problém. Obě kategorie spolu nyní budou soupeřit.
Jak to vyřešit
Kanonické URL
Vhodná metoda, pokud se na webu vyskytuje malé množství duplicitních adres, či je doprava na těchto adresách pro Vás důležitá. Kanonické URL a vše okolo nich mají vlastní článek Canonic tags.
Robots.txt
Tato metoda je vhodná při velkém množství duplicitních adres. Jak tato metoda přesně funguje, najdete v našem článku Vyjmuté stránky z měření.
Meta tag
Podstatou této metody je zakázané indexování konkrétních stránek. Stejně tak je možné takto zakázat robotům, aby následovali interní odkazy na dané stránce. Tato metoda se dá kombinovat s metodou robots.txt. Je to vhodné zvláště, pokud na stránkách jsou další odkazy, které chcete, aby crawleři následovali.