Poměrně často se v rámci našich demo představení dostáváme k zákazníkům, kteří svůj byznys provozují lokálně. A protože se dotazy a problémy neustále opakují, rozhodli jsme se Richardem Klačkem ze společnosti Taste připravit webinář, kde tuto problematiku nejen osvětlíme, ale ukážeme reálné výsledky některých vybraných zákazníků.
Co by to ale bylo za osvětu bez pořádného polního průzkumu. Podívali jsme se tedy přímo do výsledků nejpoužívanějšího vyhledávače na světě – Google.
Jak jsme při průzkumu postupovali a co jsme tím sledovali
TOP 5000 nejhledanějších slov
Z dat Collabimu jsme si vytáhli 5000 nejhledanější klíčových slov, které v sobě obsahovaly některé z krajských měst v ČR.
Výběr lokace pro test
Jedním z hlavních záměrů našeho průzkumu bylo zjistit, jak moc se liší výsledky z Google, pokud používáme explicitní vyjádření lokality (např. “autoservis praha”) proti výsledkům, kdy se použije pouze např. “autoservis”. V obou případech samozřejmě s geolokací z jednoho místa.
Vzhledem k nejvyššímu počtu slov jsme vybrali logicky Prahu jako místo, kde tento test provedeme.
Vytvoření 2 datasetů
Vytvořili jsme si tedy 2 datasety – jeden včetně lokality (tedy “praha”) a druhý pouze ze základním klíčovým slovem/frází.
Příklad datasetu s lokalitou:
- bazarový nábytek praha
- galerie praha
- fitnes praha
Ve verzi bez lokality jsme u jednotlivých vyhledávacích dotazů pouze slovo “praha” umazali.
2x scrape SERP Google -> TOP 10, geolokace Praha
Následně jsme tedy pomocí jednorázové analýzy Pozice a hledanost v Collabimu stáhli veškeré výsledky pro první stranu Google, geolokaci jsme nechali nastavenou stejně v obou případech, tedy Prahu.
Tuto analýzu jsme provedli pro oba datasety.
Identifikace brand/non-brand frází
První výsledky vypadaly zajímavě, nicméně při zpětném procházení datasetů jsme zjistili, že nemalá část vyhledávaných dotazů obsahuje různé brandové názvy.
Rozhodli jsme se tedy data ještě rozdělit na brand a non-brand a veškeré metriky následně počítat pro rozdělené datasety.
V datasetech jsme identifikovali celkem 187 brandových frází, 478 jich bylo obecných.
Je nám jasné, že získaná data nejsou kdovíjak rozsáhlá, ale lokální výrazy v ČR evidentně nejsou tím nejhledanějším, takže pracujeme s tím, co máme.
Stažení cílových URL + Ahrefs data
Abychom mohli posoudit, jaký vliv může mít četnost použití města na cílových stránkách, bylo nutné si všechny tyto stránky poctivě stáhnout a analyzovat jejich HTML kód. K tomu jsme použili Screaming Frog a Richardovo umění extrakce počtu výskytu slova “praha” a jiných skloňovaných variant v různých částech těchto stránek (komplet HTML, head, body, text apod.)
Také jsme do našeho pomyslného datového kotlíku přidali data z Ahrefs (počtu zpětných odkazů, page rating, domain rating apod.).
Analýza získaných dat
No a nakonec jsme celý balík dat analyzovali částečně v Google Sheets, většinou pak přímo za pomoci MySql.
Hypotézy průzkumu
Hypotéza H1: Google už je technologicky dost daleko co se týče geolokace. Budou tedy minimální rozdíly mezi výsledky s explicitním použitím lokality a bez (např. “autoservis praha” vs. “autoservis”).
Hypotéza H2: Lépe se budou umisťovat stánky, které mají připravené podstránky pro danou lokalitu (např. podstránky poboček).
Hypotéza H3: Google bude upřednostňovat podstránky u lokálních dotazů speciálně vytvořených pro tuto lokalitu před hlavní stránkou domény.
Výsledky průzkumu
Kompletní výsledky
Je možné vidět zde:
https://docs.google.com/spreadsheets/d/1ksOi1K4xmI3v44XuNznUEBkSuy0xEYsVSw7fX6gKcwE/edit?usp=sharing
Google TOP10 SERP
Pojďme se nejdříve podívat, co nám prozradil sám SERP, tedy první strana vyhledávání.
Kompletní výsledkovou tabulku najdete na listu “SERP brand/non-brand”.
Hned první pohled na data nám vyvrátil hypotézu H1. Data z obou datasetů jsou odlišná:
Hypotéza H1 byla tedy vyvrácena, datasety se liší (shodné domény v TOP10) ve více než 32%.
Podstránky se slovem “praha” v URL
V datasetu s použitím lokality je mnohem vyšší zastoupení URL se slovem “praha”. To znamená, že pokud explicitně sdělíme Google lokalitu, mnohem pravděpodobněji nás povede na podstránku vytvořenou pro tuto lokalitu.
To je vidět zde:
Podíváme-li se, zda-li jsou za toto zodpovědné spíše brand či non-brand fráze, tak rozložení je odpovídající počtu slov (30:70) – u verze s lokalitou:
Zajímavé to však je u verze bez lokality. Zde je evidentní, že mnohem více na podstránky s “praha” v URL vede Google výsledky u non-brand frází:
Zatímco poměr brand/non-brand je 30:70, v případě poměru URL s “praha” je to 16:84 ve prospěch slov non-brand.
Podstránky lokality – průměrná délka URL
Následně se podívejme na průměrnou délku URL. Teoreticky čím delší URL cílové stránky za doménou (https://www.example.com/tuto-delku-url-merime), tím spíše Google odkazuje na podstránky než na hlavní stránku.
Google u domén, které se vyskytovaly v obou datasetech odkazuje na URL s výrazně vyšším průměrným počtem znaků než u domén, které se do obou výsledkových datasetů nedostaly.
Hypotéza H2 je potvrzena, lépe se umisťují weby s připravenou přistávací stránkou na danou lokalitu.
Zdeněk Dvořák (linki.cz) zde správně zmiňuje pochybnost, že delší url = podstránka lokality. Pojďme se tedy podívat na náhodně vybraných 30 URL domén, které se vyskytují v obou datasetech.
Podívali jsme se tedy na stejný vyhledávací dotaz, stejnou doménu a posoudili přistávací stránku (URL) ve verzi datasetu s lokalitou a pak bez. Vždy jsme se podívali na cílové stránky a posoudili, zda-li zde hypotéza 2 platí, tedy že u datasetu ve verzi s lokalitou bude Google upřednostňovat podstránku vytvořenou pro lokalitu.
Výsledky je možné vidět zde:
https://docs.google.com/spreadsheets/d/1ksOi1K4xmI3v44XuNznUEBkSuy0xEYsVSw7fX6gKcwE/edit?usp=sharing#gid=1251502434
Pokud je evidentní, že Google upřednostňuje podstránky pro lokalitu v datasetu s lokalitou, dali jsme 1. Pokud to evidentní nebylo, případně to nevypadalo ani v jednom případě na podstránku věnovanou ani okrajově lokalitu, dali jsme 0.
Protože první test vyšel 50:50, udělali jsme pro jistotu ještě další 2 testy. Pouze ve dvou případech z 90 Google vrátil ve verzi bez lokality lokalizačně upravenou stránku než v případě verze s lokalitou.
Převažuje tedy výsledek, který potvrzuje naše tvrzení, že delší URL = stránka věnovaná lokalitě. Tedy statisticky.
Zároveň mají URL ve verzi s lokalitou vyšší průměrný počet znaků. Tím lze usuzovat, že Google odkazuje na hlouběji zanořené podstránky, tedy ty s lokalitou:
Hypotéza H3 je potvrzena, tedy Google v případě specifikace lokality přímo v hledaném dotazu upřednostňuje podstránky připravené pro danou lokalitu.
Zmínění lokality na cílové stránce
Kompletní výsledkovou tabulku najdete na listu “SERP s lokalitou – “praha” na cílové stránce”.
https://docs.google.com/spreadsheets/d/1ksOi1K4xmI3v44XuNznUEBkSuy0xEYsVSw7fX6gKcwE/edit#gid=0
V tomto testu nás zajímalo, jak moc je zastoupena fráze “praha” a různé skloňované verze (praze, pražský, atp.) na cílových stránkách, které se objevily v datasetu s lokalitou.
Celkem jsme analyzovali 7306 výsledků. Z výsledků je patrné, že vyšší zastoupení tohoto slova na stránce obecně přispívá k lepším pozicím:
AVG all ratio znamená procentuální podíl slova “praha” ke všem slovům na stránce (včetně hlavičky a meta tagů).
Nicméně nejzajímavější výsledek vyšel u porovnání slova “praha” k celkovému textu stránky (tedy bez metadat v hlavičce či tazích):
Z toho by se dalo usuzovat, že šanci na přední příčky mají jednoznačně weby, které připraví přistávací stránku pro danou lokalitu a dají nadevší pochybnost najevo, že jsou v této lokalitě přítomni a aktivní. Nebojí se přitom hodněkrát použít město přímo v textu stránky, neschovávají ho jen do metadat (title odkazu, alt obrázku apod.).
Rozdělíme-li výrazy na brand/non-brand pak je zřejmé, že se takto chovají hlavně non-brand výrazy:
Pokud nad tím popřemýšlíme, je to logické. U brand výrazů Google ví, že jde hlavně o značku a bude tedy upřednostňovat hlavní domény těchto značek, které nepotřebují být tak silně optimalizované na tyto slova. Na dalších příčkách se potom objevují různé agregátory a srovnávače, které de facto na těchto značkách “parazitují” a snaží se dostat na daný lokální výraz co nejvýše.
Naproti tomu u non-brand výrazů musí stránky mezi sebou opravdu soutěžit kvalitou vstupní stránku ve vztahu k danému výrazu s lokalitou.
Počet slov na cílové stránce
Z průzkumu je patrný ještě jeden zajímavý (ačkoliv ne překvapivý) výsledek:
Je vidět, že na předních pozicích se objevují weby, které mají průměrně vyšší bohatost obsahu (spíše délku textu, chcete-li). Zejména je toto patrné u non-brand vyhledávacích dotazů.
Ahrefs data
Kompletní výsledkovou tabulku najdete na listu “SERP s Ahrefs daty”.
https://docs.google.com/spreadsheets/d/1ksOi1K4xmI3v44XuNznUEBkSuy0xEYsVSw7fX6gKcwE/edit#gid=1652869907
U brandových KW je patrné, že vítězí stránky s vyššími Ahrefs metrikami na danou konkrétní stránku (URL).
Zvýrazněné hodnoty prvních 6 sloupců:
- AVERAGE of Backlinks to URL (Ahrefs)
- MEDIAN of Backlinks to URL (Ahrefs)
- AVERAGE of Linking domains to URL (Ahrefs)
- MEDIAN of Linking domains to URL (Ahrefs)
- AVERAGE of URL rating (Ahrefs)
- MEDIAN of URL rating (Ahrefs)
U non-brand výrazů je také znát vliv odkazů na konkrétní URL, ale mnohem více je zřetelná celková síla domény (domain rating):
Zvýrazněné sloupce jsou:
- AVERAGE of Domain Rating (Ahrefs)
- MEDIAN of Domain Rating (Ahrefs)
Co si z průzkumu odnést
- Google stále není vševědoucí – vytvářejte podstránky poboček
- Neskrblete na obsahu stránek poboček
(delší = statisticky lepší, ale pozor na smysluplnost!) - Výše zmíněné platí hlavně když nemáte brand
- Domain rating se počítá!
BEST PRACTICE:
https://digichef.cz/best-practice-pro-lokalni-seo