Společnost Google používá automatizované systémy řazení, které zohledňují mnoho faktorů a signálů o stovkách miliard webových stránek a dalšího obsahu v našem indexu vyhledávání, aby mohla během zlomku sekundy zobrazit nejrelevantnější a nejužitečnější výsledky.
Tyto systémy jsou pravidelně vylepšovány pomocí důkladného testování a vyhodnocování a upozorňují na aktualizace systémů řazení, pokud by mohly být užitečné pro tvůrce obsahu a další uživatele.
Tato stránka je průvodcem pro pochopení některých našich nejvýznamnějších systémů řazení. Zahrnuje některé systémy, které jsou součástí našich hlavních systémů řazení, což jsou základní technologie, které vytvářejí výsledky vyhledávání v reakci na dotazy. Zahrnuje také některé systémy zapojené do specifických potřeb řazení.
Můžete také navštívit stránku Jak funguje vyhledávání, kde se dozvíte, jak systémy řazení v kombinaci s dalšími procesy spolupracují, aby vyhledávání Google plnilo naše poslání uspořádat informace na světě a učinit je všeobecně dostupnými a užitečnými.
BERT
Bidirectional Encoder Representations from Transformers (BERT) je systém umělé inteligence používaný společností Google, který umožňuje pochopit, jak kombinace slov vyjadřují různé významy a záměry.
Krizové informační systémy
Společnost Google vyvinula systémy pro poskytování užitečných a včasných informací v krizových situacích, ať už se jedná o osobní krizové situace, přírodní katastrofy nebo jiné rozsáhlé krizové situace:
- Osobní krize: Systémy pracují na tom, aby pochopily, kdy lidé hledají informace o osobních krizových situacích, a zobrazily linky důvěry a obsah důvěryhodných organizací pro určité dotazy týkající se sebevraždy, sexuálního napadení, požití jedu, násilí na základě pohlaví nebo drogové závislosti. Další informace o tom, jak se ve vyhledávání Google zobrazují informace o osobních krizích.
- Upozornění SOS: V době přírodních katastrof nebo rozsáhlých krizových situací funguje systém SOS Alerts, který zobrazuje aktuální informace od místních, národních nebo mezinárodních orgánů. Tyto aktualizace mohou obsahovat nouzová telefonní čísla a webové stránky, mapy, překlady užitečných frází, možnosti dárcovství a další informace. Přečtěte si více informací o tom, jak systém SOS Alerts funguje a jak je součástí krizových výstrah společnosti Google, které pomáhají v době povodní, požárů, zemětřesení, hurikánů a dalších katastrof.
Deduplikační systémy
Vyhledávání ve službě Google může najít tisíce nebo dokonce miliony odpovídajících webových stránek. Některé z nich si mohou být velmi podobné. V takových případech systémy zobrazují pouze nejrelevantnější výsledky, aby nedocházelo k neužitečné duplicitě. Přečtěte si více o tom, jak funguje deduplikace a jak v případě potřeby zobrazit vynechané výsledky, když dojde k deduplikaci.
K deduplikaci dochází také u doporučených úryvků. Pokud je výpis webové stránky povýšen na doporučený úryvek, Google ho neopakuje později na první stránce výsledků. Tím se zmenší počet výsledků a lidé snáze najdou relevantní informace.
Systém přesné shody domén
Systémy hodnocení zohledňují slova v názvech domén jako jeden z mnoha faktorů, podle kterých se určuje, zda je obsah relevantní pro vyhledávání. Systém přesné shody domén však funguje tak, aby bylo zajištěno, že obsah umístěný pod doménami navrženými tak, aby přesně odpovídal konkrétním dotazům, nebude příliš hodnocen. Někdo by například mohl vytvořit název domény „best-places-to-eat-lunch“ v naději, že všechna tato slova v názvu domény posunou obsah vysoko v žebříčku. Google systém se tomu přizpůsobuje.
Systémy „čerstvosti“
Google má různé systémy, které jsou navrženy tak, aby zobrazovaly čerstvější obsah pro dotazy, u kterých jej uživatelé vyžadují. Pokud například někdo hledá informace o filmu, který byl právě uveden do kin, pravděpodobně chce spíše nejnovější recenze než starší články z doby, kdy se začalo s výrobou. Jiným příkladem je, že běžné vyhledávání „zemětřesení“ může přinést obecné informace o zemětřesení, co jej způsobuje a jak se na něj připravit. Pokud však k zemětřesení došlo nedávno, mohou se objevit články o novinkách a aktuální obsah.
Užitečný systém obsahu
Systém užitečného obsahu je navržen tak, aby se ve výsledcích vyhledávání zobrazoval originální a užitečný obsah psaný lidmi a pro lidi, a nikoli obsah vytvořený primárně za účelem získání návštěvnosti z vyhledávačů.
Systémy analýzy odkazů a PageRank
Různé systémy chápou vzájemné odkazy mezi stránkami jako způsob, jak určit, o čem stránky jsou a které by mohly být nejpřínosnější v odpovědi na dotaz. Mezi ně patří PageRank, jeden ze základních systémů řazení Google, který se používal při prvním spuštění služby Google. Zájemci se mohou dozvědět více, když si přečtou původní výzkumnou práci a patent PageRank. Od té doby se fungování PageRanku hodně vyvinulo a je nadále součástí základních systémů řazení.
Místní zpravodajské systémy
Google má systémy, které fungují tak, že identifikují a zobrazují místní zdroje zpráv, kdykoli je to relevantní, například prostřednictvím funkcí Top stories a Local news.
MUM
Multitask Unified Model (MUM) je systém umělé inteligence, který je schopen porozumět jazyku a zároveň jej generovat. V současné době se nepoužívá k obecnému řazení ve vyhledávání, ale spíše k některým konkrétním aplikacím, například ke zlepšení vyhledávání informací o vakcíně COVID-19 a k vylepšení Googlem zobrazovaných featured snippetů.
Neural matching
Neural matching je systém umělé inteligence, který Google používá k pochopení reprezentace pojmů v dotazech a stránkách a jejich vzájemnému porovnávání.
Originální obsahové systémy
Google má systémy, které pomáhají zajistit, aby se ve výsledcích vyhledávání zobrazoval výhradně původní obsah včetně původních zpráv před těmi, které je pouze citují. Patří sem podpora speciálního kanonického značení, které tvůrci mohou použít, aby Google lépe pochopil, která stránka je primární, pokud byla stránka duplikována na několika místech.
Systémy degradací na základě vyřazení
Google má zásady, které umožňují odstraňování určitých typů obsahu. Pokud zpracovává velké množství takových odstranění týkajících se určitého webu, používá to jako signál ke zlepšení výsledků vyhledávání. Jedná se zejména o následující případy:
- Právní odstranění: Pokud Google obdrží vysoký počet platných žádostí o odstranění autorských práv týkajících se daného webu, může to využít k tomu, aby ve výsledcích degradoval jiný obsah z tohoto webu. Pokud se tedy na webu nachází jiný obsah porušující autorská práva, je méně pravděpodobné, že se s ním lidé setkají oproti původnímu obsahu. Podobné signály o degradování používá Google u stížností týkajících se pomluv, padělaného zboží a soudem nařízených odstranění.
- Odstranění osobních údajů: Pokud Google zpracovává velké množství odstranění osobních údajů, která se týkají webu se zneužívajícími praktikami, degraduje ve výsledcích další obsah z tohoto webu. Zjišťuje také, zda se stejný vzorec chování nevyskytuje i na jiných webech, a pokud ano, uvalí penalizaci na obsah těchto webů. Podobné postupy degradace může použít u webů, u kterých dochází k velkému množství odstraňování obsahu s doxxingem. Kromě toho má automatické ochrany navržené tak, aby zabránily tomu, aby se explicitní osobní obrázky bez souhlasu umisťovaly vysoko v odpovědích na dotazy zahrnující jména.
Passage ranking systém
Passage ranking je systém umělé inteligence, který Google používá k identifikaci jednotlivých částí nebo „pasáží“ webové stránky, aby lépe pochopil, jak je stránka relevantní pro vyhledávání.
RankBrain
RankBrain je systém AI, který pomáhá pochopit, jak slova souvisejí s pojmy. To znamená, že díky pochopení toho, že obsah souvisí s jinými slovy a pojmy, může Google lépe vracet relevantní obsah, i když neobsahuje všechna přesná slova použitá ve vyhledávání.
Spolehlivé informační systémy
Několik systémů pracuje různými způsoby, aby zobrazovaly co nejspolehlivější informace, například pomáhají zobrazovat autoritativnější stránky a degradovat nekvalitní obsah nebo vyzdvihovat kvalitní žurnalistiku. V případech, kdy mohou spolehlivé informace chybět, systémy automaticky zobrazují upozornění na obsah rychle se měnících témat nebo když systémy nemají vysokou důvěru v celkovou kvalitu výsledků dostupných pro vyhledávání. Ty poskytují rady, jak vyhledávat způsobem, který by mohl vést k užitečnějším výsledkům. Přečtěte si další informace o přístupu k poskytování vysoce kvalitních informací ve vyhledávání.
Systém recenzí
Cílem systému recenzí je lépe ocenit kvalitní recenze, tedy obsah, který poskytuje hlubokou analýzu a originální výzkum a je napsán odborníky nebo nadšenci, kteří dané téma dobře znají.
Systém rozmanitosti stránek
Systém diverzity stránek funguje tak, že v nejlepších výsledcích zpravidla nezobrazujeme více než dva výpisy webových stránek z jednoho webu, takže žádný web nemá tendenci dominovat všem nejlepším výsledkům. Přesto však Google může zobrazit více než dva výpisy v případech, kdy systém určí, že je to pro konkrétní vyhledávání obzvláště důležité. Diverzita stránek obecně považuje subdomény za součást kořenové domény, tj. výpisy ze subdomény (subdomain.example.com) a kořenové domény (example.com) budou považovány za výpisy z jednoho webu. Někdy se však subdomény pro účely diverzity považují za samostatné weby, pokud je to považováno za relevantní.
Systémy detekce spamu
Nikdo nechce, aby se jeho e-mailová schránka zaplnila spamem, a proto jsou filtry proti spamu tak užitečné. Vyhledávání čelí podobnému problému, protože internet obsahuje obrovské množství spamu, který by Googlu v případě, že by se s ním nevypořádal, znemožnil zobrazit co nejužitečnější a nejrelevantnější výsledky. Proto používá řadu systémů pro detekci spamu, včetně SpamBrain, abychom se vypořádal s obsahem a chováním, které porušují zásady pro spam. Tyto systémy jsou neustále aktualizovány, aby držely krok s nejnovějšími způsoby, kterými se hrozba spamu vyvíjí.
Vysloužilé systémy
Níže uvedené systémy jsou uvedeny pro lepší přehled. Dříve fungovaly, ale postupem času byly buď začleněny do nástupnických systémů, nebo se staly součástí základních systémů hodnocení.
Hummingbird
Jednalo se o zásadní vylepšení celkových systémů řazení provedené v srpnu 2013. Od té doby se systémy hodnocení Google dále vyvíjely, stejně jako se vyvíjely již dříve.
Systém Panda
Jednalo se o systém, který měl lépe zajistit, aby se ve výsledcích našeho vyhledávání zobrazoval kvalitní a originální obsah. Byl oznámen v roce 2011 a dostal přezdívku „Panda“, v roce 2015 se vyvinul a stal se součástí našich hlavních systémů řazení.
Systém Penguin
Jednalo se o systém určený k boji proti odkazovému spamu. Byl oznámen v roce 2012 a dostal přezdívku „Penguin Update“ a v roce 2016 se stal součástí hlavních systémů řazení Google.
Pokud vás zajímá Google vyhledávání přečtěte si také článek Podrobný průvodce fungováním vyhledávání Google, kde se dozvíte podrobnosti o procházení, indexování i výsledcích vyhledávání.
Více pro PageRank a S-rank se dočtete v článku Google Page Rank a S-rank z hlediska SEO.
Překlad, odborná a obsahová korektura: SEOPRAKTICKY.CZ
Použité zdroje
- A guide to Google Search ranking systems | Google Search Central | Documentation | Google Developers. Google Developers [online]. Dostupné z: https://developers.google.com/search/docs/appearance/ranking-systems-guide