Pomocí nástroje Feedfetcher vyhledává Google kanály RSS nebo Atom pro služby Google Podcasts, Google News a PubSubHubbub. Feedfetcher ukládá a pravidelně obnovuje kanály, které si vyžádají uživatelé aplikace nebo služby. Ve vyhledávání Google se indexují pouze kanály podcastů; pokud však kanál nedodržuje specifikaci Atom nebo RSS, může být přesto indexován. Zde jsou odpovědi na nejčastěji kladené otázky týkající se fungování tohoto uživatelem řízeného grabování kanálů.
Jak mohu požádat, aby Google nestahoval některé nebo všechny kanály mého webu?
Když uživatelé přidají službu nebo aplikaci, která využívá data Feedfetcheru, pokusí se Feedfetcher Google získat obsah kanálu, aby jej mohl zobrazit. Vzhledem k tomu, že požadavky Feedfetcheru pocházejí z výslovné akce lidských uživatelů, nikoli z automatických procházení, Feedfetcher se neřídí pokyny robots.txt.
Pokud je váš feed veřejně dostupný, Google nemůže uživatelům omezit přístup k němu. Jedním z řešení je nakonfigurovat web tak, aby uživatelskému agentovi Feedfetcher-Google zobrazoval chybové stavové hlášení 404, 410 nebo jiné.
Pokud je váš kanál poskytován službou hostingu blogu nebo webu, spolupracujte na omezení přístupu k vašemu kanálu přímo s touto službou.
Jak často bude Feedfetcher načítat mé kanály?
Feedfetcher by neměl načítat kanály z většiny webů v průměru častěji než jednou za hodinu. Některé často aktualizované weby mohou být obnovovány častěji. Google však upozorňuje, že kvůli zpoždění sítě se může stát, že Feedfetcher bude krátce načítat vaše kanály častěji.
Proč se Feedfetcher snaží stáhnout nesprávné odkazy z mého serveru nebo z neexistující domény?
Feedfetcher načítá kanály na žádost služeb nebo aplikací nainstalovaných uživateli. Je možné, že si uživatel vyžádal adresu URL kanálu, která neexistuje.
Proč Feedfetcher stahuje informace z mého „tajného“ webového serveru?
Feedfetcher stahuje kanály na žádost služeb nebo aplikací nainstalovaných uživateli. Je možné, že požadavek přišel od uživatele, který o vašem „tajném“ serveru ví nebo jej zadal omylem.
Proč Feedfetcher nedodržuje můj soubor robots.txt?
Feedfetcher načítá kanály pouze poté, co uživatelé výslovně spustí službu nebo aplikaci, která požaduje data z kanálu. Feedfetcher se tedy chová jako přímý zástupce lidského uživatele, nikoli jako robot, takže ignoruje záznamy v souboru robots.txt. Vzhledem k tomu, že Feedfetcher jedná jako agent pro více uživatelů, šetří šířku pásma tím, že požadavky na společné kanály provádí pouze jednou pro všechny uživatele, kteří si kanál vyžádali prostřednictvím aplikace nebo služby. Mezi běžné kanály patří RSS a Atom.
Můžete zabránit tomu, aby Feedfetcher procházel vaše stránky, a to tak, že nakonfigurujete svůj server tak, aby uživatelskému agentovi Feedfetcher-Google zobrazoval zprávy o chybovém stavu 404, 410 nebo jiné.
Proč jsou na Google.com návštěvy z více počítačů, všechny s agentem uživatele Feedfetcher?
Služba Feedfetcher byla navržena tak, aby byla distribuována na několika strojích a zlepšila tak výkon a škálování při růstu webu. Aby se snížila spotřeba šířky pásma, jsou často použité stroje umístěné v blízkosti webů, které v síti načítají.
Můžete mi sdělit IP adresy, ze kterých Feedfetcher odesílá požadavky, abych mohl filtrovat protokoly?
IP adresy používané službou Feedfetcher se čas od času mění. Nejlepším způsobem, jak identifikovat požadavky Feedfetcheru, je vyhledat jeho uživatelského agenta Feedfetcher-Google.
Proč Feedfetcher stahuje stejnou stránku na mém webu vícekrát?
Obecně platí, že Feedfetcher během daného načtení kanálu stáhne z vašeho webu pouze jednu kopii každého souboru. Velmi občas se stává, že se stroje zastaví a znovu spustí, což může způsobit, že znovu načte stránky, které nedávno navštívil.
Jaké druhy odkazů Feedfetcher sleduje?
Na rozdíl od běžných webových crawlerů Feedfetcher odkazy vůbec nesleduje; místo toho sleduje požadavky, které mu zadávají uživatelé služby nebo aplikace, která Feedfetcher používá.
Moje otázka na Feedfetcher zde není zodpovězena. Kde mohu získat další nápovědu?
Pokud máte stále potíže, zkuste svůj dotaz položit ve fóru Search Central.
Překlad, odborná a obsahová korektura: SEOPRAKTICKY.CZ
Použité zdroje
- Google Feedfetcher | Google Search Central | Documentation | Google for Developers. Google for Developers – from AI and Cloud, to Mobile and Web [online]. Dostupné z: https://developers.google.com/search/docs/crawling-indexing/feedfetcher
Související články
Procházení a indexování
- Mapy stránek
- Správa crawlingu
- Požádejte Google, aby znovu prohledal vaše adresy URL
- Snížení rychlosti procházení Googlebotem
- Ověřování Googlebot a dalších crawlerů Google
- Průvodce majitele velkého webu pro správu rozpočtu na procházení (crawling)
- Jak stavové kódy HTTP a chyby sítě a DNS ovlivňují vyhledávání Google
- Google crawlers
- Robots.txt
- Kanonizace
- Mobilní web a indexování podle mobilních zařízení
- AMP
- JavaScript
- Metadata stránek a obsahu
- Odstranění
- Přesuny a změny webu
Ranking a možnosti zobrazení ve výsledku vyhledávání
Monitorování a odstraňování chyb
Průvodce pro konkrétní stránky