Noindex: co znamená zákaz indexace a kdy jej použít
Noindex je pokyn pro vyhledávače, aby konkrétní URL neindexovali a tedy ji nezobrazovali ve výsledcích vyhledávání. Je to přesný a poměrně rychlý způsob, jak vyloučit obsah z organického vyhledávání bez nutnosti odstraňovat stránku z webu či blokovat přístup robotům. V moderním SEO (včetně AIO/AEO – optimalizace pro odpověďové systémy a agenty) je správné použití noindexu klíčové pro udržení „čistého“ indexu a řízení viditelnosti nízkohodnotového nebo citlivého obsahu.
Jak noindex funguje: zásada „mohu přečíst, ale neuložím“
Vyhledávač musí mít možnost stránku přečíst, aby zjistil, že obsahuje noindex. Proto se noindex téměř vždy kombinuje s tím, že neblokujete URL v robots.txt. Pokud byste robotovi přístup zakázali, k pokynu noindex by se nedostal. Po zjištění noindexu vyhledávač URL z indexu odstraní nebo ji tam vůbec nepřidá.
Způsoby implementace noindex
Existují dva hlavní způsoby, jak vyhledávačům oznámit noindex – meta tag v HTML a HTTP hlavička. Obě řešení mohou fungovat pro HTML i pro jiné typy souborů (přes hlavičku).
- Meta robots v HTML – vložené do
<head>:
<meta name="robots" content="noindex, follow">
- X-Robots-Tag v HTTP odpovědi – vhodné pro PDF, obrázky, soubory ke stažení nebo pokud nemáte kontrolu nad HTML šablonou:
X-Robots-Tag: noindex, follow
Obě formy podporují i cílení na konkrétního robota (např. googlebot, bingbot):
<meta name="googlebot" content="noindex, follow"> X-Robots-Tag: googlebot: noindex, follow
„noindex, follow“ vs. „noindex, nofollow“ a co se děje s odkazy
Kombinace noindex, follow způsobí, že samotná stránka nebude v indexu, ale vyhledávač může následovat odkazy na ní. Prakticky to pomáhá zachovat přelévání signálů do dalších stránek. U dlouhodobě noindexovaných URL však některé vyhledávače mohou odkazy časem ignorovat, pokud URL téměř nikdy neprochází re-crawlem. noindex, nofollow je přísnější režim, který explicitně žádá ignorovat i odkazy – používá se výjimečně (např. dočasně při silném spamovém riziku na stránce s UGC).
Noindex a robots.txt: častý omyl
Robots.txt nezná direktivu noindex a neměl by se používat k vyloučení z indexu. Je to soubor pro řízení přístupu robotů, nikoli pro řízení indexace. Pokud zablokujete URL v robots.txt, robot se k noindex meta/hlavičce nedostane – výsledek může být paradoxně opačný (URL se v indexu objeví bez obsahu, pouze jako odkaz bez snippetů). Proto doporučení zní: pokud chcete stránku z výsledků odstranit, použijte noindex (meta/hlavička) a URL neblokujte v robots.txt.
Noindex a kanonikalizace: co má přednost
rel="canonical" navrhuje preferovanou URL pro indexaci. Noindex je direktivní pokyn; pokud stránka obsahuje noindex a zároveň ukazuje kanonikal na jinou URL, vyhledávač obvykle respektuje noindex pro danou stránku a může indexovat kanonickou cílovou URL (pokud ta noindex nemá). Nespoléhejte se však na kanonikal jako náhradu za noindex – jsou to odlišné nástroje pro rozdílné účely.
Noindex a „indexifembedded“: speciální případ pro embedded obsah
Stránka může mít noindex, ale povolit indexaci svého vloženého obsahu, pokud je zobrazen přes <iframe> na jiné stránce, pomocí direktivy indexifembedded. Použití:
<meta name="robots" content="noindex, indexifembedded">
Toto je užitečné pro widgety a komponenty, které samy o sobě nemají samostatnou hodnotu jako samostatná stránka, ale mají význam, když jsou vloženy jinde.
Typická použití noindex v praxi
- Interní vyhledávání a „thin“ stránky filtrů (faceted navigation), které generují duplicity nebo nekvalitní kombinace parametrů.
- Staging/preview prostředí, testovací URL, A/B varianty bez produkční relevance.
- Citlivý obsah (neverejná oznámení, dočasné informace, právní dokumenty) – pokud nechcete indexaci, ale zároveň nechcete autorizaci.
- Košík, checkout, účet a další transakční kroky, kde indexace nepřináší hodnotu a může uživatele mást.
- Stránky s nízkou přidanou hodnotou (tagy, archivy, stránkování), pokud nezvládáte jejich kvalitní zpracování.
Noindex v kontextu AIO/AEO a „odpověďových“ systémů
Agentní a odpověďové systémy (ChatGPT/LLM vyhledávání, Answer Engines) si často budují vlastní indexy a signály. Noindex snižuje šum, zlepšuje návaznost interních odkazů a pomáhá soustředit „pozornost“ na obsah, který má být reprezentativní v odpovědích. V kombinaci s kvalitní strukturou (Schema.org), E-E-A-T a rychlostí (Core Web Vitals) podporuje vyšší přesnost extrakce faktů a citací.
Implementační vzory podle typu obsahu
- HTML stránky: do šablony
<head>vložte<meta name="robots" content="noindex, follow">a zajistěte, aby se renderoval již v prvotním HTML (ne až po JS hydrataci). - PDF/obrázky/soubory: nastavte hlavičku
X-Robots-Tag: noindexna serveru (Apache/Nginx/CDN) pro konkrétní cesty nebo patterny. - Parametrické URL: u nežádoucích kombinací parametrů použijte noindex (nebo generujte canonical na čistou verzi) a zvažte i zapouzdření filtrů do hashe (pokud nevyžadujete indexaci).
Konfigurace na serveru a v CDN: příklady
Apache (.htaccess):
<FilesMatch ".(pdf|docx)$"> Header set X-Robots-Tag "noindex, noarchive" </FilesMatch>
Nginx:
location ~* .(pdf|docx)$ { add_header X-Robots-Tag "noindex, noarchive"; }
HTTP na úrovni CDN: vytvořte pravidla podle URL patternu (např. /preview/*) a přidejte hlavičku X-Robots-Tag.
Interakce s dalšími direktivami a meta tagy
- noarchive: zabraňuje zobrazení „cached“ verze. Doplnit tam, kde nechcete archivní kopie.
- nosnippet / max-snippet: kontrola ukázek (snippets). Neovlivňuje indexaci, ale prezentaci výsledku – u noindex to nemá význam, ale při dočasném nasazení může být užitečné.
- unavailable_after: datum, po kterém se stránka nemá zobrazovat. Praktické u časově omezených nabídek.
- noimageindex: zabraňuje indexaci obrázků dané stránky ve vyhledávání obrázků.
Nejčastější chyby při nasazování noindexu
- Blokování v robots.txt současně s nasazením noindex – robot se k pokynu nedostane.
- Opožděné vkládání meta tagu přes JavaScript – prohlížeč/robot ho nemusí spolehlivě zaznamenat při prvním crawlu.
- Konfliktní signály:
noindex+ snaha o bohaté úryvky (FAQ/HowTo). Pokud stránku nechcete indexovat, neřešte pro ni rich výsledky. - Náhodné zdědění v šabloně – globální layout s noindex, který se přenese na celý web (kritická chyba). Přidejte testy/CI kontrolu.
- Trvalý noindex na důležité URL – po nasazení zapomenutý flag (např. při přechodu z testu do produkce).
Monitorování a QA: jak ověřit, že noindex funguje
- Kontrola zdrojového kódu: zkontrolujte, že meta tag je v
<head>a není přepsán jinou značkou. - HTTP hlavičky: ověřte odpověď serveru (curl, devtools „Network“), zda obsahuje
X-Robots-Tag. - Logy a RUM: sledujte crawlovací aktivitu botů na noindex URL – měla by probíhat, ale indexace by měla mít trend k nule.
- Search Console/Bing Webmaster: stav indexace, případná varování, živé testy URL.
Čas do odstranění z indexu a reindexace po zrušení noindexu
Odstranění z výsledků není okamžité – závisí na frekvenci crawlu a signálech důležitosti URL. Po odstranění nebo po zrušení noindexu je vhodné podpořit re-crawl interním prolinkováním, pingem sitemap a případně manuálním požadavkem na reindexaci. Během přechodného období se může URL krátce zobrazovat bez popisu (pouze jako odkaz), než se stav ustálí.
Alternativy k noindex: kdy sáhnout po jiných nástrojích
- Autentifikace/Autorizace: pokud stránku nemá vidět nikdo bez přístupu, chraňte ji heslem a nenahrazujte to noindexem.
- HTTP 410/404: pokud je obsah trvale odstraněn, je lepší vrátit stav 410 (Gone) nebo 404 (Not Found) místo noindexu.
- Canonical: u duplicit, kde má existovat pouze jedna indexovaná verze, upřednostněte kanonikalizaci; noindex používejte spíše na „nechtěné“ varianty bez hodnoty.
Specifika pro JavaScriptové frameworky a dynamické renderování
Ujistěte se, že noindex je v HTML již na první byte (SSR/SSG nebo edge render). Injekce meta tagu po hydrataci může přijít pozdě. U SPA zvažte serverové renderování kritických šablon, aby robot spolehlivě viděl direktivy.
Checklist pro bezpečné nasazení noindexu
- URL není blokována v
robots.txt(alespoň do doby, než se z indexu odstraní). - Meta/hlavička s noindex se zobrazuje konzistentně na všech variantách (http/https, www/non-www, s/bez trailing slasha, s kampanovými parametry).
- V CI je test, který selže, pokud se noindex objeví na „money“ šablonách.
- Po zrušení noindexu je nasazen re-crawl trigger (aktualizovaná sitemap, interní odkazy, fetch).
Příklady správného a nesprávného použití
Správně: interní vyhledávání (/search?q=...) má noindex, follow, ale není blokováno v robots.txt; PDF s ceníkem pro B2B partnery má X-Robots-Tag: noindex, noarchive.
Špatně: celá sekce /blog/ je omylem noindexová; nebo filtr ?color=red je v robots.txt zakázán a zároveň na stránce meta noindex – robot se k pokynu nedostane.
Shrnutí
Noindex je přesný nástroj kontroly indexace: umožní robotům stránku projít, ale zabrání jejímu zařazení do výsledků. Implementujte jej buď přes <meta name="robots" content="noindex, (no)follow"> v HTML, nebo přes X-Robots-Tag v HTTP odpovědi (ideálně pro ne-HTML zdroje). Vyhněte se kombinaci s blokováním v robots.txt, sledujte stav v nástrojích pro správce a mějte CI/QA ochrany proti nechtěnému nasazení. Správné použití noindexu čistí index, zlepšuje informační architekturu a zvyšuje kvalitu signálů v SEO i v AIO/AEO ekosystémech.