Noindex: zákaz indexace stránky ve vyhledávačích

Noindex: co znamená zákaz indexace a kdy jej použít

Noindex je pokyn pro vyhledávače, aby konkrétní URL neindexovali a tedy ji nezobrazovali ve výsledcích vyhledávání. Je to přesný a poměrně rychlý způsob, jak vyloučit obsah z organického vyhledávání bez nutnosti odstraňovat stránku z webu či blokovat přístup robotům. V moderním SEO (včetně AIO/AEO – optimalizace pro odpověďové systémy a agenty) je správné použití noindexu klíčové pro udržení „čistého“ indexu a řízení viditelnosti nízkohodnotového nebo citlivého obsahu.

Jak noindex funguje: zásada „mohu přečíst, ale neuložím“

Vyhledávač musí mít možnost stránku přečíst, aby zjistil, že obsahuje noindex. Proto se noindex téměř vždy kombinuje s tím, že neblokujete URL v robots.txt. Pokud byste robotovi přístup zakázali, k pokynu noindex by se nedostal. Po zjištění noindexu vyhledávač URL z indexu odstraní nebo ji tam vůbec nepřidá.

Způsoby implementace noindex

Existují dva hlavní způsoby, jak vyhledávačům oznámit noindex – meta tag v HTML a HTTP hlavička. Obě řešení mohou fungovat pro HTML i pro jiné typy souborů (přes hlavičku).

  • Meta robots v HTML – vložené do <head>:
<meta name="robots" content="noindex, follow">
  • X-Robots-Tag v HTTP odpovědi – vhodné pro PDF, obrázky, soubory ke stažení nebo pokud nemáte kontrolu nad HTML šablonou:
X-Robots-Tag: noindex, follow

Obě formy podporují i cílení na konkrétního robota (např. googlebot, bingbot):

<meta name="googlebot" content="noindex, follow"> X-Robots-Tag: googlebot: noindex, follow

„noindex, follow“ vs. „noindex, nofollow“ a co se děje s odkazy

Kombinace noindex, follow způsobí, že samotná stránka nebude v indexu, ale vyhledávač může následovat odkazy na ní. Prakticky to pomáhá zachovat přelévání signálů do dalších stránek. U dlouhodobě noindexovaných URL však některé vyhledávače mohou odkazy časem ignorovat, pokud URL téměř nikdy neprochází re-crawlem. noindex, nofollow je přísnější režim, který explicitně žádá ignorovat i odkazy – používá se výjimečně (např. dočasně při silném spamovém riziku na stránce s UGC).

Noindex a robots.txt: častý omyl

Robots.txt nezná direktivu noindex a neměl by se používat k vyloučení z indexu. Je to soubor pro řízení přístupu robotů, nikoli pro řízení indexace. Pokud zablokujete URL v robots.txt, robot se k noindex meta/hlavičce nedostane – výsledek může být paradoxně opačný (URL se v indexu objeví bez obsahu, pouze jako odkaz bez snippetů). Proto doporučení zní: pokud chcete stránku z výsledků odstranit, použijte noindex (meta/hlavička) a URL neblokujte v robots.txt.

Noindex a kanonikalizace: co má přednost

rel="canonical" navrhuje preferovanou URL pro indexaci. Noindex je direktivní pokyn; pokud stránka obsahuje noindex a zároveň ukazuje kanonikal na jinou URL, vyhledávač obvykle respektuje noindex pro danou stránku a může indexovat kanonickou cílovou URL (pokud ta noindex nemá). Nespoléhejte se však na kanonikal jako náhradu za noindex – jsou to odlišné nástroje pro rozdílné účely.

Noindex a „indexifembedded“: speciální případ pro embedded obsah

Stránka může mít noindex, ale povolit indexaci svého vloženého obsahu, pokud je zobrazen přes <iframe> na jiné stránce, pomocí direktivy indexifembedded. Použití:

<meta name="robots" content="noindex, indexifembedded">

Toto je užitečné pro widgety a komponenty, které samy o sobě nemají samostatnou hodnotu jako samostatná stránka, ale mají význam, když jsou vloženy jinde.

Typická použití noindex v praxi

  • Interní vyhledávání a „thin“ stránky filtrů (faceted navigation), které generují duplicity nebo nekvalitní kombinace parametrů.
  • Staging/preview prostředí, testovací URL, A/B varianty bez produkční relevance.
  • Citlivý obsah (neverejná oznámení, dočasné informace, právní dokumenty) – pokud nechcete indexaci, ale zároveň nechcete autorizaci.
  • Košík, checkout, účet a další transakční kroky, kde indexace nepřináší hodnotu a může uživatele mást.
  • Stránky s nízkou přidanou hodnotou (tagy, archivy, stránkování), pokud nezvládáte jejich kvalitní zpracování.

Noindex v kontextu AIO/AEO a „odpověďových“ systémů

Agentní a odpověďové systémy (ChatGPT/LLM vyhledávání, Answer Engines) si často budují vlastní indexy a signály. Noindex snižuje šum, zlepšuje návaznost interních odkazů a pomáhá soustředit „pozornost“ na obsah, který má být reprezentativní v odpovědích. V kombinaci s kvalitní strukturou (Schema.org), E-E-A-T a rychlostí (Core Web Vitals) podporuje vyšší přesnost extrakce faktů a citací.

Implementační vzory podle typu obsahu

  • HTML stránky: do šablony <head> vložte <meta name="robots" content="noindex, follow"> a zajistěte, aby se renderoval již v prvotním HTML (ne až po JS hydrataci).
  • PDF/obrázky/soubory: nastavte hlavičku X-Robots-Tag: noindex na serveru (Apache/Nginx/CDN) pro konkrétní cesty nebo patterny.
  • Parametrické URL: u nežádoucích kombinací parametrů použijte noindex (nebo generujte canonical na čistou verzi) a zvažte i zapouzdření filtrů do hashe (pokud nevyžadujete indexaci).

Konfigurace na serveru a v CDN: příklady

Apache (.htaccess):

<FilesMatch ".(pdf|docx)$"> Header set X-Robots-Tag "noindex, noarchive" </FilesMatch>

Nginx:

location ~* .(pdf|docx)$ { add_header X-Robots-Tag "noindex, noarchive"; }

HTTP na úrovni CDN: vytvořte pravidla podle URL patternu (např. /preview/*) a přidejte hlavičku X-Robots-Tag.

Interakce s dalšími direktivami a meta tagy

  • noarchive: zabraňuje zobrazení „cached“ verze. Doplnit tam, kde nechcete archivní kopie.
  • nosnippet / max-snippet: kontrola ukázek (snippets). Neovlivňuje indexaci, ale prezentaci výsledku – u noindex to nemá význam, ale při dočasném nasazení může být užitečné.
  • unavailable_after: datum, po kterém se stránka nemá zobrazovat. Praktické u časově omezených nabídek.
  • noimageindex: zabraňuje indexaci obrázků dané stránky ve vyhledávání obrázků.

Nejčastější chyby při nasazování noindexu

  • Blokování v robots.txt současně s nasazením noindex – robot se k pokynu nedostane.
  • Opožděné vkládání meta tagu přes JavaScript – prohlížeč/robot ho nemusí spolehlivě zaznamenat při prvním crawlu.
  • Konfliktní signály: noindex + snaha o bohaté úryvky (FAQ/HowTo). Pokud stránku nechcete indexovat, neřešte pro ni rich výsledky.
  • Náhodné zdědění v šabloně – globální layout s noindex, který se přenese na celý web (kritická chyba). Přidejte testy/CI kontrolu.
  • Trvalý noindex na důležité URL – po nasazení zapomenutý flag (např. při přechodu z testu do produkce).

Monitorování a QA: jak ověřit, že noindex funguje

  • Kontrola zdrojového kódu: zkontrolujte, že meta tag je v <head> a není přepsán jinou značkou.
  • HTTP hlavičky: ověřte odpověď serveru (curl, devtools „Network“), zda obsahuje X-Robots-Tag.
  • Logy a RUM: sledujte crawlovací aktivitu botů na noindex URL – měla by probíhat, ale indexace by měla mít trend k nule.
  • Search Console/Bing Webmaster: stav indexace, případná varování, živé testy URL.

Čas do odstranění z indexu a reindexace po zrušení noindexu

Odstranění z výsledků není okamžité – závisí na frekvenci crawlu a signálech důležitosti URL. Po odstranění nebo po zrušení noindexu je vhodné podpořit re-crawl interním prolinkováním, pingem sitemap a případně manuálním požadavkem na reindexaci. Během přechodného období se může URL krátce zobrazovat bez popisu (pouze jako odkaz), než se stav ustálí.

Alternativy k noindex: kdy sáhnout po jiných nástrojích

  • Autentifikace/Autorizace: pokud stránku nemá vidět nikdo bez přístupu, chraňte ji heslem a nenahrazujte to noindexem.
  • HTTP 410/404: pokud je obsah trvale odstraněn, je lepší vrátit stav 410 (Gone) nebo 404 (Not Found) místo noindexu.
  • Canonical: u duplicit, kde má existovat pouze jedna indexovaná verze, upřednostněte kanonikalizaci; noindex používejte spíše na „nechtěné“ varianty bez hodnoty.

Specifika pro JavaScriptové frameworky a dynamické renderování

Ujistěte se, že noindex je v HTML již na první byte (SSR/SSG nebo edge render). Injekce meta tagu po hydrataci může přijít pozdě. U SPA zvažte serverové renderování kritických šablon, aby robot spolehlivě viděl direktivy.

Checklist pro bezpečné nasazení noindexu

  • URL není blokována v robots.txt (alespoň do doby, než se z indexu odstraní).
  • Meta/hlavička s noindex se zobrazuje konzistentně na všech variantách (http/https, www/non-www, s/bez trailing slasha, s kampanovými parametry).
  • V CI je test, který selže, pokud se noindex objeví na „money“ šablonách.
  • Po zrušení noindexu je nasazen re-crawl trigger (aktualizovaná sitemap, interní odkazy, fetch).

Příklady správného a nesprávného použití

Správně: interní vyhledávání (/search?q=...) má noindex, follow, ale není blokováno v robots.txt; PDF s ceníkem pro B2B partnery má X-Robots-Tag: noindex, noarchive.

Špatně: celá sekce /blog/ je omylem noindexová; nebo filtr ?color=red je v robots.txt zakázán a zároveň na stránce meta noindex – robot se k pokynu nedostane.

Shrnutí

Noindex je přesný nástroj kontroly indexace: umožní robotům stránku projít, ale zabrání jejímu zařazení do výsledků. Implementujte jej buď přes <meta name="robots" content="noindex, (no)follow"> v HTML, nebo přes X-Robots-Tag v HTTP odpovědi (ideálně pro ne-HTML zdroje). Vyhněte se kombinaci s blokováním v robots.txt, sledujte stav v nástrojích pro správce a mějte CI/QA ochrany proti nechtěnému nasazení. Správné použití noindexu čistí index, zlepšuje informační architekturu a zvyšuje kvalitu signálů v SEO i v AIO/AEO ekosystémech.