Filtrovatelné kategorie ve vyhledávání: facety vs. indexace
Faceted navigace (filtrovatelné kategorie) je základním stavebním prvkem moderních e-shopů a katalogů. Umožňuje uživatelům rychle zúžit výběr podle parametrů jako barva, velikost, značka, cena či dostupnost. Pro technické SEO však jde o oblast s vysokým rizikem nekontrolovaného nárůstu URL, zbytečného crawl budgetu a duplicitního obsahu. Tento článek podrobně vysvětluje, kdy a co indexovat, jak navrhnout URL schéma a jaké techniky použít, abyste dosáhli rovnováhy mezi organickou viditelností a výkonem webu.
Základní pojmy: co je facet a co je indexace
- Facet (filtrování): parametrické zúžení výpisu produktů v rámci jedné logické kategorie (např. Notebooky → Procesor = i7, RAM = 16 GB).
- Indexace: proces, při kterém vyhledávače procházejí a zařazují konkrétní URL do svého indexu, aby ji mohly zobrazovat ve výsledcích vyhledávání.
- Indexační strategie pro facety: pravidla a mechanismy, které určují, které konkrétní kombinace filtrů mohou být indexovány a které mají být vyloučeny nebo konsolidovány.
Problémové oblasti: exploze URL a duplicita obsahu
Faceted navigace vytváří kartézský součin parametrů. Už 6 facetů s 10 hodnotami generuje až milion kombinací. Mnohé vracejí téměř totožný obsah, pouze v jiném pořadí či s minimálním rozdílem. Bez kontroly vzniká:
- Index bloat: tisíce až miliony zbytečných URL v indexu.
- Rozptyl signálů: zpětné odkazy a interní odkazy se dělí mezi duplicity.
- Neefektivní crawl budget: robot tráví čas nízkohodnotnými parametrickými stránkami.
- Problémy s výkonem: renderování a generování stránek zpomaluje celý web.
Rozhodovací rámec: kdy facet indexovat a kdy ne
Každý facet posuzujte podle čtyř kritérií:
- Hodnota poptávky: existuje vyhledávací záměr a objem (např. „notebooky i7“)?
- Unikátnost nabídky: vrací facet výrazně odlišný set produktů?
- Stabilita a škálovatelnost: má stránka dlouhodobou dostupnost produktů a bude udržitelná?
- Možnost optimalizace: lze stránce přiřadit vlastní
<title>, H2, text, interní prolinkování a breadcrumbs?
Indexujte pouze ty facety (nebo kombinace), které splňují všechna čtyři kritéria. Ostatní ponechte neindexované, avšak použitelné pro UX.
URL schéma: parametry vs. pseudo-kategorie
Pro indexovatelné facety zvolte konzistentní URL strukturu:
- Parametrická forma:
/notebooky?cpu=i7&ram=16gb - Segmentová forma (SEO friendly):
/notebooky/cpu-i7/ram-16gb/
Doporučení:
- Zachovejte deterministické pořadí parametrů (např. abecedně) k eliminaci duplicitních URL.
- Rozlišujte filter ≠ sort ≠ paginate:
?sort=a?page=nikdy neindexujte. - Pro „propagované“ facety zvažte pseudo-kategorie (např.
/notebooky/intel-core-i7/) s vlastním obsahem.
Signály pro indexaci: meta robots, X-Robots-Tag a canonical
- Indexovatelné facety:
<meta name="robots" content="index,follow">a self-referenční canonical. - Neindexovatelné facety:
<meta name="robots" content="noindex,follow">(nebo serverový X-Robots-Tag), canonical směřující na základní kategorii. - Řazení a stránkování:
noindex,follow; canonical směřující na první stránku filtrového výpisu (bez řazení).
Poznámka: Canonical je námět, nikoli příkaz. Musí být podpořen konzistentní HTML strukturou, interními odkazy a obsahem.
Stránkování a kombinace filtrů
- Strana 1: indexovatelná, pokud je indexovatelný i samotný facet.
- Strana 2 a více: typicky
noindex,follow, canonical na?page=1(nebo root facet bez parametru stránkování). - Kombinace 2 a více facetů: indexujte pouze předem schválené kombinace (např. značka + klíčový parametr). Ostatní
noindex,follow.
Interní prolinkování, breadcrumbs a navigace
- Breadcrumbs: nechť odrážejí hierarchii kategorie → facet (je-li indexovatelný). Implementujte
BreadcrumbListv JSON-LD. - Filtrované odkazy: odkazy na indexovatelné facety umístěte v kategoriích (sekce „Populární filtry“). Tím jim dáte interní autoritu.
- Nofollow: vůči interním filtrům jej standardně nepoužívejte; raději pracujte s
noindexa canonical pravidly.
Obsah a meta data pro facet stránky
Indexovatelný facet není „jen filtr“ – je to cílová stránka. Vyžaduje:
- Vlastní
<title>,meta descriptiona nadpis H2 s cílovou frází. - Krátký unikátní úvodní text (100–200 slov) s kontextem a pomocí při výběru.
- FAQ blok (je-li relevantní) se
FAQPageschématem. - V případě potřeby doplňující obsah (návod k filtrům, značkové USP, recenze).
Výkon a Core Web Vitals při faceted navigaci
- SSR/SSG pro indexovatelné facety: aby LCP a CLS byly stabilní. Hydratujte pouze interaktivní komponenty filtrů.
- CSR pro neindexovatelné kombinace: generujte výsledky klientsky, omezíte HTML předávané serverem.
- Cache a CDN: využijte edge cache s klíčováním na normalizované parametry (pořadí, defaulty).
- Lazy loading a UX stránkování: infinite scroll kombinujte s „Načíst více“; zajistěte dostupnou URL pro SEO (bez hash-only stavů).
Normalizace parametrů a kanonikalizace
- Pořadí parametrů: vždy stejné (např.
/notebooky/brand-dell/cpu-i7/ram-16gb/). - Aliasování hodnot: i7 ≡ intel-core-i7 → vyberte jediný slug.
- Odstranění prázdných a default parametrů:
?in-stock=truepouze pokud se liší od defaultu.
Parametry, které se nikdy nemají indexovat
- Řazení:
?sort=price_asc,?sort=popular - Dočasné filtry:
?promo=,?campaign= - UI a sledování:
?view=grid,?utm= - Session a personalizace: všechny identifikátory uživatele
Robots.txt vs. meta robots: co použít
- Robots.txt používejte s rozvahou – blokuje crawl, ale nezabrání indexaci přes externí odkazy. Nevhodný pro jemné řízení facetů.
- Meta robots / X-Robots-Tag jsou preferovány pro přesné „noindex,follow“ na úrovni jednotlivých URL.
Log analýza a monitoring crawl budgetu
- Pravidelně analyzujte serverové logy: identifikujte nadměrně procházené parametry a slepé uličky.
- Sledujte poměr 200 vs. 304, počet nových a re-crawl URL, a hit-rate cache.
- Omezte generování nízkohodnotných stránek ještě před tím, než je dosáhnou roboti.
Sitemapy a indexovatelné facety
Do XML sitemap zahrňte pouze schválené indexovatelné facety a pseudo-kategorie. Aktualizujte <lastmod> při významné změně nabídky. Nezahrnujte stránkování, řazení ani dočasné parametry.
Strukturovaná data a facet stránky
- ItemList pro seznam produktů s
itemListElementaposition. - BreadcrumbList s cestou kategorie → facet.
- FAQPage pokud stránka obsahuje často kladené otázky pro daný facet.
Multiselect, více hodnot a logika AND/OR
Rozhodněte, zda kombinace hodnot v rámci jednoho facetu používá logiku OR (např. barva černá nebo šedá) nebo AND (obvykle nedává smysl). URL a breadcrumbs musí jasně odrážet zvolenou logiku. Z hlediska SEO ponechte indexaci pouze pro nejvyhledávanější kombinace.
Vliv na interní popularitu a PageRank
Faceted navigace vytváří tisíce interních odkazů. Zavedením omezení v UI (např. zobrazovat jen top 5 hodnotových filtrů a zbytek v modálním okně) snížíte rozptyl interního ranku. Pro indexovatelné facety vytvořte statické odkazy v těle kategorie („Populární notebooky i7“), nikoliv pouze dynamické odkazy v bočním panelu.
Typické scénáře a doporučení
| Scénář | Doporučení |
|---|---|
| Barva, velikost, materiál | Neindexovat (většinou); slouží primárně pro UX, vysoká kombinatorika. |
| Značka v rámci kategorie | Často indexovat; vysoká poptávka („tenisky Nike“ v kategorii). |
| Cenové rozpětí | Neindexovat dynamické intervaly; výjimkou jsou fixní, obchodně silné segmenty (např. „do 500 €“). |
| Štítky jako „doprava zdarma“, „skladem“ | Neindexovat; krátkodobé, málo vyhledávané. |
| Technické parametry s poptávkou (např. „i7“, „OLED“) | Indexovat vybrané; připravit unikátní obsah a interní odkazy. |
Praktické příklady URL a meta nastavení
- Indexovatelný facet (značka):
URL:/tenisky/znacka-nike/
Meta:<meta name="robots" content="index,follow">
Canonical: self
Sitemap: ano - Neindexovatelný facet (barva):
URL:/tenisky/barva-cerna/
Meta:<meta name="robots" content="noindex,follow">
Canonical:/tenisky/
Sitemap: ne - Kombinace dvou facetů (značka + typ):
URL:/televize/oled/znacka-lg/
Meta:<meta name="robots" content="index,follow">(pouze pokud schválená kombinace)
Canonical: self
Sitemap: ano (pokud schválená) - Řazení a stránkování:
URL:/tenisky/znacka-nike/?sort=price_asc&page=2
Meta:<meta name="robots" content="noindex,follow">
Canonical:/tenisky/znacka-nike/
Sitemap: ne
Automatizační pravidla a governance
- Bílá listina (whitelist): explicitní seznam facetů a kombinací povolených k indexaci.
- Černá listina (blacklist): parametry, které jsou vždy
noindex(řazení, zobrazení, promo, dočasné tagy). - Limit kombinací: povolit max. 1–2 kombinace na index (např. „značka + klíčový parametr“).
- Periodická revize: čtvrtletní přehodnocení poptávek, výkonu a dostupnosti produktů.
Měření a atribuce výkonu facetů
- V analytice vytvořte segment pro indexovatelné facety (regex match na URL).
- Sledujte impressions, clicks, CTR, landing rate, tržby a marže.
- Logika atribuce: porovnejte s kontrolní skupinou neindexovatelných facetů (A/B testování v čase).
Časté chyby a jak se jim vyhnout
- Indexace všeho: vede k index bloatu. Použijte whitelist.
- Nekonzistentní canonicaly: kolize mezi self canonical a canonical na kategorii.