Lastmod v XML sitemapě

Lastmod: co to je a proč na něm záleží

<lastmod> je volitelný prvek v XML sitemapách, který vyjadřuje datum a čas poslední významné změny dané URL. Správné používání lastmod pomáhá vyhledávačům, asistenčním systémům (AIO/AEO) a jazykovým modelům (LLM) lépe plánovat procházení, interpretovat aktuálnost obsahu a vyhodnocovat, zda je potřeba stránku znovu načíst. V moderním SEO je lastmod jedním z mála explicitních signálů čerstvosti obsahu, který máte plně pod kontrolou.

Jak lastmod funguje ve struktuře sitemap

Na úrovni URL se používá v rámci <urlset> pro každou položku <url>. Na úrovni indexu se používá v <sitemapindex> a označuje čas poslední změny pod-sitemapu. Tím můžete efektivně „signalizovat“ změny ve velkých částech webu bez nutnosti re-procházet všechny soubory.

Příklady bez použití <pre> (řádky jsou odděleny <br>):

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.priklad.cz/clanek/lastmod</loc>
    <lastmod>2025-10-22T13:45:00+02:00</lastmod>
  </url>
</urlset>

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://www.priklad.cz/sitemaps/blog.xml</loc>
    <lastmod>2025-10-22</lastmod>
  </sitemap>
</sitemapindex>

Povolené formáty data a času

  • Datum: YYYY-MM-DD (např. 2025-10-22).
  • Datum a čas: YYYY-MM-DDThh:mm:ssTZD (např. 2025-10-22T13:45:00+02:00 nebo 2025-10-22T11:45:00Z pro UTC).
  • Doporučená praxe: konzistentně používejte časovou zónu (ideálně Z pro UTC) a sekundy – zlepší to přesnost a porovnatelnost.

Co je „významná změna“ pro lastmod

lastmod signalizuje změny, které mění sémantiku nebo obsah stránky ve smyslu hodnoty pro uživatele a index. Ne všechny změny jsou významné:

  • Ano: změny textu, nadpisů, obrázků, data publikace, cenotvorby, dostupnosti produktů, schématu JSON-LD reflektujícího obsah, zásadní úpravy struktury.
  • Spíše ne: kosmetické úpravy CSS, změny analytických skriptů, přehazování pořadí prvků bez obsahové změny, drobné překlepy bez dopadu na význam.
  • Hraniční případy: dynamické bloky (např. „Dnes otevřeno do 17:00“) – pokud jsou spíše „chrome“ než základní obsah, nezvyšujte kvůli nim lastmod při každé minimální změně.

Proč je správný lastmod důležitý pro SEO, AIO/AEO a LLM

  • Lepší plánování crawlování: vyhledávače upřednostňují URL s nedávným lastmod, ale omezují zbytečné re-crawly u nezměněných URL.
  • Čerstvost odpovědí asistentů: AIO/AEO systémy si udržují aktuální obraz často měněných stránek (např. produkty, události, pracovní nabídky).
  • Stabilita extrakce pro LLM: modely snáze rozpoznají, kdy znovu extrahovat fakta ze schématu a obsahu.

Rozdíl: lastmod v sitemapě vs. HTTP hlavičky

HTTP hlavička Last-Modified a mechanismy If-Modified-Since/ETag řeší podmíněné načítání při požadavku na konkrétní URL. lastmod v sitemapě je „mapový“ signál, který umožňuje vyhledávači rozhodnout se, které URL vůbec požádat. Doporučení: udržujte lastmod a Last-Modified konzistentní – minimalizujete nesrovnalosti.

Strategická pravidla pro kvalitu a důvěryhodnost lastmod

  • Pravdivost: nikdy uměle neaktualizujte lastmod jen pro „čerstvost“. Dlouhodobě to zhoršuje crawling a důvěru.
  • Granularita: používejte sekundovou přesnost, pokud lze spolehlivě získat timestamp obsahu (např. z databáze).
  • Stabilita ID: při zásadních změnách URL (přesuny, kanonikalizace) řešte 301 přesměrování a aktualizujte lastmod na cílové URL, nikoli na staré.
  • Hreflang souvislost: jazykové alternativy (xhtml:link v sitemapě) by měly mít lastmod reflektující změny v jejich vlastní jazykové verzi.

Zdroj pravdy: odkud čerpat datum změny

  • Aplikační databáze: sloupce updated_at/modified – ideální pro většinu CMS a ecommerce platforem.
  • Git historie: pro statické weby (SSG) použijte timestamp posledního commitu, který se souboru dotýká.
  • Obsahový hash: porovnávejte hash „významných zón“ stránky (hlavní text, cena, dostupnost). Při změně přepočítejte a nastavte lastmod.
  • ETL pipeline: u agregovaných stránek (tagy, kategorie) použijte maximum z lastmod položek, které stránka zobrazuje.

Ošetření specifických typů stránek

  • Články a blogy: při editaci aktualizujte lastmod a v obsahu uveďte dateModified (také v JSON-LD), aby byl signál konzistentní.
  • Produktové stránky: změny cen a dostupnosti jsou legitimní důvod k aktualizaci lastmod.
  • Kategorie / listingy: lastmod může odrážet poslední významnou změnu v seznamu (nový produkt, zásadní změna pořadí), nikoli každou drobnou fluktuaci.
  • Stránky s parametry: do sitemap rozhodně nezahrnujte dočasné nebo sledovací parametry (UTM, session). loc musí být kanonická URL.

Časté chyby při lastmod a jak se jim vyhnout

  • Hromadné přepisování: build pipeline generuje všechny lastmod nastavené na „nyní“. Řešení: generujte diferencovaně a načítejte skutečné zdroje změny.
  • Neplatný formát: míchání lokálních formátů (např. 22.10.2025). Používejte ISO 8601 s časovou zónou.
  • Nekonzistence s obsahem: lastmod tvrdí, že URL se změnila, ale na stránce ani v JSON-LD není žádná známka změny. Zaveďte interní audit „content parity“.
  • Zahrnutí neindexovatelných URL: URL s noindex, 404 nebo 301 v sitemapě zbytečně využívají crawl budget. Udržujte sitemapu čistou.

Procesní doporučení a QA checklist

  • Definujte „významnou změnu“ pro každý typ stránky (policy v repozitáři).
  • Automatizujte testy: unit testy na formát data, integrační testy na změnu lastmod při skutečné editaci.
  • Logujte generování: ukládejte rozdíly a důvody změny lastmod (např. „změna ceny z 79,90 → 74,90“).
  • Monitorujte v Google Search Console: sledujte report Sitemaps a porovnávejte tempo re-crawlu s očekáváními.

Hranice, limity a struktura velkých sitemap

  • Segmentace: rozdělte sitemapu podle typů obsahu (blog, produkty, kategorie) a používejte sitemapindex s vlastním lastmod pro každou pod-sitemapu.
  • Aktualizační strategie: méně často měnící se soubory sitemap (např. statické stránky) udržujte se stabilním lastmod; často měnící se (produkty) aktualizujte častěji.

Interakce se schémou a metadaty

Pokud v obsahu používáte JSON-LD s datePublished a dateModified, dbejte na to, aby dateModified odpovídalo lastmod. Tím sjednotíte signály pro vyhledávače i LLM a snížíte riziko nekonzistencí ve znalostních grafech.

Praktický workflow pro generování lastmod

  1. Zdroj data: pro každou URL určete autoritativní timestamp (DB, Git, hash diff).
  2. Normalizace: konvertujte do UTC a serializujte v ISO 8601 s Z nebo +/-HH:MM.
  3. Filtrace: aplikujte práh (např. ignorovat změny menší než X znaků nebo bez změny významu).
  4. Generování: aktualizujte pouze záznamy, kde došlo k významné změně.
  5. Validace: lint XML, schéma a vzorková kontrola náhodných URL vůči reálné stránce a HTTP hlavičkám.

Měření dopadu a ladění strategie

  • Logy serveru: sledujte frekvenci požadavků Googlebotu po změnách lastmod.
  • Index Coverage: sledujte změny v počtu validních a varovných URL po úpravách strategie.
  • Čas do re-crawlu: u typů stránek se smysluplným SLÁ (např. pracovní nabídky, akce) evidujte metriku „změna → re-crawl → aktualizace snippetů“.

Minimalistické, ale přesné příklady

Jen datum (postačuje při zřídka se vyskytujících úpravách):
<lastmod>2025-10-22</lastmod>

Datum a čas v UTC:
<lastmod>2025-10-22T11:45:00Z</lastmod>

Datum a čas s časovým posunem:
<lastmod>2025-10-22T13:45:00+02:00</lastmod>

Nejlepší praktiky v kostce

  • Uvádějte skutečný čas poslední obsahové změny.
  • Používejte ISO 8601 s časovou zónou a sekundami.
  • Zajistěte konsistenci s Last-Modified a dateModified ve schématu.
  • Nemodifikujte lastmod kvůli „freshness hackingu“ – soustřeďte se na reálný obsah.
  • Segmentujte sitemapu a využívejte sitemapindex s lastmod pro efektivní řízení procházení.

Shrnutí

lastmod je klíčový, ale často podceňovaný signál čerstvosti obsahu. Při disciplíně v jeho používání zlepšuje alokaci crawl budgetu, zkracuje dobu do opětovného procházení po změnách a pomáhá AIO/AEO i LLM udržovat aktuální stav o vašem webu. Největší hodnotu přináší, když je přesný, konzistentní a odvozený od skutečných obsahových změn.