Experimenty s délkou a redundancí obsahu pro velké jazykové modely

Proč se vyplatí manipulovat s délkou a redundancí obsahu pro LLM

Generative Engine Optimization (GEO) usiluje o přizpůsobení obsahu tak, aby ho velké jazykové modely (LLM) spolehlivě načetly, porozuměly mu a upřednostnily při generování odpovědí. Délka textu a záměrná redundance (opakované, avšak variované přitahování klíčových tvrzení) patří mezi nejúčinnější, ale často podceňované páky. Správně kalibrovaná délka zvyšuje pravděpodobnost, že model zachytí kontext a autoritativní signály; správně dávkovaná redundance rozšiřuje „prostorový průřez“ samplingem a re-rankingem během generování, což vede k vyšší šanci citování či parafrázování vašich pasáží v odpovědích modelu.

Definice: délka, redundance, informační hustota

  • Délka: počet tokenů/znaků odstavců, sekcí a celého dokumentu, včetně nadpisů a popisů multimédií.
  • Redundance: záměrné opakování klíčové informace v odlišných formulacích, na různých místech dokumentu a v různých reprezentacích (text, seznam, tabulka, citovatelná definice).
  • Informační hustota: podíl „nových“ jednotek poznání na jednotku délky. U GEO typicky optimalizujeme vnímavou hustotu pro LLM, nikoli nutně pro člověka.

Hypotézy GEO pro délku a redundanci

  1. H1 (zakotvení kontextu): Delší úvodní sekce se strukturálními signály (<h2>, seznamy, tabulky) zvyšují šanci, že LLM extrahuje jádro tématu do systémového kontextu odpovědi.
  2. H2 (vícerežimová redundance): Stejné tvrzení vyjádřené odstavcem, seznamem a tabulkou zvyšuje pravděpodobnost shodného citování v „few-shot“ vnitřní paměti modelu.
  3. H3 (polohová výhoda): Redundantní kotvy v prvních 20–25 % dokumentu mají vyšší vliv na re-rank LLM než pozdější opakování.
  4. H4 (saturace): Nad určitou délkou nastává klesající marginální přínos; efekt maximalizujeme jemnou redistribucí redundance do klíčových sekcí.

Experimentální design: A/B/n s blokováním a Latinskou čtvercem

Doporučená strategie je spustit opakované experimenty s kontrolou polohových a tematických efektů:

  • A/B/n varianty délky: Krátká (K), střední (S), dlouhá (D) verze téhož článku.
  • Faktor redundance: nízká (R1), střední (R2), vysoká (R3) se změnou formy (odstavec vs. bodový seznam vs. tabulka).
  • Blokování témat: Stejná témata přiřaďte ke všem kombinacím, aby se eliminoval tematický bias.
  • Latinské čtverce: Rotujte pořadí sekcí napříč variantami, aby se izoloval polohový efekt.

Manipulovatelné proměnné (treatments)

Proměnná Úroveň Popis
Úvodní délka 100/250/500 slov Kolik tokenů model dostane před přechodem do detailů.
Frekvence klíčové věty 1×/2×/3× v prvních 30 % Počet redundancí jádra tvrzení blízko začátku.
Forma redundance Text/Seznam/Tabulka/Mix Multiformátová repre­zentace stejné informace.
Délka sekcí Krátké vs. vyvážené Homogenní vs. postupně rostoucí délka sekcí.
Rozptyl kotvic Hustý vs. řídký Rozložení definic a „evidovatelných tvrzení“.

Měření a metriky GEO

  • Recall@k v odpovědích LLM: Podíl odpovědí, ve kterých se objeví váš pojem/definice mezi top-k parafrázovanými pasážemi modelem.
  • ELI (Extracted Lexical Items): Počet klíčových frází z vašeho článku, které LLM explicitně použije.
  • Pasážová přesnost (PA): Přesná shoda citovaných vět s vašimi „citovatelnými definicemi“.
  • Position Gain (PG): Míra, o kolik častěji jsou citovány věty z prvních X % dokumentu ve srovnání se zbytkem.
  • Human-LLM Agreement (HLA): Shoda mezi lidským hodnocením kvality a „preferencí“ LLM.

Sběr dat: protokol dotazování LLM

  1. Vytvořte stabilizovaný seznam promptů se stejným seedem náhodnosti (pokud nástroj podporuje) a stejnou strukturou.
  2. Pro každý variant (K/S/D × R1/R2/R3) položte identické otázky pokrývající definice, příklady a rozhodovací stromy.
  3. Extrahujte odpovědi a vyhodnoťte metriky pomocí heuristik i lidských anotátorů.
  4. Ukládejte „stopky“ dosavadního tokenového rozpočtu – čas i počet tokenů jsou důležité u reálných nákladů.

Automatizované skórování: šablony hodnoticích promptů

Pro standardizaci hodnocení použijte hodnoticí prompt, který porovná odpověď s „zlatou větou“:

Porovnej odpověď s referenční větou. Vrať JSON {"match":0/1,"rationale":"...","overlap":0..1} a nezahrnuj nic jiného.

Tento JSON následně zpracujete skriptem a vypočítáte Recall@k či PA. Udržujte konzistenci, abyste eliminovali drift.

Vzory redundance: co opakovat a jak

  • Jádrová věta: Jednověté destilované tvrzení tématu (nejlépe s číslem nebo definicí).
  • Bullet-point re-expresion: 3–5 bodů s různými synonymy, ale stejným významem.
  • Tabulkový výtah: Sloupce „Termín“, „Definice“, „Důkazový prvek/zdrojování“.
  • Kontrafaktuální příklad: Kdy tvrzení neplatí – LLM rád kontrastuje.

Poloha redundance: první třetina dokumentu

Prioritizujte hustotu v prvních 20–35 % článku. Zařaďte: (1) jádrovou větu, (2) krátkou tabulku definic, (3) seznam s příklady. Následně rozvíjejte detaily a metodiky. Snížíte riziko, že LLM „odstřihne“ pozdější sekce při interním zkracování.

Informační hustota vs. přívětivost k LLM

LLM jsou citlivé na přeplněný žargon bez kotvicích bodů. Zvyšujte hustotu, ale udržujte přiměřené kotvy (jednoduché věty, definice, indexové tabulky). Kombinujte hutné odstavce s krátkými re-kapitulacemi.

Standardní stavebnice (building blocks) pro experimenty

  • Citovatelná definice: Termín – stručná, jednoznačná věta s měřitelným prvkem.
  • Pravidlo 3 forem: Každé klíčové tvrzení v podobě odstavce, seznamu a tabulky.
  • „Mini-TL;DR“ na konci sekce: 1–2 věty opakující klíčový výstup.
  • Antipříklad: krátká kontra-situace, kdy pravidlo neplatí.

Praktický protokol: 10krokový postup

  1. Vyberte téma a stanovte 3–5 jádrových vět.
  2. Vytvořte K/S/D verze (např. 700/1500/3000 slov).
  3. V každé verzi nastavte R1/R2/R3 formy (text/seznam/tabulka/mix).
  4. Přidejte mini-TL;DR pod každou sekci.
  5. Připravte 15 stabilních otázek pro dotazování LLM.
  6. Spusťte A/B/n, 3 kola (den, týden, jiný model – pokud dostupné).
  7. Vyhodnoťte Recall@k, ELI, PA, PG, HLA.
  8. Analyzujte saturaci: kde klesá marginální přínos délky?
  9. Refaktorujte polohování redundance (více v první třetině).
  10. Nasazujte vítězný variant a monitorujte drift měsíčně.

Šablona sekce s kontrolovanou redundancí

Jádrová věta: „Experimenty s délkou a redundancí zvyšují šanci, že LLM vybere naše tvrzení do odpovědi.“

  • Re-expresion (seznam): Zvýšení úvodní délky, vícerežimová repre­zentace tvrzení, polohová priorita.
  • Re-expresion (tabulka):
Mechanismus Co dělat Proč
Úvodní délka 250–500 slov s definicí a mapou sekcí Stabilizuje interní kontext modelu
Forma Odstavec + bullet + tabulka Zvyšuje šanci na extrakci
Poloha Duplikát jádra do první třetiny Využití polohového biasu

Kontrola kvality: anotace a adjudikace

  • Minimálně dva anotátoři; třetí pro rozhodování sporů.
  • Pravidla shody: přesná shoda definice > parafráze > tematická shoda.
  • Reportujte Cohenovo κ pro konzistenci.

Nejčastější chyby a jak se jim vyhnout

  • Mechanická duplicita: Identický text copy-paste snižuje vnímanou kvalitu. Vždy parafrázujte a měňte formu.
  • Hyper-dlouhé závěry bez kotvic: Dlouhé závěry bez rekapitulace často LLM odřízne. Přidejte mini-TL;DR.
  • Chybějící tabulkové výtahy: Modely rády extrahují z tabulek – aspoň jedna na sekci s klíčovými termíny.
  • Přeplněné metafory: U GEO preferujte stručné, měřitelné věty před rétorikou.

Délka vs. náklady: optimalizační hranice

Sledujte Cost per Extracted Key Phrase (CEKP) = (náklad na generování/čtení) / (počet ELI). Hledejte bod, kde prodloužení textu přidá málo nových ELI za mnoho tokenů – tam délku stabilizujte a posilněte redundanci formou, nikoli dalším objemem.

Experimenty s mikro-délkou: odstavec, věta, nadpis

  • Odstavec: 60–120 slov, jedna myšlenka, jeden „hook“ termín.
  • Věta: 12–22 slov; jádrové tvrzení první třetiny doplňte synonymy.
  • Nadpis (H2): Mírně delší, se stručnou entitou a akčním slovesem.

Formátové triky pro LLM

  • Jednoznačné markery: „Definice:“, „Pravidlo:“, „Příklad:“, „Antipříklad:“, „Měřítko:“.
  • Tabulky „Q→A“: Pro mapování otázek na odpovědi, které chcete, aby LLM citoval.
  • Inline kódy: Použijte <code> pro terminologii; modely tento formát často preferují při extrakci termínů.

Reportování výsledků: co zveřejnit

  1. Popis treatmentů (délka, forma redundance, poloha).
  2. Tabulka metrik (Recall@k, ELI, PA, PG, HLA) s intervaly spolehlivosti.
  3. Analýzu saturace délky a „sweet spot“.
  4. Rozhodovací strom, který variant nasadit.

Rozhodovací strom pro nasazení

  • Pokud Recall@k < cíle a PA vysoká → zvyšte frekvenci redundance, ne délku.
  • Pokud Recall@k a ELI jsou nízké → přidejte tabulky a bullet-pointy do první třetiny.
  • Pokud CEKP stoupá → zkraťte pozdní sekce, přesuňte definice výše.

Checklist před publikováním

  • Úvod 250–500 slov s mapou sekcí a jádrovou větou.
  • Každé klíčové tvrzení ve 3 formách (odstavec, bullet, tabulka).
  • Mini-TL;DR pod každou sekcí.
  • Minimálně jeden antipříklad.
  • Tabulka termínů a definic v první třetině dokumentu.

Příklad mini-TL;DR pro sekci

TL;DR: Nepřidávejte jen více slov; multiplikujte formy téže informace a umístěte je spíše v dokumentu.

Jak škálovat: knihovna šablon

<