Experimenty s délkou a redundancí obsahu pro velké jazykové modely

Proč se vyplatí manipulovat s délkou a redundancí obsahu pro LLM

Generative Engine Optimization (GEO) usiluje o přizpůsobení obsahu tak, aby ho velké jazykové modely (LLM) spolehlivě načetly, porozuměly mu a upřednostnily při generování odpovědí. Délka textu a záměrná redundance (opakované, avšak variované přitahování klíčových tvrzení) patří mezi nejúčinnější, ale často podceňované páky. Správně kalibrovaná délka zvyšuje pravděpodobnost, že model zachytí kontext a autoritativní signály; správně dávkovaná redundance rozšiřuje „prostorový průřez“ samplingem a re-rankingem během generování, což vede k vyšší šanci citování či parafrázování vašich pasáží v odpovědích modelu.

Definice: délka, redundance, informační hustota

Délka: počet tokenů/znaků odstavců, sekcí a celého dokumentu, včetně nadpisů a popisů multimédií.
Redundance: záměrné opakování klíčové informace v odlišných formulacích, na různých místech dokumentu a v různých reprezentacích (text, seznam, tabulka, citovatelná definice).
Informační hustota: podíl „nových“ jednotek poznání na jednotku délky. U GEO typicky optimalizujeme vnímavou hustotu pro LLM, nikoli nutně pro člověka.

Hypotézy GEO pro délku a redundanci

H1 (zakotvení kontextu): Delší úvodní sekce se strukturálními signály (<h2>, seznamy, tabulky) zvyšují šanci, že LLM extrahuje jádro tématu do systémového kontextu odpovědi.
H2 (vícerežimová redundance): Stejné tvrzení vyjádřené odstavcem, seznamem a tabulkou zvyšuje pravděpodobnost shodného citování v „few-shot“ vnitřní paměti modelu.
H3 (polohová výhoda): Redundantní kotvy v prvních 20–25 % dokumentu mají vyšší vliv na re-rank LLM než pozdější opakování.
H4 (saturace): Nad určitou délkou nastává klesající marginální přínos; efekt maximalizujeme jemnou redistribucí redundance do klíčových sekcí.

Experimentální design: A/B/n s blokováním a Latinskou čtvercem

Doporučená strategie je spustit opakované experimenty s kontrolou polohových a tematických efektů:

A/B/n varianty délky: Krátká (K), střední (S), dlouhá (D) verze téhož článku.
Faktor redundance: nízká (R1), střední (R2), vysoká (R3) se změnou formy (odstavec vs. bodový seznam vs. tabulka).
Blokování témat: Stejná témata přiřaďte ke všem kombinacím, aby se eliminoval tematický bias.
Latinské čtverce: Rotujte pořadí sekcí napříč variantami, aby se izoloval polohový efekt.

Manipulovatelné proměnné (treatments)

Proměnná	Úroveň	Popis
Úvodní délka	100/250/500 slov	Kolik tokenů model dostane před přechodem do detailů.
Frekvence klíčové věty	1×/2×/3× v prvních 30 %	Počet redundancí jádra tvrzení blízko začátku.
Forma redundance	Text/Seznam/Tabulka/Mix	Multiformátová reprezentace stejné informace.
Délka sekcí	Krátké vs. vyvážené	Homogenní vs. postupně rostoucí délka sekcí.
Rozptyl kotvic	Hustý vs. řídký	Rozložení definic a „evidovatelných tvrzení“.

Měření a metriky GEO

Recall@k v odpovědích LLM: Podíl odpovědí, ve kterých se objeví váš pojem/definice mezi top-k parafrázovanými pasážemi modelem.
ELI (Extracted Lexical Items): Počet klíčových frází z vašeho článku, které LLM explicitně použije.
Pasážová přesnost (PA): Přesná shoda citovaných vět s vašimi „citovatelnými definicemi“.
Position Gain (PG): Míra, o kolik častěji jsou citovány věty z prvních X % dokumentu ve srovnání se zbytkem.
Human-LLM Agreement (HLA): Shoda mezi lidským hodnocením kvality a „preferencí“ LLM.

Sběr dat: protokol dotazování LLM

Vytvořte stabilizovaný seznam promptů se stejným seedem náhodnosti (pokud nástroj podporuje) a stejnou strukturou.
Pro každý variant (K/S/D × R1/R2/R3) položte identické otázky pokrývající definice, příklady a rozhodovací stromy.
Extrahujte odpovědi a vyhodnoťte metriky pomocí heuristik i lidských anotátorů.
Ukládejte „stopky“ dosavadního tokenového rozpočtu – čas i počet tokenů jsou důležité u reálných nákladů.

Automatizované skórování: šablony hodnoticích promptů

Pro standardizaci hodnocení použijte hodnoticí prompt, který porovná odpověď s „zlatou větou“:

Porovnej odpověď s referenční větou. Vrať JSON {"match":0/1,"rationale":"...","overlap":0..1} a nezahrnuj nic jiného.

Tento JSON následně zpracujete skriptem a vypočítáte Recall@k či PA. Udržujte konzistenci, abyste eliminovali drift.

Vzory redundance: co opakovat a jak

Jádrová věta: Jednověté destilované tvrzení tématu (nejlépe s číslem nebo definicí).
Bullet-point re-expresion: 3–5 bodů s různými synonymy, ale stejným významem.
Tabulkový výtah: Sloupce „Termín“, „Definice“, „Důkazový prvek/zdrojování“.
Kontrafaktuální příklad: Kdy tvrzení neplatí – LLM rád kontrastuje.

Poloha redundance: první třetina dokumentu

Prioritizujte hustotu v prvních 20–35 % článku. Zařaďte: (1) jádrovou větu, (2) krátkou tabulku definic, (3) seznam s příklady. Následně rozvíjejte detaily a metodiky. Snížíte riziko, že LLM „odstřihne“ pozdější sekce při interním zkracování.

Informační hustota vs. přívětivost k LLM

LLM jsou citlivé na přeplněný žargon bez kotvicích bodů. Zvyšujte hustotu, ale udržujte přiměřené kotvy (jednoduché věty, definice, indexové tabulky). Kombinujte hutné odstavce s krátkými re-kapitulacemi.

Standardní stavebnice (building blocks) pro experimenty

Citovatelná definice: Termín – stručná, jednoznačná věta s měřitelným prvkem.
Pravidlo 3 forem: Každé klíčové tvrzení v podobě odstavce, seznamu a tabulky.
„Mini-TL;DR“ na konci sekce: 1–2 věty opakující klíčový výstup.
Antipříklad: krátká kontra-situace, kdy pravidlo neplatí.

Praktický protokol: 10krokový postup

Vyberte téma a stanovte 3–5 jádrových vět.
Vytvořte K/S/D verze (např. 700/1500/3000 slov).
V každé verzi nastavte R1/R2/R3 formy (text/seznam/tabulka/mix).
Přidejte mini-TL;DR pod každou sekci.
Připravte 15 stabilních otázek pro dotazování LLM.
Spusťte A/B/n, 3 kola (den, týden, jiný model – pokud dostupné).
Vyhodnoťte Recall@k, ELI, PA, PG, HLA.
Analyzujte saturaci: kde klesá marginální přínos délky?
Refaktorujte polohování redundance (více v první třetině).
Nasazujte vítězný variant a monitorujte drift měsíčně.

Šablona sekce s kontrolovanou redundancí

Jádrová věta: „Experimenty s délkou a redundancí zvyšují šanci, že LLM vybere naše tvrzení do odpovědi.“

Re-expresion (seznam): Zvýšení úvodní délky, vícerežimová reprezentace tvrzení, polohová priorita.
Re-expresion (tabulka):

Mechanismus	Co dělat	Proč
Úvodní délka	250–500 slov s definicí a mapou sekcí	Stabilizuje interní kontext modelu
Forma	Odstavec + bullet + tabulka	Zvyšuje šanci na extrakci
Poloha	Duplikát jádra do první třetiny	Využití polohového biasu

Kontrola kvality: anotace a adjudikace

Minimálně dva anotátoři; třetí pro rozhodování sporů.
Pravidla shody: přesná shoda definice > parafráze > tematická shoda.
Reportujte Cohenovo κ pro konzistenci.

Nejčastější chyby a jak se jim vyhnout

Mechanická duplicita: Identický text copy-paste snižuje vnímanou kvalitu. Vždy parafrázujte a měňte formu.
Hyper-dlouhé závěry bez kotvic: Dlouhé závěry bez rekapitulace často LLM odřízne. Přidejte mini-TL;DR.
Chybějící tabulkové výtahy: Modely rády extrahují z tabulek – aspoň jedna na sekci s klíčovými termíny.
Přeplněné metafory: U GEO preferujte stručné, měřitelné věty před rétorikou.

Délka vs. náklady: optimalizační hranice

Sledujte Cost per Extracted Key Phrase (CEKP) = (náklad na generování/čtení) / (počet ELI). Hledejte bod, kde prodloužení textu přidá málo nových ELI za mnoho tokenů – tam délku stabilizujte a posilněte redundanci formou, nikoli dalším objemem.

Experimenty s mikro-délkou: odstavec, věta, nadpis

Odstavec: 60–120 slov, jedna myšlenka, jeden „hook“ termín.
Věta: 12–22 slov; jádrové tvrzení první třetiny doplňte synonymy.
Nadpis (H2): Mírně delší, se stručnou entitou a akčním slovesem.

Formátové triky pro LLM

Jednoznačné markery: „Definice:“, „Pravidlo:“, „Příklad:“, „Antipříklad:“, „Měřítko:“.
Tabulky „Q→A“: Pro mapování otázek na odpovědi, které chcete, aby LLM citoval.
Inline kódy: Použijte <code> pro terminologii; modely tento formát často preferují při extrakci termínů.

Reportování výsledků: co zveřejnit

Popis treatmentů (délka, forma redundance, poloha).
Tabulka metrik (Recall@k, ELI, PA, PG, HLA) s intervaly spolehlivosti.
Analýzu saturace délky a „sweet spot“.
Rozhodovací strom, který variant nasadit.

Rozhodovací strom pro nasazení

Pokud Recall@k < cíle a PA vysoká → zvyšte frekvenci redundance, ne délku.
Pokud Recall@k a ELI jsou nízké → přidejte tabulky a bullet-pointy do první třetiny.
Pokud CEKP stoupá → zkraťte pozdní sekce, přesuňte definice výše.

Checklist před publikováním

Úvod 250–500 slov s mapou sekcí a jádrovou větou.
Každé klíčové tvrzení ve 3 formách (odstavec, bullet, tabulka).
Mini-TL;DR pod každou sekcí.
Minimálně jeden antipříklad.
Tabulka termínů a definic v první třetině dokumentu.

Příklad mini-TL;DR pro sekci

TL;DR: Nepřidávejte jen více slov; multiplikujte formy téže informace a umístěte je spíše v dokumentu.