Co je „citability score“ a proč ho měřit
Citability score je kompozitní metrika, která odhaduje pravděpodobnost, že bude konkrétní stránka citována – tj. převzata jako zdroj v odkazech, referencích, odpovědích AI/LLM a rozšířených výsledcích vyhledávání. Na rozdíl od tradičních metrik „link popularity“ se zaměřuje nejen na zpětné odkazy, ale také na kvalitu důkazů, ověřitelnost tvrzení a použitelnost citace (např. stabilní kotvy, jasné bibliografické údaje, licencování obsahu).
V prostředí AIO/AEO (Answer/AI Engine Optimization) je citovatelnost klíčová: zdroje, které jsou přehledné, stabilní a fakticky spolehlivé, mají vyšší šanci být vybrány jako autoritativní reference ve výsledcích i v odpovědích jazykových modelů.
Odlišnost od „autority domény“ a „kvality obsahu“
- Autorita domény (agregovaný signál napříč webem) ≠ citovatelnost stránky (granulární signál konkrétní URL).
- Kvalita obsahu může být vysoká, ale bez citovatelných prvků (citace, perma-URL, licence, schémata) zůstane nízko citována.
- Citability score explicitně hodnotí předpoklady citace: zda existuje co a jak citovat (data, tvrzení, metodika, stabilní identifikátory).
Praktická definice a výsledná škála
Citability score je číselné skóre v rozsahu 0–100, kde 0 znamená prakticky necitovatelná stránka (např. tenký propagační text) a 100 vysoce citovatelná stránka (metodicky robustní, stabilní, referenční stránka s jasným zdrojováním a právy použití).
Primární faktory citovatelnosti (vážené komponenty)
- Evidence & Verifiability (E): přehledné zdroje, bibliografie, odkazy na data, DOI/URI, citace s daty.
- Stability & Addressability (S): perma-URL, ukotvené nadpisy/ID pro citace, verzování, datum poslední aktualizace, srozumitelné licence.
- Expertise & Accountability (X): autor s kompetencemi, konflikt zájmů, kontakt, redakční dohled, peer review.
- Data Richness & Reusability (D): tabulky, grafy, možnost stažení datasetu, jasné jednotky a metodika.
- Clarity & Structure (C): titulky H2+, výstižné abstrakty, shrnutí, FAQ; jednoznačná tvrzení vhodná ke citování.
- External Endorsement (R): kvalitní odkazy z relevantních zdrojů, citace v médiích a repozitářích, zmínky bez linku.
- Machine Readability (M): strukturovaná data (Schema.org), citation intents v textech, Open Graph/Twitter pro přebírání, meta údaje (autor, datum, licence).
Doporučené váhy komponentů
| Komponenta | Popis | Váha (w) |
|---|---|---|
| E – Evidence | Citace, zdroje, metodika | 0.22 |
| S – Stability | Perma-URL, kotvy, verzování | 0.16 |
| X – Expertise | Autor, dohled, disclosure | 0.14 |
| D – Data Richness | Datasety, jednotky, reprodukovatelnost | 0.16 |
| C – Clarity | Struktura, abstrakt, FAQ | 0.12 |
| R – Endorsement | Odkazy, mediální citace | 0.12 |
| M – Machine Readable | Schema, meta, OG/Twitter | 0.08 |
Formulace metriky a normalizace
Každý komponent se měří sadou sub-metrik (0–1), které se normalizují (min–max, robustní percentily). Výsledek je vážený průměr:
CitabilityScore = 100 × (wE·E + wS·S + wX·X + wD·D + wC·C + wR·R + wM·M)
Příklad sub-metrik:
- E: počet zdrojů s roky a odkazy / 1 000 slov; podíl tvrzení s citací; existence metodiky.
- S: perma-URL (bez query parametrů pro základ), ID v nadpisech, stabilní kotvy (
#metodika), datum vydání/aktualizace, changelog. - X: autor s biografií a doklady kompetencí, organizační dohled, konflikt zájmů.
- D: tabulky s jednotkami, stahovatelné CSV/JSON, popis sběru dat, vzorky.
- C: abstrakt (100–200 slov), jasné H2-H3, shrnutí, FAQ se zdroji.
- R: počet/autorita odkazujících domén, citace v médiích, zmínky bez odkazu.
- M:
Article/Datasetschema,citation/sameAs, OG/Twitter karty, licenční meta.
Ukázka hodnotící šablony (audit na 1 stránku)
| Položka | Kontrolka | Skóre (0–1) |
|---|---|---|
| Bibliografie | Min. 5 kvalitních zdrojů s daty | 0.8 |
| Perma-URL & kotvy | Stabilní URL, H2 s id |
1.0 |
| Autor & bio | Bio s kompetencemi a kontaktem | 0.7 |
| Dataset/Tabulky | CSV/JSON ke stažení, jednotky | 0.9 |
| Struktura | Abstrakt, shrnutí, FAQ | 0.8 |
| Externí odkazy | 3+ relevantní domény | 0.6 |
| Schema & meta | Article/Dataset, OG, licence | 0.9 |
Implementační postup v praxi (10 kroků)
- Definujte tvrzení, která si zaslouží citaci (data, definice, metodiky).
- Přidejte bibliografii s odkazy, roky a perma-URI; citujte také primární zdroje.
- Stabilizujte URL a přidejte
idk nadpisům pro hluboké odkazy. - Zaveďte verzování (datum vydání, poslední aktualizace, changelog).
- Doplňte strukturovaná data (Article/Report/Dataset,
citation,isBasedOn,license). - Publikujte data ve formátech CSV/JSON a popište metodiku sběru/čištění.
- Uveďte autora a bio s prokázanými kompetencemi a kontaktem.
- Vytvořte abstrakt a shrnutí (citovatelné věty, 1–2 klíčové tabulky/obrázky).
- Licencujte obsah (např. CC BY 4.0) a zřetelně to uveďte v meta i v patičce.
- Monitorujte citace (odkazy, zmínky, převzetí) a průběžně je vylepšujte.
Strukturovaná data pro citovatelnost (příklad)
<script type="application/ld+json">{ "@context":"https://schema.org", "@type":"Article", "headline":"Citability score: metodika výpočtu", "datePublished":"2025-10-22", "dateModified":"2025-10-22", "author":{ "@type":"Person", "name":"Jméno Autora", "url":"https://www.example.com/autori/jmeno", "affiliation":{"@type":"Organization","name":"Example Lab"} }, "isBasedOn":[ "https://doi.org/10.0000/example-doi", "https://www.example-data.org/report-2025" ], "citation":[ "Author A (2024). Title. Journal. https://doi.org/10.xxxx/yyy", "Organization B (2025). Dataset. https://data.example.com/ds1" ], "license":"https://creativecommons.org/licenses/by/4.0/", "mainEntityOfPage":"https://www.example.com/citability-score", "about":[ {"@type":"Thing","name":"citability"}, {"@type":"Thing","name":"AEO"}, {"@type":"Thing","name":"structured data"} ] }</script>
Formální doporučení pro citovatelné sekce
- Abstrakt: 100–200 slov shrnujících metodiku a klíčová zjištění.
- Metodika: vstupy, proměny, normalizace, váhy; verze a datum.
- Výsledky: tabulky/grafy s jednotkami a poznámkami.
- Diskuse/limity: kde metrika neplatí, co může zkreslit výsledek.
- Bibliografie: zdroje s perma-URI/DOI a daty přístupu.
Měření a sběr dat pro citability score
- On-page crawler: validace nadpisů, kotvících prvků, meta a schema.
- Link intelligence: citující domény, odbornost a relevance kontextu.
- Mentions & NER: rozpoznávání entit a nemediálních zmínek.
- Dataset checker: přítomnost CSV/JSON, rozměrů, licencování.
- Editorial signals: autor, bio, disclosure, verzování, changelog.
Příklad výpočtu (ukázková data)
E=0.85, S=0.90, X=0.70, D=0.80, C=0.75, R=0.60, M=0.90 Score = 100 × (0.22·0.85 + 0.16·0.90 + 0.14·0.70 + 0.16·0.80 + 0.12·0.75 + 0.12·0.60 + 0.08·0.90) = 100 × (0.187 + 0.144 + 0.098 + 0.128 + 0.090 + 0.072 + 0.072) = 100 × 0.791 = 79.1
Využití skóre v AIO/AEO a redakčním procesu
- Prioritizace aktualizací: stránky s vysokou poptávkou a nízkým skóre → doplnit metodiku, citace, data.
- Interní prolinkování: posílit odkazy z „hubů“ na vysoce citovatelné podstránky.
- LLM friendly obsah: doplňovat shrnutí, stabilní kotvy, jednoznačné věty „ke citaci“.
- Distribuce: PR a výzkumné repozitáře pro získání kvalitních citací.
Jak zvýšit citovatelnost (praktický checklist)
- Přidejte abstrakt a metodiku se samostatnými kotvami (
#abstrakt,#metodika). - Uveďte licenci a způsob atribuce (např. CC BY 4.0, citace ve formátu APA/Chicago).
- Zveřejněte dataset (CSV/JSON) a popište jednotky a sběr dat.
- Přidejte bibliografii s DOI/perma-URI a daty přístupu.
- Doplňte autorské bio s kompetencemi a kontaktem.
- Nasazujte Schema.org pro články/data a OG/Twitter pro převzetí náhledů.
- Stabilizujte URL a kotvy, zaveďte verzování a changelog.
Rizika, limity a etické aspekty
- Metametrika: skóre je model, nikoli „pravda“; validujte na reálných citacích.
- Inflace citací: nadměrné samocitace, neautentické odkazy; odhalujte anomálie.
- YMYL témata: vysoká laťka pro důkazy a dohled; jasné disclaimery a kvalifikace.
- Licence: citovatelnost ≠ volné použití; respektujte licenční omezení.
Mini-vzor redakčního bloku „Jak citovat tuto stránku“
<section id="jak-citovat"> <h2>Jak citovat tuto stránku</h2> <p>Author, M. (2025). Název stránky. Organizace. Dostupné z: https://www.example.com/citability-score (Datum přístupu: 22. 10. 2025). Licence: CC BY 4.0.</p> </section>
Měření efektu: odhad → realita
- Prediktivní vs. ex-post model: porovnávejte citability score s reálným nárůstem citací/zmínek.
- Lag efekt: očekávejte prodlevu 2–12 týdnů mezi úpravami a citacemi.
- Ablační testy: izolujte přínos komponentů (např. přidání datasetu vs. doplnění bibliografie).