Proč on-chain analytika: motivace, cíle a očekávání
On-chain analytika je disciplína, která z veřejných blockchainových dat vyvozuje poznatky o chování uživatelů, protokolů a trhů. Na rozdíl od off-chain metrik (objemy na CEX, sentiment, makroekonomické signály) se opírá o verifikovatelná data přímo z řetězce. Začátečník by měl začít pochopením účetních modelů, typů peněženek, základní terminologie a jednoduchých metrik toků.
Účetní modely: UTXO vs. account-based
- UTXO model (Bitcoin, Litecoin): transakce spotřebovávají nevyčerpané výstupy a vytvářejí nové. Pro adresu není potřeba explicitní zůstatek; zůstatek je součet UTXO patřících entitě. Analýza se zaměřuje na peněženkové heuristiky (např. common-input ownership) a sledování výstupů.
- Account-based model (Ethereum a EVM): každý účet má stav a zůstatek; transakce mění stav účtu nebo smart kontraktu. Silnou stránkou je analýza interakcí se smart kontrakty (DEX, lending, NFT) a vývoj stavových proměnných (např. rezervy poolů).
Typologie peněženek: EOAs, kontrakty a entity
- EOA (Externally Owned Account): běžné adresy řízené soukromým klíčem. V EVM je poznáte podle toho, že nemají kód.
- Kontrakt: adresa s kódem (bytecode), typicky protokol (DEX, vault, bridge, multisig, DAO treasury).
- Custody a burzy: hot a cold peněženky CEX, depozitní a výběrové adresy, interní klastrování.
- Mosty a relayeři: kontrakty, které uzamykají aktiva a vydávají wrapped tokeny na jiné síti.
- MEV a boti: adresy s charakteristickými vzory (sandwich, arbitrage, liquidátor).
Labely (značky): co jsou a proč na nich záleží
Label je přiřazení významu adrese nebo entitě (např. „Binance hot wallet“, „Curve pool“, „Smart money fond“). Bez labelů jsou grafy jen anonymní uzly a hrany. Začátečník se naučí:
- Rozpoznávat patterny (frekvence, struktura transakcí, typické volání funkcí kontraktů).
- Ověřovat z webových zdrojů (oficiální dokumentace, auditní zprávy, veřejná oznámení adres, block explorer tagy).
- Používat komunitní katalogy labelů a vlastní slovníky.
Toky (flows): základní metriky a jejich interpretace
- Inflow/Outflow na CEX: suma aktiv směřujících na burzy a z burz. Vyšší inflow může signalizovat připravovaný prodej; outflow často koreluje s akumulací.
- Netflow:
Netflow = Inflow − Outflowpro danou entitu nebo kategorii (CEX, staking, bridge). - Token velocity: míra obratu držitelů, např.
Velocity = On-chain volume / Free float, přibližně měří „otáčení“ tokenu. - Whale activity: transakce nad prahem (např. 100k USD), změny koncentrace top držitelů.
- Stablecoin flows: příliv/odliv stablecoinů do DeFi a CEX, často vedou tržní cykly likvidity.
Od dat ke znalosti: pipeline a nástroje
- Sběr: plný uzel nebo poskytovatel (RPC, archive node) a block explorer API.
- ETL: dekódování událostí (event logs), funkčních volání a stavových změn; transformace do tabulek (transakce, logy, stavy, labely).
- Modelování: SQL/Analytics vrstvy (např. token transfery, DEX swapy, lending likvidace, NFT minty).
- Vizualizace: grafy, sankey diagramy, kohorty, heatmapy gasu.
Explorer 101: co se naučit hned na začátku
- Číst Transaction details: odesílatel, příjemce, vstupní data (input data), gas, status, decoded logs.
- Rozumět events: např.
Transfer(address,address,uint256)u ERC-20,Swap,Mint,Burnu DEX. - Ověřovat kontrakt (verified source) a kontrolovat proxy patterny (EIP-1967, beacons).
Základní heuristiky pro adresy a entity (pozor na omyly)
- Common-input ownership (UTXO): vstupy v jedné transakci často patří stejné entitě. Výjimky: CoinJoin a mixing.
- Detekce change adresy: heuristika k rozlišení výdaje a „vratné“ adresy v UTXO transakci.
- Contract interaction fingerprints: sekvence volání a podpisů funkcí odhalují typ aktéra (např. liquidátor).
- Temporal clustering: dávkové výběry/depozity v pravidelných intervalech signalizují CEX nebo custody.
Peněženky v praxi: cold, hot, multisig, trezory
Při sledování protokolů a trezorů (DAO, multisig) sledujte odvozené toky (incoming grants, emissions, LP odměny) a governance operace. Multisigy mají charakteristické vzory (připravené transakce, potvrzení), které usnadňují labelování.
DeFi metriky pro začátečníky
- TVL: suma vkladů v protokolu; sledujte rozklad podle aktiv a řetězců, ne pouze celkové číslo.
- DEX objemy a podíl: denní swapy, tržní podíl poolů, slippage a koncentrace LP.
- Lending: poměry kolaterálu, úrokové křivky, likvidační prahy, počty likvidací a jejich velikosti.
- Emise a odměny: tempo razení tokenů, distribuce na trezory, farmy, market makery.
NFT a sociální grafy
- Mint kohorty: kdo mintoval, kdy a za kolik; wash trading odhalíte anomálními kruhovými toky a opakovanými protistranami.
- Distribuce držitelů: koncentrace, délka držby, migrace mezi kolekcemi.
Mosty a cross-chain data
Bridge kontrakty jsou uzly s vysokým stupněm propojení. Sledujte lock-mint-burn-release toky a anomálie (náhlé zastavení výdajů, nesrovnalosti v bilancích). U rollupů porovnávejte L2 závazky s L1 stavem (zůstatky canonical bridge, blob/DA publikace).
MEV: signály a dopady na metriky
- Arbitráž a sandwich: transakční trojice kolem oběti; objeví se specifický gas tip a okolní nonce.
- Likvidace: spike ve voláních likvidačních funkcí, korelují s cenovými skoky a změnami fundingů.
Jednoduchá cvičení pro začátečníka
- Identifikujte 3 burzovní peněženky podle vzoru depozit a výběrů a vytvořte si vlastní label list.
- Změřte netflow stablecoinů do top 3 DEX poolů za posledních 7 dní.
- Vytvořte kohorty nových adres, které poprvé interagovaly s konkrétním protokolem; sledujte 30denní retenční míry.
Metodické zásady: jak se nenechat oklamat
- Kontext nad čísly: jednorázové inflowy mohou být interní přesuny; hledejte potvrzení v dalších datech.
- Auditovatelnost: uveďte přesnou definici metriky (SQL, filtry, zdroje), aby byl výsledek reprodukovatelný.
- Outliers: extrémní hodnoty kontrolujte manuálně (block explorer, logy kontraktů).
- Jednotky a denominace: u tokenů s 18 desetinnými místy nezapomeňte na normalizaci; u cross-chain aktiv ošetřete wrappery a rebasing.
Praktická interpretace CEX/DEX toků
Začátečníci často chybují, když velký inflow na CEX interpretují jako „prodej“. Správný postup:
- Ověřit, zda adresa patří CEX a zda jde o depozitní vault nebo hot wallet.
- Kontrolovat paralelní on-chain aktivity (např. přesuny stablecoinů zpět do DeFi, což může indikovat market making spíše než čistý prodej).
- Porovnat s objemem a strukturou objednávek na burzách (pokud jsou data dostupná) a s derivátovými metrikami (open interest, funding).
Kohorty a doba držby (holding analysis)
- Age bands: rozklad zásob podle délky držby (např. 1–3m, 3–6m, 1–2r). Nárůst starších pásem signalizuje akumulaci.
- Realizovaný zisk/ztráta: sledování transakcí nad/pod nákupní cenou (vyžaduje aproximace nákladové báze).
Riziková analytika protokolů
- Koncentrace kolaterálu: top 10 adres vs. zbytek, citlivost na cenu a oracle.
- Likvidační stěna: kumulativní likvidační prahy podle ceny; mapuje potenciální kaskády.
- Expozice vůči mostům: procento TVL v wrapped aktivech a jednom mostu (jednotlivý bod selhání).
Etika, soukromí a právní aspekty
Ačkoliv jsou data veřejná, respektujte soukromí a vyhýbejte se doxxingu. Labelujte konzervativně, používejte důkazy a vyhýbejte se neoprávněnému zveřejňování identity jednotlivců.
Kontrolní seznam pro vlastní mini-projekt on-chain analytiky
- Definujte otázku (např. „Jak se mění netflow stablecoinů do DEX během výprodejů?“).
- Přesně specifikujte metriky (agregace, intervaly, filtry, kontrakty).
- Postavte ETL: získejte transakce a eventy, normalizujte desetinná místa, přiřaďte labely.
- Validujte na malém vzorku (ručně přes explorer) a až potom škálujte.
- Vizualizujte a napište stručnou interpretaci s omezeními a nejistotami.
Nejčastější chyby začátečníků
- Spoléhání se na jedno číslo bez kontextu (např. „CEX inflow = bearish“).
- Nesprávné rozpoznání kontraktové adresy jako EOA nebo naopak.
- Ignorování reorgů a specifik sítě (finalita, L2 publikace, mostové latence).
- Záměna „toků“ s „objemy“ (flow je čistý směr, objem je aktivita bez směru).
Kam dál: rozšířené techniky
- Adresní klasterizace: grafové algoritmy na seskupování entit z heuristik.
- Anomální detekce: časové modely (EWMA, z-score), pravděpodobnostní modely, detekce komunitní struktury.
- Simulace a backtest: z on-chain eventů odvozená pravidla (např. vstup při prudkém netflow stablecoinů → výstup při reverzii).
Shrnutí
On-chain analytika stojí na pochopení modelu účetnictví, peněženek a kontraktů, disciplíně v labelování a přesných definicích metrik toků. Začněte s explorerem, jednoduchými netflow a cohort analýzami, budujte vlastní katalog labelů a vždy validujte na surových datech. Pouze tak přeměníte veřejná data na použitelná, opakovatelná a rozhodovatelná poznatky.