On-chain analytika pro začátečníky: peněženky, toky a štítky

Proč on-chain analytika: motivace, cíle a očekávání

On-chain analytika je disciplína, která z veřejných blockchainových dat vyvozuje poznatky o chování uživatelů, protokolů a trhů. Na rozdíl od off-chain metrik (objemy CEX, sentiment, makro signály) se opírá o verifikovatelná data přímo z řetězce. Začátečník by měl začít pochopením účetních modelů, typů peněženek, základní terminologie a jednoduchých metrik toků.

Účetní modely: UTXO vs. account-based

  • UTXO model (Bitcoin, Litecoin): transakce spotřebovávají nevyčerpané výstupy a vytvářejí nové. Není potřeba explicitní zůstatek na adrese; zůstatek je součet UTXO patřících entitě. Analýza se zaměřuje na peněženkové heuristiky (např. common-input ownership) a na sledování výstupů.
  • Account-based model (Ethereum a EVM): každý účet má stav a zůstatek; transakce mění stav účtu nebo smlouvy. Silné je analyzovat interakce se smart kontrakty (DEX, lending, NFT) a vývoj stavových proměnných (např. rezervy poolů).

Typologie peněženek: EOAs, kontrakty a entity

  • EOA (Externally Owned Account): běžné adresy řízené soukromým klíčem. V EVM je poznáte tak, že nemají kód.
  • Kontrakt: adresa s kódem (bytecode), typicky protokol (DEX, vault, bridge, multisig, DAO trezor).
  • Custody a burzy: horké a studené peněženky CEX, depozitní a výběrové adresy, interní shlukování.
  • Mosty a relayeři: kontrakty, které uzamykají aktiva a vydávají wrapped tokeny na jiné síti.
  • MEV a boti: adresy s charakteristickými vzory (sandwich, arb, liquidátor).

Labely (značky): co jsou a proč na nich záleží

Label je přiřazení významu adrese nebo entitě (např. „Binance hot wallet“, „Curve pool“, „Smart money fond“). Bez labelů jsou grafy pouze anonymní uzly a hrany. Začátečník se naučí:

  1. Rozpoznat patterny (frekvence, struktura transakcí, typická volání funkcí kontraktů).
  2. Ověřovat z webových zdrojů (oficiální dokumentace, auditní zprávy, veřejná oznámení adres, block explorer tagy).
  3. Používat komunitní katalogy labelů a vlastní slovníky.

Toky (flows): základní metriky a jejich interpretace

  • Inflow/Outflow na CEX: suma aktiv směřujících na burzy a z burz. Vyšší inflowy mohou signalizovat připravovaný prodej; outflow často koreluje s akumulací.
  • Netflow: Netflow = Inflow − Outflow pro danou entitu nebo kategorii (CEX, staking, bridge).
  • Token velocity: míra obměny držitelů, například Velocity = On-chain volume / Free float, přibližně měří „otáčení“ tokenu.
  • Whale activity: transakce nad prahem (např. 100k USD), změny koncentrace top držitelů.
  • Stablecoin flows: příliv/odliv stablecoinů do DeFi a CEX, často vedou tržní cykly likvidity.

Od dat k znalosti: pipeline a nástroje

  1. Sběr: plný uzel nebo poskytovatel (RPC, archive node) a block explorer API.
  2. ETL: dekódování událostí (event logs), funkčních volání a stavových změn; transformace do tabulek (transakce, logy, stavy, labely).
  3. Modelování: SQL/Analytics vrstvy (např. token transfery, DEX swapy, lending likvidace, NFT minty).
  4. Vizualizace: grafy, sankey diagramy, kohorty, heatmapy gasu.

Explorer 101: co se naučit hned na začátku

  • Číst Transaction details: odesílatel, příjemce, vstupní data (input data), gas, status, decoded logs.
  • Rozumět events: např. Transfer(address,address,uint256) při ERC-20, Swap, Mint, Burn při DEX.
  • Ověřovat kontrakt (verified source) a kontrolovat proxy patterny (EIP-1967, beacons).

Základní heuristiky pro adresy a entity (pozor na omyly)

  • Common-input ownership (UTXO): vstupy v jedné transakci často patří stejné entitě. Výjimky: CoinJoin a mixing.
  • Change address detekce: heuristika pro rozlišení výdaje a „vrácení“ v UTXO transakci.
  • Contract interaction fingerprints: sekvence volání a signatur funkcí odhalují typ aktéra (např. liquidátor).
  • Temporal clustering: dávkové výběry/depozity v pravidelných intervalech signalizují CEX nebo custody.

Peněženky v praxi: cold, hot, multisig, trezory

Při sledování protokolů a trezorů (DAO, multisig) sledujte odvozené toky (incoming grants, emissions, LP odměny) a governance operace. Multisigy mají charakteristické vzory (připravené transakce, potvrzení), které usnadňují labelování.

DeFi metriky pro začátečníky

  • TVL: suma depozit v protokolu; sledujte rozklad podle aktiv a řetězců, nikoli jen headline číslo.
  • DEX objemy a tržní podíl: denní swapy, tržní podíl poolů, slippage a koncentrace LP.
  • Lending: poměry kolaterálu, úrokové křivky, likvidační prahy, počty likvidací a jejich velikosti.
  • Emise a odměny: tempo ražení tokenů, distribuce na trezory, farmy, market makery.

NFT a sociální grafy

  • Mint kohorty: kdo mintoval, kdy a za kolik; wash trading odhalíte anomálními kruhovými toky a opakovanými protistranami.
  • Držitelská distribuce: koncentrace, doba držby, migrace mezi sbírkami.

Mosty a cross-chain data

Bridge kontrakty jsou uzly s vysokou mírou propojení. Sledujte lock-mint-burn-release toky a anomie (náhlé zastavení výdajů, nesrovnalosti bilancí). Při rollupech porovnávejte L2 závazky s L1 stavem (zůstatky canonical bridge, blob/DA publikace).

MEV: signály a dopady na metriky

  • Arbitráž a sandwich: transakční trojice okolo oběti; objeví se specifický gas tip a přilehlé nonce.
  • Likvidace: spike ve volání likvidačních funkcí, korelují s cenovými skoky a změnami funding.

Jednoduchá cvičení pro začátečníka

  1. Identifikujte 3 burzovní peněženky podle vzoru depozit a výběrů a vytvořte si vlastní label list.
  2. Změřte netflow stablecoinů do top 3 DEX poolů za posledních 7 dní.
  3. Vytvořte kohorty nových adres, které poprvé interagovaly s konkrétním protokolem; sledujte 30denní retence.

Metodické zásady: jak se nenechat nachytat

  • Kontext nad čísly: jednorázové inflowy mohou být interní přesuny; hledejte potvrzení v dalších datech.
  • Auditovatelnost: uveďte přesnou definici metriky (SQL, filtry, zdroje), aby byl výsledek reprodukovatelný.
  • Outliers: extrémní hodnoty kontrolujte manuálně (block explorer, kontraktové logy).
  • Jednotky a denominace: u tokenů s 18 desetinnými místy nezapomeňte na normalizaci; u cross-chain aktiv ošetřete wrappery a rebasing.

Praktická interpretace CEX/DEX toků

Začátečníci často chybují: připisují velký inflow na CEX jako „prodej“. Správný postup:

  1. Ověřit, zda adresa patří CEX a zda jde o depozitní vault nebo hot wallet.
  2. Zkontrolovat paralelní on-chain aktivity (např. přesuny stablecoinů zpět do DeFi, což může indikovat market making spíše než čistý prodej).
  3. Porovnat s objemem a strukturou objednávek na burzách (pokud jsou data dostupná) a s derivátovými metrikami (open interest, funding).

Kohorty a doba držby (holding analysis)

  • Age bands: rozklad zásob podle délky držby (např. 1–3m, 3–6m, 1–2y). Nárůst starších pásiem signalizuje akumulaci.
  • Realizovaný zisk/ztráta: sledování transakcí nad/pod nákupní cenou (vyžaduje aproximace nákladové báze).

Riziková analytika protokolů

  • Koncentrace kolaterálu: top 10 adres vs. zbytek, citlivost na cenu a oracle.
  • Likvidační stěna: kumulované likvidační prahy podle ceny; mapuje potenciální kaskády.
  • Expozice vůči mostům: procento TVL v wrapped aktivech a jednom mostě (jednotlivý bod selhání).

Etika, soukromí a právní aspekty

Ačkoliv jsou data veřejná, respektujte soukromí a nepodléhejte doxxingu. Labelujte konzervativně, používejte důkazy a vyhýbejte se neoprávněnému zveřejňování identity jednotlivců.

Kontrolní seznam pro vlastní mini-projekt on-chain analytiky

  1. Definujte otázku (např. „Jak se mění netflow stablecoinů do DEX během výprodejů?“).
  2. Přesně specifikujte metriky (agregace, intervaly, filtry, kontrakty).
  3. Sestavte ETL: získejte transakce a eventy, normalizujte desetinná místa, přiřaďte labely.
  4. Validujte na malém vzorku (ručně přes explorer) a až potom škálujte.
  5. Vizualizujte a napište krátkou interpretaci s omezeními a nejistotami.

Nejčastější chyby začátečníků

  • Spoléhat se na jedno číslo bez kontextu (např. „CEX inflow = bearish“).
  • Špatně rozpoznat kontraktovou adresu jako EOA nebo naopak.
  • Ignorování reorgů a specifik sítě (finalita, L2 publikace, mostové latence).
  • Zaměňování „toků“ s „objemy“ (flow je čistý směr, objem je aktivita bez směru).

Kam dál: rozšířené techniky

  • Adresní klasterizace: grafové algoritmy na shlukování entit z heuristik.
  • Anomální detekce: časové modely (EWMA, z-score), pravděpodobnostní modely, detekce komunitní struktury.
  • Simulace a backtest: z on-chain eventů odvozená pravidla (např. vstup při prudkém netflow stable → výstup při reverzi).

Shrnutí

On-chain analytika stojí na pochopení modelu účetnictví, peněženek a kontraktů, disciplíně v labelování a přesných definicích metrik toků. Začněte s explorerem, jednoduchými netflow a cohort analýzami, budujte vlastní katalog labelů a vždy validujte na surových datech. Jen tak proměníte veřejná data v použitelná, opakovatelná a rozhodovatelná poznání.