Backtesting a forward-testing strategií: omezení a rizika

Dvě fáze jednoho validačního cyklu

Backtesting a forward-testing jsou komplementární kroky při návrhu a ověřování obchodních strategií. Backtest testuje hypotézu na historických datech s cílem změřit, zda by strategie obstála v minulosti. Forward-test (out-of-sample, paper/live) následně ověřuje chování na „nových“ datech – ideálně v reálném čase – a odhaluje praktické nedostatky exekuce. V kryptoprostoru se do této dvojice promítá specifická mikrostruktura (perpetuály, funding, L2/L3 latence, MEV), nízká standardizace dat a časté režimové zlomy. Tento článek mapuje limity a nástrahy obou fází a nabízí metodiky, jak je systematicky zvládnout.

Backtesting: co měří a co nikdy měřit nebude

  • Co měří: robustnost vzoru v historických datech, citlivost na parametry, distribuci výnosů, drawdowny a kapacitní limity při předpokládaných nákladech.
  • Co neměří: budoucí stacionaritu vztahů, kvalitu exekuce vůči skutečné orderbook dynamice (front-running, MEV), výpadky infrastruktury a slippage během šoků.
  • Závěr: backtest je filtr, nikoliv důkaz. Má vyloučit zjevně nefunkční nápady a zúžit prostor pro další výzkum.

Klasické nástrahy backtestu

  • Data snooping & overfitting: čím více parametrů a pokusů, tím vyšší riziko, že trefíte šum. Symptémem je extrémní Sharpe pouze v jedné vzorke.
  • Look-ahead bias: použití informace, která nebyla v době rozhodnutí známá (např. denní VWAP při intradenním rozhodnutí).
  • Survivorship bias: vynechání zaniklých aktiv/burz vede k nadhodnocení výkonu.
  • Selection bias: výběr „hezkých“ trhů/okének; ignorování období s nízkou likviditou nebo odlišnou mikrostrukturou.
  • Transaction cost mis-modeling: použití statické provize a slippage, ignorování impact cost a fundingů na perpetual trzích.
  • Time-stamp a synchronizace: špatně sladěné burzy/zdroje (spread, funding, on-chain události) generují umělou „alfu“.

Mikrostrukturální specifika krypta v backtestu

  • Perpetuály a funding: funding není poplatek; je to tok závislý na pozici a době držení. Backtest musí účtovat akruálně a napříč burzami.
  • Likvidita a kapacita: alt trhy mají mělké knihy; simulujte omezení participation-rate (např. <10 % objemu) a limitujte nárazové market příkazy.
  • MEV a DEX exekuce: deterministická cesta transakce (mempool → blok) vytváří sandwich riziko; bez anti-MEV se backtest na swapové ceně mýlí.
  • Regime shifts: události (ETF zařazení, chain fork, stable depeg, výpadek CEX) mění distribuci výnosů a korelací.

Správná konstrukce backtest enginu

  • Event-driven simulace: reakce na tick/orderbook změny a plánované batchi; latence modelujte explicitně (od signálu po fill).
  • Fill model: limit/market s částečnými plněními, queue priority (time-price), skokové gapy při šocích.
  • Slippage a impact: kombinujte model temporary/permanent impact (např. Almgren–Chriss) s empirickými křivkami podle velikosti příkazu a hloubky knihy.
  • Poplatky a funding: maker/taker tiering, dynamické fee, lending borrow rate, funding s intradenní granularitou.
  • Corporate actions a anomálie: token spiny, rebrand, delisty, fat-finger svíčky – databázi upravujte s audit trailem, nikoliv ad hoc „čištěním“.

Statistické korekce proti přeoptimalizaci

  • Purged & embargoed cross-validation: časové k-fold dělení s „čištěním“ úniků informací na hranách oken.
  • White’s Reality Check a SPA test: korigují p-hodnoty při soutěži mnoha modelů/hypotéz.
  • Deflated Sharpe Ratio (DSR): upravuje Sharpe o počet pokusů a délku série; snižuje falešné pozitivy.
  • Probability of Backtest Overfitting (PBO): odhaduje pravděpodobnost, že „vítěz“ je výsledkem náhody.
  • Bootstrapy: stationary/block bootstrap, permutace výnosů, resampling reziduí zachovává autokorelace.

Forward-testing: most mezi papírem a kapitálem

Cílem je ověřit, že signál přežije střet s realitou exekuce a provozu. Postupujte v eskalaci rizika:

  1. Paper trading (shadow orders): reálné signály, simulovaná pravidla plnění, přesná evidence latencí.
  2. Sandbox / micro-capital: miniaturní pozice s omezeným downside; verifikace funding, fee a slippage.
  3. Partial live: A/B rozdělení (např. 10–20 % kapitálu na live, zbytek paper) a porovnání realizované vs. simulované exekuce.
  4. Plný provoz: s kill switch limity (max denní ztráta, max slippage, max reject rate), monitoringem a alerty.

Co forward-test odhalí, backtest často ne

  • Latency & queue dynamics: pořadí v knize a reálná plnění při „hot“ úrovních; paper fill ≠ live fill.
  • Market states: zvýšená chybovost API při přetížení, rate limit, čekání na potvrzení na chainu.
  • Operativní rizika: restarty nodů, drift hodin, rounding, selhání závislostí (oracly, peněženky, brokeři).
  • Behaviorální překvapení: skoky slippage během makro událostí, funding squeezes, likvidační kaskády.

Metodika dělení dat: in-sample, out-of-sample, walk-forward

  • Holdout out-of-sample: posledních 20–30 % období nechat nedotčených pro finální ověření.
  • Walk-forward optimalizace: trénink v okně, validace v dalším okně; opakovat v klouzavém režimu s fixním/expanzivním oknem.
  • Více režimové rozdělení: zohlednit bull, bear, chop, vysokou/nízkou volatilitu; strategie musí fungovat alespoň ve dvou režimech.

Měření výkonu: nejen Sharpe

  • Sharpe/Sortino/Calmar: zohledňujte nenormálnost rozdělení (fat tails), používejte Newey–West korekci pro autokorelace.
  • Hit-rate & payoff ratio: důležitý je poměr výher k ztrátám a distribuce výnosů (skew/kurtóza).
  • Turnover a kapacita: denní obrat, market share, participation rate; výkon při škálování dolů/vzhůru.
  • Realizovaný vs. simulovaný P&L: analýza odchylky: slippage, drift poplatků, reject/cancel rate, efekt částečného plnění.

Řízení modelu: verzování, auditovatelnost, reprodukovatelnost

  • Data lineage: zdroje, transformace, timestampy, verze symbolů a kontraktů.
  • Experiment tracking: parametry, seed, metriky, artefakty; zákaz „mimo systému“ úprav.
  • Change control: každá změna strategie přes pull request, peer review, unit/integration testy backtest enginu.
  • Risk gates: automatické odmítnutí nasazení při překročení limitů (max DD, VaR, slippage, P&L volatility).

Nákladové modely: od poplatků k impact costu

  • Poplatky: maker/taker, objemové tieringy, affiliate slevy – modelujte jako funkci objemu a času.
  • Funding & borrow: pro perp/futures a spot margin; účtujte s reálnou frekvencí (8h, 1h, kontinuálně).
  • Slippage: odhadujte podle order book snapshotu v čase signálu; při limit exekuci modelujte queue wait a fill ratio.
  • Impact: nelineární, roste s podílem na objemu; kalibrujte z live dat, nikoli z teorie.

Stres testy a scénáře

  • Replay krizí: opakujte historické šoky (depegy, flash crashes, zařazení ETF) s aktuálními parametry strategie.
  • Parametrické stresy: +x bps na slippage, 2× poplatky, 50 % pokles likvidity, dvojnásobný funding.
  • Monte Carlo: resampling výnosů/reziduí, blokové bootstrapy zachovávající klastrování volatility.
  • Disaster drills: výpadek burzy, zmrazení výběrů, odpojení nodu – ověřte kill switch a degradovaný režim.

Forward-test KPI a rozhodovací pravidla

  • Acceptance band: dovolte ±X % odchylku mezi simulovaným a realizovaným P&L; mimo pásmo → root-cause analýza.
  • Runbook live incidentů: co dělat při reject rate > N %, při slippage > M bps, při odpojení datového feedu.
  • Escalation path: automatický přechod na menší sizingy nebo paper režim po sérii anomálií.

Škálování od nápadu k portfoliu

  • Ensemble a ortogonalita: preferujte více slabších, nekorelovaných signálů před jedním „dokonalým“ modelem.
  • Capital allocation: Kelly/half-Kelly s omezeními, ERC (equal risk contribution), volatility targeting.
  • Režimové přepínače: aktivace/deaktivace strategií dle tržního režimu; zamezí „jezdit na prázdno“.

Specifika on-chain strategií

  • Gas a priority fees: dynamické bidování; modelujte jako náhodnou proměnnou vázanou na mempool load.
  • Batch/auction settlement: periodicita settlementu mění mark-to-market a exekuční logiku.
  • MEV ochrana: private RPC, bundle služby; v backtestu penalizujte volné cesty, které by v praxi byly sandwichovány.

Checklist: kvalitní backtest & forward-test

  1. Jasná hypotéza a ekonomická intuice (nikoli „parametrická loterie“).
  2. Čistá data se záznamem úprav, bez look-ahead a survivorship biasu.
  3. Event-driven simulace s realistickým fill a cost modelem.
  4. Purged time CV, DSR/SPA/Reality Check proti přeoptimalizaci.
  5. Out-of-sample + walk-forward napříč tržními režimy.
  6. Stres testy: šoky, likvidita, poplatky/funding, infra incidenty.
  7. Forward paper → micro live → partial live s akceptačními pásmy.
  8. Experiment tracking, verzování, peer review, change control.
  9. Risk gates: sizing, max DD, VaR, kill switch, participation cap.
  10. Průběžné porovnávání simulovaného vs. realizovaného výkonu a korektivní zásahy.

Disciplína nad optimismem

Backtest je nezbytný, ale nedostačující; forward-test je realita s bezpečnostními pásy. Skutečná robustnost nevzniká z jednoho krásného equity curve, ale z procesu: poctivá statistika, realistická simulace, přísná kontrola změn a důsledná live měření. V kryptoprostoru – s častými změnami režimů a mikrostruktury – je právě tento proces největší konkurenční výhodou.

Disclaimer

Tento článek je informativní a nepředstavuje investiční, právní ani daňové poradenství. Obchodování s kryptoměnami a deriváty je rizikové; používejte adekvátní řízení rizik a testujte strategie na vlastních datech a infrastruktuře.