Co je bonita a proč ji modelovat
Bonita klienta představuje pravděpodobnost, že klient splní své finanční závazky v plném rozsahu a včas. Hodnocení bonity je jádrem řízení úvěrového rizika a ovlivňuje celý úvěrový cyklus: předběžné schválení, pricing, limity, zajištění, monitoring, vymáhání i kapitálové požadavky. Moderní bankovnictví využívá spektrum modelů – od expertně nastavených skórovacích karet až po strojové učení – s cílem odhadnout pravděpodobnost selhání (PD), očekávanou ztrátu (EL = PD × LGD × EAD), ztrátu při selhání (LGD) a expozici při selhání (EAD). Výsledkem je kvantifikace rizika, která se následně transformuje do obchodních rozhodnutí a kapitálové přiměřenosti.
Typy modelů podle místa použití v úvěrovém cyklu
- Application scoring – hodnotí nové žadatele při vstupu (onboarding). Využívá demografii, příjem, zaměstnání, úvěrovou historii a data z registrů.
- Behavioral scoring – průběžné hodnocení stávajících klientů na základě platebního chování, zůstatků, využití limitů, změn v příjmu a transakčních vzorů.
- Collection/Recovery scoring – řídí strategie vymáhání (časování kontaktů, nabídky splátkových kalendářů) podle pravděpodobnosti návratu k plné platební disciplíně.
- SME/Corporate rating – ratingové modely pro malé, střední a korporátní podniky; kombinují finanční ukazatele, kvalitativní faktory a odvětvové riziko.
- LGD a EAD modely – odhadují míru ztráty a expozici v čase selhání; klíčové pro kapitál a IFRS 9 očekávané kreditní ztráty (ECL).
Expertní-pravidlové přístupy a skórovací karty
Historicky první byly expertní pravidla (cut-offy na příjem, DTI, věk, typ zaměstnání) a skórovací karty s bodováním atributů. Karty se často vytvářejí pomocí monotónního binningu proměnných, Weight of Evidence (WoE) transformace a Information Value (IV) pro výběr prediktorů. Výhody: transparentnost, jednoduché nasazení a vysvětlitelnost. Nevýhody: omezená nelinearita a interakce, nižší výkon na komplexních datech.
Statistické modely: logistická regrese a její rozšíření
Logistická regrese je průmyslovým standardem pro PD v retailu: nabízí interpretovatelné koeficienty, dobře se kalibruje a pracuje s WoE transformacemi. Rozšíření zahrnují regularizaci (L1/L2) na prevenci přeškolení, splajny pro nelinearity a interakční členy pro klíčové kombinace. Kalibrace se provádí pomocí Platt scaling nebo isotonické regrese k souladu odhadů s empirickými PD.
Strojové učení: stromy, ansambly a neuronové sítě
- Rozhodovací stromy – přirozeně modelují nelinearity; samostatně se však často přeučují.
- Random Forest – snižuje varianci baggingem, robustní vůči outlierům, ale méně interpretovatelný.
- Gradient Boosting (XGBoost, LightGBM, CatBoost) – standard pro vysoký prediktivní výkon; výborně pracuje s heterogenními znaky.
- Support Vector Machines – účinné na vysoce dimenzionální data; hůře se kalibrují a vysvětlují.
- Neuronové sítě – využitelné při velkých transakčních datech, sekvenčních vzorcích a alternativních zdrojích (open banking, telco); vyžadují důkladnou kalibraci a vysvětlitelnost.
Strukturální a kombinační modely bonity podniků
- Poměrové modely (např. logika Altman Z-score, Ohlson O-score) – využívají likviditu, zadluženost, rentabilitu a aktivitu; poskytují rychlou orientaci.
- Strukturální modely (Merton/KMV) – odvozují PD z tržní hodnoty aktiv a volatility; vhodné pro obchodované firmy.
- Kombinované ratingy – spojují finanční poměry, kvalitativní faktory (řízení, odvětví, postavení na trhu) a externí signály (registry, platební disciplína).
Point-in-Time (PIT) vs. Through-the-Cycle (TTC) PD
PIT PD reflektují aktuální makro podmínky a okamžité riziko – používají se v IFRS 9 pro ECL a v operativním risk pricingu. TTC PD vyhlazují cyklus a slouží pro kapitálové modely a limity. Často se zavádí makroekonomický overlay pro PIT a mapování mezi PIT a TTC přes cyklické faktory.
Data: zdroje, kvalita a inženýrství příznaků
- Interní data – žádosti, splácení, transakce, chování kanálů, interakce se zákaznickým servisem.
- Externí registry – bankovní a nebankovní úvěrové registry, obchodní rejstřík, insolvenční registry, daňová data (pokud jsou legálně dostupná).
- Open Banking a alternativní data – agregace účtů, účely plateb, vzory příjmů, variabilita cash flow, device/behaviorální signály.
- Feature engineering – stabilní agregáty (percentily, rolling průměry), trendové indikátory, utilization ratios, volatilita, seasonality, peer group delty.
- Kvalita dat – chybějící hodnoty, konzistence, duplicity, zpoždění; metriky jako data completeness a anomaly rate.
Výběr vzorku a problém odmítnutých žádostí (reject inference)
Modely trénované pouze na přijatých klientech trpí selection biasem. Reject inference koriguje odhad PD odmítnutých žádostí. Přístupy: augmentation (připsání fiktivních labelů podle podobnosti), parceling (redistribuce defaultu ve skupinách), two-model approach (model přijetí × model defaultu), případně propensity score vážení. Klíčové je provádět stability checks a citlivostní analýzy.
Modelové metriky: diskriminace, kalibrace a stabilita
- Diskriminační síla – ROC AUC, Gini (2×AUC−1), KS statistika.
- Kalibrace – Brier score, Hosmer–Lemeshow test, reliabilitní křivky, expected vs. observed PD v decilech.
- Stabilita – PSI (Population Stability Index), CSI (Characteristic Stability Index), drift příznaků.
- Klasifikační prahy – optimalizace podle cost matrix (cena falešných pozitiv/negativ), expected loss nebo obchodních cílů (schvalovatelnost, NPL).
IFRS 9 a očekávané kreditní ztráty (ECL)
IFRS 9 zavádí Stage 1–3 podle významného zvýšení kreditního rizika (SICR). Pro Stage 1 se počítá 12měsíční ECL, pro Stage 2 a 3 doživotní ECL. Modely PIT PD jsou projektovány dopředu pomocí makro scénářů (baseline, adverse, severe) s pravděpodobnostními váhami; LGD má downturn a workout pohled (cash flow z vymáhání, diskont). EAD zahrnuje kreditní konverzní faktory (CCF) pro limity a kontokorenty.
Basel/CRR rámec a kapitálové modely
V režimu IRB banky odhadují vlastní PD, LGD, EAD a M (doba do splatnosti) pro výpočet kapitálových požadavků. Požadavky zahrnují downturn LGD, margin of conservatism, low default portfolio (LDP) techniky (Bayes, pooling, expert judgement) a use test – prokázání využití modelů v praxi (limity, pricing, rozhodování).
Fairness, GDPR a vysvětlitelnost
Automatizované rozhodování musí respektovat GDPR (transparentnost, minimalizace dat, právo na vysvětlení). Hodnotí se fairness vůči chráněným skupinám (testy parity schvalování, rozdíl v chybovosti, equalized odds). Pro pokročilé modely se používají SHAP a ICE grafy pro lokální a globální vysvětlení, přičemž se uplatňují monotonic constraints (např. vyšší prodlení nikdy nezlepšuje skóre).
Model risk management a governance
- Životní cyklus modelu – návrh, vývoj, nezávislá validace, schválení, implementace, monitoring, rekalibrace, ukončení.
- Dokumentace – účel, datové zdroje, transformace, předpoklady, limity, výsledky testů, citlivostní analýzy.
- Backtesting a challenger modely – porovnání se zjednodušenými či alternativními přístupy.
- Kontrolní limity – práh pro AUC/Gini, PSI, odchylky PD-pozorované, override rates.
Kalibrace, rekalibrace a monitoring v čase
Po nasazení je nutné kontinuálně sledovat calibration drift (např. Expected–Observed poměr), feature drift a vliv makro změn. Rekalibrace může být technická (posun interceptu), parciální (úprava koeficientů) nebo plná (nový trénink). V krizových obdobích se aplikuje overlay nebo procyclicality dampeners.
Nasazení do praxe: rozhodovací strategie a pricing
- Cut-off strategie – kombinované prahy pro schválení, manuální review a zamítnutí; často ve spojení s policy rules (věk, DTI, LTV).
- Risk-based pricing – překlad PD/LGD/EAD do marže a RPMN při respektování regulací (stropy RPMN, odpovědné úvěrování).
- Limit management – dynamická úprava limitů kreditních karet/čerpání podle behaviorálního skóre a rizikového apetitu.
- Kolekční strategie – segmentace podle pravděpodobnosti cure vs. roll; optimalizace frekvence kontaktů a kanálu.
Modely LGD a EAD: specifika a metodiky
LGD se odhaduje metodou workout (diskontované cash flow z vymáhání minus náklady) nebo market (ceny zajištění, recovery rates). U zajištěných hypoték je klíčový LTV v čase selhání, volatilita cen a náklady realizace kolaterálu. EAD u revolvingových produktů využívá Credit Conversion Factor nebo Levine-Sebe přístup k odhadu čerpání před defaultem.
Makro propojení a stresové testování
Pro PIT rámec se PD modely spojují s makro proměnnými (nezaměstnanost, příjmy, sazby, ceny nemovitostí). Stresové testy simulují extrémní, ale pravděpodobné scénáře a sledují dopad na PD/LGD/EAD, kapitál a likviditu. Důležitý je reverse stress testing ke identifikaci scénářů vedoucích k porušení kapitálových limitů.
Specifika pro segmenty: retail vs. SME vs. korporáty
- Retail – vysoký objem, nízká jednotková expozice; modely jsou silně datově řízené a automatizované.
- SME – heterogenní data a kvalita účetnictví; kombinace finančních poměrů, kvalitativních posouzení a behaviorálních znaků.
- Korporáty – důraz na forward-looking analýzu cash flow, odvětvové scénáře, kvalitu managementu a kovenanty; modely často slouží jako input pro expertní ratingový výbor.
Implementační otázky: IT architektura a realtime scoring
Nasazení vyžaduje model serving (API), verzionování a feature store pro konzistentní výpočty v tréninku i produkci (training–serving skew). Latency je kritická u online onboardingů; batch scoring se uplatňuje při měsíčním monitoringu portfolia. Logging pro audit musí obsahovat vstupní znaky, skóre, rozhodnutí a vysvětlení.
Etika, robustnost a odolnost modelů
- Robustnost – citlivost na malé změny vstupů, odolnost vůči outlierům, vůči záměrné manipulaci (gaming).
- Etika – vyloučení explicitních chráněných znaků a proxy proměnných; pravidelné fairness audity.
- Bezpečnost – kontrola kvality datových kanálů, detekce anom