Co je bonita a proč ji modelovat
Bonita klienta představuje pravděpodobnost, že klient splní své finanční závazky v plném rozsahu a včas. Hodnocení bonity je jádrem řízení úvěrového rizika a ovlivňuje celý úvěrový cyklus: před-schválení, stanovení ceny, limity, zajištění, monitoring, vymáhání i kapitálové požadavky. Moderní bankovnictví využívá spektrum modelů – od expertně nastavených skórovacích karet až po strojové učení – s cílem odhadnout pravděpodobnost selhání (PD), očekávanou ztrátu (EL = PD × LGD × EAD), ztrátu při selhání (LGD) a expozici při selhání (EAD). Výsledkem je kvantifikace rizika, která se následně transformuje do obchodních rozhodnutí a kapitálové přiměřenosti.
Typy modelů podle místa použití v úvěrovém cyklu
- Application scoring – hodnotí nové žadatele při vstupu (onboarding). Využívá demografii, příjem, zaměstnání, úvěrovou historii a údaje z registrů.
- Behavioral scoring – průběžné hodnocení stávajících klientů na základě platebního chování, zůstatků, využití limitů, změn v příjmu a transakčních vzorů.
- Collection/Recovery scoring – řídí strategie vymáhání (časování kontaktů, nabídky splátkových kalendářů) podle pravděpodobnosti návratu k plné platební disciplíně.
- SME/Corporate rating – ratingové modely pro malé, střední a korporátní podniky; kombinují finanční ukazatele, kvalitativní faktory a odvětvové riziko.
- LGD a EAD modely – odhadují míru ztráty a expozici v čase selhání; klíčové pro kapitál a IFRS 9 očekávané kreditní ztráty (ECL).
Expertně-pravidlové přístupy a skórovací karty
Historicky první byly expertní pravidla (cut-offy na příjem, DTI, věk, typ zaměstnání) a skórovací karty s bodováním atributů. Karty se často tvoří přes monotónní binningy proměnných, Weight of Evidence (WoE) transformaci a Information Value (IV) pro výběr prediktorů. Výhody: transparentnost, jednoduché nasazení a vysvětlitelnost. Nevýhody: omezená nelinearita a interakce, nižší výkon na komplexních datech.
Statistické modely: logistická regresi a její rozšíření
Logistická regresi je průmyslovým standardem pro PD v retailu: nabízí interpretovatelné koeficienty, dobře se kalibruje a pracuje s WoE transformacemi. Rozšíření zahrnují regularizaci (L1/L2) pro prevenci přeučení, splajny pro nelinearity a interakční členy pro klíčové kombinace. Kalibrace se provádí pomocí Platt scaling nebo isotonické regrese k dosažení souladu odhadů s empirickými PD.
Strojové učení: stromy, ansámblové metody a neuronové sítě
- Rozhodovací stromy – přirozeně modelují nelinearity; samostatně však často přeučují.
- Random Forest – snižuje varianci pomocí baggingu, odolný vůči odlehlým hodnotám, ale méně interpretovatelný.
- Gradient Boosting (XGBoost, LightGBM, CatBoost) – standard pro vysoký prediktivní výkon; výborně pracuje s heterogenními znaky.
- Support Vector Machines – účinné na vysoce dimenzionální data; hůře se kalibrují a vysvětlují.
- Neuronové sítě – využitelné při velkých transakčních datech, sekvenčních vzorcích a alternativních zdrojích (open banking, telekomunikační data); vyžadují důkladnou kalibraci a vysvětlitelnost.
Strukturální a kombinační modely bonity podniků
- Poměrové modely (např. logika Altman Z-score, Ohlson O-score) – využívají likviditu, zadluženost, rentabilitu a aktivitu; poskytují rychlou orientaci.
- Strukturální modely (Merton/KMV) – odvozují PD z tržní hodnoty aktiv a volatility; vhodné pro obchodované společnosti.
- Kombinované ratingy – spojují finanční poměry, kvalitativní faktory (řízení, odvětví, postavení na trhu) a externí signály (registry, platební disciplína).
Point-in-Time (PIT) vs. Through-the-Cycle (TTC) PD
PIT PD reflektují aktuální makroekonomické podmínky a okamžité riziko – používají se v IFRS 9 pro ECL a v operativním pricingu rizika. TTC PD vyhlazují cyklus a slouží pro kapitálové modely a limity. Často se zavádí makroekonomický overlay pro PIT a mapování mezi PIT a TTC pomocí cyklických faktorů.
Data: zdroje, kvalita a feature engineering
- Interní data – žádosti, splácení, transakce, chování kanálů, interakce se zákaznickým servisem.
- Externí registry – bankovní a nebankovní úvěrové registry, obchodní rejstřík, insolvenční registry, daňová data (pokud jsou legálně dostupná).
- Open Banking a alternativní data – agregace účtů, účel plateb, vzory příjmů, volatilita cash flow, zařízení/behaviorální signály.
- Feature engineering – stabilní agregáty (percentily, rolling průměry), trendové indikátory, utilization ratios, volatilita, sezónnost, deltá v rámci peer group.
- Kvalita dat – chybějící hodnoty, konzistence, duplicity, zpoždění; metriky jako data completeness a anomaly rate.
Výběr vzorku a problém odmítnutých žádostí (reject inference)
Modely trénované pouze na přijatých klientech trpí selection biasem. Reject inference koriguje odhad PD odmítnutých žádostí. Přístupy: augmentation (přiřazení fiktivních štítků podle podobnosti), parceling (redistribuce defaultu ve skupinách), two-model approach (model přijetí × model defaultu), případně propensity score weighting. Klíčové je provádět stability checks a citlivostní analýzy.
Modelové metriky: diskriminace, kalibrace a stabilita
- Diskriminační síla – ROC AUC, Gini (2×AUC−1), KS statistika.
- Kalibrace – Brier score, Hosmer–Lemeshow test, reliabilitní křivky, expected vs. observed PD v decilech.
- Stabilita – PSI (Population Stability Index), CSI (Characteristic Stability Index), drift atributů.
- Klasifikační prahy – optimalizace podle cost matrix (cena falešných pozitivních/negativních), expected loss nebo obchodních cílů (schvalovatelnost, NPL).
IFRS 9 a očekávané kreditní ztráty (ECL)
IFRS 9 zavádí Stage 1–3 podle významného zvýšení kreditního rizika (SICR). Pro Stage 1 se počítá 12měsíční ECL, pro Stage 2 a 3 doživotní ECL. Modely PIT PD jsou projektovány dopředu pomocí makroekonomických scénářů (baseline, adverse, severe) s pravděpodobnostními váhami; LGD má downturn a workout pohled (cash flow z vymáhání, diskontování). EAD zahrnuje kreditní konverzní faktory (CCF) pro limity a kontokorenty.
Basel/CRR rámec a kapitálové modely
V režimu IRB banky odhadují vlastní PD, LGD, EAD a M (doba do splatnosti) pro výpočet kapitálových požadavků. Požadavky zahrnují downturn LGD, margin of conservatism, low default portfolio (LDP) techniky (Bayes, pooling, expertní úsudek) a use test – prokazování využití modelů v praxi (limity, pricing, rozhodování).
Fairness, GDPR a vysvětlitelnost
Automatizované rozhodování musí respektovat GDPR (transparentnost, minimalizace údajů, právo na vysvětlení). Hodnotí se fairness vůči chráněným skupinám (testy parity schvalování, rozdíly v chybovosti, equalized odds). Pro pokročilé modely se používají SHAP a ICE grafy pro lokální i globální vysvětlení, přičemž se aplikují monotonic constraints (např. vyšší prodlení nikdy nezlepšuje skóre).
Řízení rizika modelů a governance
- Životní cyklus modelu – návrh, vývoj, nezávislá validace, schválení, implementace, monitoring, rekalibrace, stažení z provozu.
- Dokumentace – účel, zdroje dat, transformace, předpoklady, limity, výsledky testů, citlivostní analýzy.
- Backtesting a challenger modely – porovnání se zjednodušenými či alternativními přístupy.
- Kontrolní limity – prahové hodnoty pro AUC/Gini, PSI, odchylky PD-observed, override rates.
Kalibrace, rekalibrace a monitoring v čase
Po nasazení je nutné kontinuálně sledovat calibration drift (např. poměr expected–observed), feature drift a vliv makroekonomických změn. Rekalibrace může být technická (posun interceptu), parciální (úprava koeficientů) nebo plná (nový trénink). V krizových obdobích se aplikuje overlay nebo procyclicality dampeners.
Nasazení do praxe: rozhodovací strategie a pricing
- Cut-off strategie – kombinované prahy pro schválení, manuální revizi a zamítnutí; často v kombinaci s policy rules (věk, DTI, LTV).
- Risk-based pricing – převod PD/LGD/EAD do marže a RPMN při respektování regulací (stropy RPMN, odpovědné úvěrování).
- Řízení limitů – dynamická úprava limitů kreditních karet/čerpaní podle behaviorálního skóre a rizikového apetitu.
- Kolekční strategie – segmentace podle pravděpodobnosti cure vs. roll; optimalizace frekvence kontaktu a kanálu.
Modely LGD a EAD: specifika a metodiky
LGD se odhaduje metodou workout (diskontované cash flow z vymáhání minus náklady) nebo market (ceny zajištění, recovery rates). U zajištěných hypoték je klíčový LTV v čase selhání, volatilita cen a náklady realizace zajištění. EAD u revolvingových produktů využívá Credit Conversion Factor nebo Levine-Sebe přístup pro odhad čerpání před defaultem.
Makroekonomická propojení a stresové testování
Pro PIT rámec jsou PD modely spojovány s makro proměnnými (nezaměstnanost, příjmy, sazby, ceny nemovitostí). Stresové testy simulují extrémní, ale věrohodné scénáře a sledují dopad na PD/LGD/EAD, kapitál a likviditu. Důležité je reverse stress testing pro identifikaci scénářů vedoucích k porušení kapitálových limitů.
Specifika pro segmenty: retail vs. SME vs. korporáty
- Retail – vysoký objem, nízká jednotková expozice; modely jsou silně datově řízené a automatizované.
- SME – heterogenní data a kvalita účetnictví; kombinace finančních poměrů, kvalitativních posouzení a behaviorálních znaků.
- Korporáty – důraz na forward-looking analýzu cash flow, odvětvové scénáře, kvalitu managementu a kovenanty; modely často slouží jako input pro expertní ratingový výbor.
Implementační otázky: IT architektura a realtime scoring
Nasazení vyžaduje model serving (API), verzionování a feature store pro konzistentní výpočty v tréninku i produkci (training–serving skew). Latency je kritická při online onbordingu; batch scoring se aplikuje při měsíčním monitoringu portfolia. Logování pro audit musí obsahovat vstupní znaky, skóre, rozhodnutí a vysvětlení.
Etika, robustnost a odolnost modelů
- Robustnost – citlivost na malé změny vstupů, odolnost vůči odlehlým hodnotám, ochrana proti záměrné manipulaci (gaming).
- Etika – vyloučení explicitně chráněných znaků a proxy proměnných