Modely hodnocení bonity klienta

Co je bonita a proč ji modelovat

Bonita klienta představuje pravděpodobnost, že klient splní své finanční závazky v plném rozsahu a včas. Hodnocení bonity je základem řízení úvěrového rizika a ovlivňuje celý úvěrový cyklus: předschválení, stanovení ceny, limity, zajištění, monitoring, vymáhání i kapitálové požadavky. Moderní bankovnictví využívá spektrum modelů – od expertně nastavených skórovacích karet až po strojové učení – s cílem odhadnout pravděpodobnost selhání (PD), očekávanou ztrátu (EL = PD × LGD × EAD), ztrátu při selhání (LGD) a expozici při selhání (EAD). Výsledkem je kvantifikace rizika, která se následně transformuje do obchodních rozhodnutí a kapitálové přiměřenosti.

Typy modelů podle místa použití v úvěrovém cyklu

  • Application scoring – hodnotí nové žadatele při vstupu (onboarding). Využívá demografii, příjem, zaměstnání, úvěrovou historii a údaje z registrů.
  • Behavioral scoring – průběžné hodnocení existujících klientů na základě platebního chování, zůstatků, využití limitů, změn v příjmu a transakčních vzorů.
  • Collection/Recovery scoring – řídí strategie vymáhání (časování kontaktů, nabídky splátkových kalendářů) podle pravděpodobnosti návratu do plné platební disciplíny.
  • SME/Corporate rating – ratingové modely pro malé, střední a korporátní podniky; kombinují finanční ukazatele, kvalitativní faktory a odvětvové riziko.
  • LGD a EAD modely – odhadují míru ztráty a expozici v době selhání; klíčové pro kapitál a IFRS 9 očekávané kreditní ztráty (ECL).

Expertní-pravidlové přístupy a skórovací karty

Historicky první byly expertní pravidla (cut-offy na příjem, DTI, věk, typ zaměstnání) a skórovací karty s bodováním atributů. Karty se často vytvářejí přes monotónní binningy proměnných, Weight of Evidence (WoE) transformaci a Information Value (IV) pro výběr prediktorů. Výhody: transparentnost, jednoduché nasazení a vysvětlitelnost. Nevýhody: omezená nelinearita a interakce, nižší výkon na komplexních datech.

Statistické modely: logistická regrese a její rozšíření

Logistická regrese je průmyslovým standardem pro PD v retailu: nabízí interpretovatelné koeficienty, dobře se kalibruje a pracuje s WoE transformacemi. Rozšíření zahrnují regularizaci (L1/L2) k prevenci přeucení, splajny pro nelinearity a interakční členy pro klíčové kombinace. Kalibrace se provádí pomocí Platt scaling nebo isotonické regrese pro sladění odhadů s empirickými PD.

Strojové učení: stromy, ansambly a neuronové sítě

  • Rozhodovací stromy – přirozeně modelují nelinearity; samostatně však často přeučují.
  • Random Forest – snižuje varianci baggingem, je robustní vůči outlierům, ale méně interpretovatelný.
  • Gradient Boosting (XGBoost, LightGBM, CatBoost) – standard pro vysoký prediktivní výkon; výborně pracuje s heterogenními znaky.
  • Support Vector Machines – účinné na vysoce dimenzionální data; hůře se kalibrují a vysvětlují.
  • Neuronové sítě – využitelné při velkých transakčních datech, sekvenčních vzorech a alternativních zdrojích (open banking, telco); vyžadují důkladnou kalibraci a vysvětlitelnost.

Strukturální a kombinační modely bonity podniků

  • Poměrové modely (např. logika Altman Z-score, Ohlson O-score) – využívají likviditu, zadluženost, rentabilitu a aktivitu; poskytují rychlou orientaci.
  • Strukturální modely (Merton/KMV) – odvozují PD z tržní hodnoty aktiv a volatility; vhodné pro obchodované firmy.
  • Kombinované ratingy – spojují finanční poměry, kvalitativní faktory (řízení, odvětví, pozice na trhu) a externí signály (registr, platební disciplína).

Point-in-Time (PIT) vs. Through-the-Cycle (TTC) PD

PIT PD reflektují aktuální makro podmínky a okamžité riziko – používají se v IFRS 9 pro ECL a v operativním risk pricingu. TTC PD vyhlazují cyklus a slouží pro kapitálové modely a limity. Často se zavádí makroekonomický overlay pro PIT a mapování mezi PIT a TTC přes cyklické faktory.

Data: zdroje, kvalita a příznaková inženýrská činnost

  • Interní data – žádosti, splácení, transakce, chování kanálů, interakce se zákaznickým servisem.
  • Externí registry – bankovní a nebankovní úvěrové registry, obchodní rejstřík, insolvenční registry, daňová data (pokud jsou legálně dostupná).
  • Open Banking a alternativní data – agregace účtů, účel plateb, vzory příjmů, variabilita cash flow, device/behaviorální signály.
  • Feature engineering – stabilní agregáty (percentily, klouzavé průměry), trendové indikátory, utilization ratios, volatilita, seasonality, peer group deltas.
  • Kvalita dat – chybějící hodnoty, konzistence, duplicita, zpoždění; metriky jako data completeness a anomaly rate.

Výběr vzorku a problém odmítnutých žádostí (reject inference)

Modely trénované pouze na přijatých klientech trpí selection biasem. Reject inference koriguje odhad PD odmítnutých žádostí. Přístupy: augmentation (připsání fiktivních labelů podle podobnosti), parceling (redistribuce defaultu ve skupinách), two-model approach (model přijetí × model defaultu), případně propensity score weighting. Klíčové je provádět stability checks a citlivostní analýzy.

Modelové metriky: diskriminace, kalibrace a stabilita

  • Diskriminační síla – ROC AUC, Gini (2×AUC−1), KS statistika.
  • Kalibrace – Brier score, Hosmer–Lemeshow, reliabilitní křivky, expected vs. observed PD v decilech.
  • Stabilita – PSI (Population Stability Index), CSI (Characteristic Stability Index), drift příznaků.
  • Klasifikační prahy – optimalizace podle cost matrix (cena falešných pozitiv/negativ), expected loss nebo obchodních cílů (schvalovatelnost, NPL).

IFRS 9 a očekávané kreditní ztráty (ECL)

IFRS 9 zavádí Stage 1–3 podle významného zvýšení kreditního rizika (SICR). Pro Stage 1 se počítá 12měsíční ECL, pro Stage 2 a 3 doživotní ECL. Modely PIT PD jsou projektovány dopředu pomocí makro scénářů (baseline, adverse, severe) s pravděpodobnostními váhami; LGD má downturn a workout pohled (cash flow z vymáhání, diskont). EAD zahrnuje kreditní konverzní faktory (CCF) pro limity a kontokorenty.

Basel/CRR rámec a kapitálové modely

V režimu IRB banky odhadují vlastní PD, LGD, EAD a M (doba splatnosti) pro výpočet kapitálových požadavků. Požadavky zahrnují downturn LGD, margin of conservatism, low default portfolio (LDP) techniky (Bayes, pooling, expertní úsudek) a use test – prokazování využití modelů v praxi (limity, pricing, rozhodování).

Fairness, GDPR a vysvětlitelnost

Automatizované rozhodování musí respektovat GDPR (transparentnost, minimalizace údajů, právo na vysvětlení). Hodnotí se fairness vůči chráněným skupinám (testy parity schvalování, rozdíl v chybovosti, equalized odds). Pro pokročilé modely se používají SHAP a ICE grafy pro lokální a globální vysvětlení, přičemž se uplatňují monotonic constraints (např. vyšší prodlení nikdy nezlepšuje skóre).

Model risk management a governance

  • Životní cyklus modelu – návrh, vývoj, nezávislá validace, schválení, implementace, monitoring, rekalibrace, vyřazení.
  • Dokumentace – účel, datové zdroje, transformace, předpoklady, limity, výsledky testů, citlivostní analýzy.
  • Backtesting a challenger modely – porovnání se zjednodušenými či alternativními přístupy.
  • Kontrolní limity – prahové hodnoty pro AUC/Gini, PSI, odchylky PD-pozorované, override rates.

Kalibrace, rekalibrace a monitoring v čase

Po nasazení je nutné kontinuálně sledovat calibration drift (např. Expected–Observed poměr), feature drift a vliv makro změn. Rekalibrace může být technická (posun interceptu), parciální (úprava koeficientů) nebo plná (nový trénink). V krizových obdobích se aplikuje overlay nebo procyclicality dampeners.

Nasazení do praxe: rozhodovací strategie a pricing

  • Cut-off strategie – kombinované prahy pro schválení, manuální review a zamítnutí; často ve spojení s policy rules (věk, DTI, LTV).
  • Risk-based pricing – překládání PD/LGD/EAD do marže a RPMN při respektování regulací (stropy RPMN, odpovědné úvěrování).
  • Limit management – dynamická úprava limitů kreditních karet/čerpaní podle behaviorálního skóre a rizikového apetitu.
  • Kolekční strategie – segmentace podle pravděpodobnosti cure vs. roll; optimalizace frekvence kontaktu a kanálu.

Modely LGD a EAD: specifika a metodiky

LGD se odhaduje metodou workout (diskontované cash flow z vymáhání minus náklady) nebo market (ceny zajištění, recovery rates). U zajištěných hypoték je klíčový LTV v době selhání, volatilitě cen a náklady realizace zajištění. EAD u revolvingových produktů využívá Credit Conversion Factor nebo Levine-Sebe přístup pro odhad čerpání před defaultem.

Makro propojení a stresové testování

Pro PIT rámec se PD modely propojují s makro proměnnými (nezaměstnanost, příjmy, sazby, ceny nemovitostí). Stresové testy simulují extrémní, avšak pravděpodobné scénáře a sledují dopad na PD/LGD/EAD, kapitál a likviditu. Důležité je reverse stress testing pro identifikaci scénářů vedoucích k překročení kapitálových limitů.

Specifika pro segmenty: retail vs. SME vs. korporáty

  • Retail – vysoký objem, nízká jednotková expozice; modely jsou silně datově řízené a automatizované.
  • SME – heterogenní data a kvalita účetnictví; kombinace finančních poměrů, kvalitativních posouzení a behaviorálních znaků.
  • Korporáty – důraz na forward-looking analýzu cash flow, odvětvové scénáře, kvalitu managementu a kovenanty; modely často slouží jako input pro expertní ratingový výbor.

Implementační otázky: IT architektura a realtime scoring

Nasazení vyžaduje model serving (API), verziování a feature store pro konzistentní výpočty v tréninku i produkci (training–serving skew). Latency je kritická u online onboardingů; batch scoring se využívá při měsíčním monitoringu portfolia. Logování pro audit musí obsahovat vstupní znaky, skóre, rozhodnutí a vysvětlení.

Etika, robustnost a odolnost modelů

  • Robustnost – citlivost na malé změny vstupů, odolnost vůči outlierům, záměrná manipulace (gaming).
  • Etika – vyloučení explicitně chráněných znaků a proxy proměnných; pravidelné fairness audity.
  • Bezpečnost – kontrola kvality dat