Proč segmentace a scoring patří do jádra CRM
Efektivní CRM stojí na schopnosti identifikovat, kteří zákazníci jsou nejhodnotnější, co potřebují a kdy zasáhnout správným kanálem. Segmentace poskytuje strukturu trhu a zákaznické databáze, scoring pak číselně vyjadřuje pravděpodobnost chování (nákup, odchod, reakce) nebo ekonomickou hodnotu (CLV). Společně umožňují personalizovat komunikaci, optimalizovat rozpočty a řídit P&L napříč kanály.
Termíny a definice
- Segmentace: rozdělení zákazníků do homogenních skupin s podobnými potřebami nebo chováním.
- Scoring: bodové hodnocení zákazníka na ose pravděpodobnost × hodnota × vhodný čas.
- CLV (Customer Lifetime Value): očekávaná diskontovaná marže za celé trvání vztahu.
- Propensity: pravděpodobnost konkrétního chování (nákup, up-sell, churn, reakce).
- NBA/NBO: „Next Best Action/Offer“ – rozhodování o dalším kroku v reálném čase.
Typy segmentace: od pravidel po algoritmy
- Pravidlová segmentace: jednoduchá business pravidla (např. RFM). Výhody: transparentnost, rychlá implementace. Nevýhody: omezená granularita.
- Statistická/algoritmická segmentace: klastrování (k-means, k-prototypes, DBSCAN, hierarchická), snížení dimenzionality (PCA, t-SNE pro průzkum), segmentační stromy. Výhody: vyšší homogenita skupin. Nevýhody: náročnější interpretace a správa.
- Hybridní segmentace: předdefinované „pilíře“ (např. životní cyklus) a uvnitř pilířů klastrování podle chování.
RFM a behaviorální základy
Model RFM (Recency–Frequency–Monetary) je robustní základ pro většinu odvětví.
- Recency (R): kolik dní od poslední transakce/aktivity.
- Frequency (F): počet nákupů nebo interakcí v časovém okně (např. 12 měsíců).
- Monetary (M): kumulativní marže nebo tržby (preferovat marži).
Prakticky se používají kvintily/decily nebo normalizované skóre: RFM_score = 100*R_decile + 10*F_decile + M_decile. Následně se mapují do segmentů (VIP, Loyal, At Risk, Hibernating, New).
Dimenze segmentace v CRM
- Demografické/firmografické: věk, příjem, odvětví, velikost firmy, geografická poloha.
- Behaviorální: nákupní kadence, košíkové mixy, preferované kanály, citlivost na cenu.
- Psychografické: motivace, hodnoty, styl rozhodování (vyžaduje výzkum a průzkumy).
- Stupeň vztahu: fáze životního cyklu (prospekt → nový zákazník → aktivní → rizikový → neaktivní → znovu získaný).
- Hodnotové: maržový příspěvek, CLV, riziko odchodu, potenciál up-sellu.
Scoringové modely: přehled a využití
- Lead scoring (B2B/B2C): pravděpodobnost konverze na základě fitu (firmografické/demografické) a intent signálů (webové chování, e-maily).
- Propensity-to-buy: pravděpodobnost nákupu konkrétní kategorie v daném časovém okně (např. 30 dní).
- Churn risk scoring: pravděpodobnost odchodu nebo neaktivity v definovaném horizontu.
- Upsell/Cross-sell scoring: vhodnost na balík, add-on, vyšší plán.
- CLV scoring: predikce budoucí hodnoty (t-CLV) s diskontem.
Modelovací techniky a interpretace
- Základní model: logistická regrese (interpretovatelná), penalizace L1/L2, kalibrace (Platt/Isotonic).
- Pokročilé metody: gradient boosting (XGBoost/LightGBM), náhodné lesy, neuronové sítě pro sekvenční data (RNN/Transformer).
- Interpretace: SHAP hodnoty, partial dependence plots; pro governance export „důvodových kódů“ (top 3 přispěvatelé skoru).
Výběr proměnných: featury, okna a granularita
- Transakční: počty, sumy, průměry, percentile, košíkové asociace (market basket – lift/confidence).
- Časové: trendové koeficienty (lineární trend nákupů), sezónnost, změny v posledních 7/30/90 dnech.
- Kanálové: otvírání e-mailů/kliky, webové události, call centrum, POS, mobilní aplikace.
- Cenová elasticita: reakce na promoce, kupony, výprodeje vs. plná cena.
- Produktové: kategorie, brand affinity, novinky vs. klasika.
Měření a validace scoringu
- Klasifikace: ROC-AUC, PR-AUC, KS statistika, lift křivky (lift @ decile), confusion matrix při zvolených prahových hodnotách.
- Regrese/CLV: RMSE/MAE, MAPE, intervaly pokrytí, kalibrace predikcí.
- Obchodní KPI: inkrementální marže na kontakt, uspořený mediální rozpočet, poměr zásahu k výnosu (precision vs. recall trade-off).
Prahování, prioritizace a nákladová funkce
Optimální práh p* se volí podle nákladů a přínosů: spustíme akci, pokud p* × (zisk při zásahu) − (1 − p*) × (náklad a/nebo riziko) > 0. V praxi se používá maximalizace očekávané marže na kontakt nebo omezení počtu zásahů (top N % zákazníků).
CLV: od heuristiky k pravděpodobnostním modelům
- Heuristiky: průměrná marže × očekávaná kadence × průměrná délka vztahu.
- BG/NBD a Gamma-Gamma: necontractual modely pro frekvenci a peněžní hodnotu; vhodné pro retail/e-commerce.
- Subscription modely: hazardní modely (Cox), survival analýza, Markovovy řetězce mezi stavy (Active, Grace, Churned).
Churn a retence: predikce a zásahy
- Včasná varování: pokles využívání klíčových funkcí, prodlužování doby mezi nákupy, negativní sentiment v podpoře.
- Zásahy: retenční nabídky, reaktivace obsahem, technická pomoc, proškolení (B2B), preferenční nastavení.
- Uplift modeling: modelování treatment effect (kdo zareaguje pozitivně na zásah) – zabraňuje „penězům za free ridery“.
B2B vs. B2C specifika
- B2B: account-based scoring (na úrovni firmy) + contact-level; fit (odvětví, velikost, tech stack), intent (web, obsah), buying committee (DMU).
- B2C: větší důraz na chování v digitálních touchpointech a cenovou elasticitu; častější necontractual vztahy.
Integrace do CRM a CDP: architektura dat
- Golden record: sjednocení identit (deterministické ID, probabilistické spojování) a governance klíčů (e-mail, telefon, device ID).
- Event hub: jednotná schéma událostí (nákup, zobrazení, klik, ticket) s časovými razítky.
- Feature store: verzované featury pro modely; reprodukovatelnost a konzistence online/offline.
- Real-time aktivace: streamingové scoringy (např. pod 200 ms) pro NBA v kanálech (web, app, call centrum, e-mail).
Aktivace segmentů a skóre: taktiky a kanály
- Orchestrace: pravidla typu „pokud churn_score > 0,7 a CLV > X → nabídka retenčního balíku přes e-mail + push + call“.
- Personalizace: obsah, frekvence, načasování (send-time optimization), produktová doporučení.
- Bid strategie: export skóre do placených kanálů (lookalike, suppression listy, bidding na hodnotu).
Governance, etika a právo
- GDPR/privátnost: právní základy zpracování, minimalizace dat, právo na vysvětlení automatizovaného rozhodování, retenční politiky.
- Fairness: audit zaujatosti (bias) napříč segmenty; vyloučení citlivých atributů a monitoring proxy proměnných.
- Transparentnost: komunikační rámce pro zákazníky (proč vidí určitý obsah/nabídku).
Provoz modelů: MLOps a monitoring
- Drift: sledovat změnu distribuce vstupů (data drift) a degradaci výkonu (concept drift); alarmy při překročení prahů.
- Champion–Challenger: paralelní porovnávání stávajícího a nového modelu na části trafficu.
- Rekalibrace: pravidelné přeučení, kontrola kalibrace pravděpodobností (reliability plots).
- Verzování: model, featury, datové vstupy, pipeline – auditovatelnost.
Dashboardy a reporting
- Segment health: velikost, růst, ARPU/ARPA, churn, share-of-wallet.
- Scoring performance: AUC, lift @ decile, stabilita, kalibrace.
- Aktivace: otevření/kliknutí/odpovědi, konverze, inkrementální marže, snížení nákladů (suppression saving).
- Ekonomika: CAC vs. CLV, retenční marže, dopad na P&L podle kanálů.
Praktický postup zavedení segmentace a scoringu
- Scoping: definujte cíl (např. snížit churn o 2 p.b. během 6 měsíců) a KPI.
- Data: zkatalogizujte zdroje (ERP, e-commerce, support, web, POS) a vyčistěte identitu (deduplikace).
- Baseline: RFM segmenty + jednoduchý churn model (logit), nastavte kontrolní skupiny.
- Aktivace: pilotní kampaně s jasným A/B rámcem a atribucí marže.
- Škálování: přidejte pokročilé modely (GBM), real-time scoring, NBA.
- Governance: dokumentace, audit, monitoring, refresh cykly.
Checklist datové kvality a připravenosti
- Jednoznačné zákaznické ID a mapování účtů/kontaktů.
- Normalizované produktové a kanálové taxonomie.
- Kompletní časová razítka a měnové/DPH standardy.
- Vyčištěné anomálie (vratky, chargebacky, interní pohyby).
- Dokumentované definice metrik (co je „aktivní zákazník“).
Časté chyby a jak se jim vyhnout
- Model bez aktivace: vynikající AUC, ale žádná změna v kampaních → vždy definujte use-case a kanál.
- Jednorázové segmenty: segmentace se rychle zastará → nastavte refresh a migrační pravidla.
- Ignorování marže: optimalizace na obrat místo zisku → používejte maržové metriky.
- Bez kontrolních skupin: nelze odhadnout inkrementalitu → vždy držte holdout.
- Přetrénování: stovky featur bez validace → regularizujte, vybírejte featury a sledujte generalizaci.
Mini-příklady použití
- Retail e-commerce: RFM + propensity na kategorii „obuv“ → top 20 % skóre dostává personalizované balíčky; ROAS ↑ o 28 %, vratky ↓ o 6 %.
- SaaS B2B: account scoring z usage metrik (DAU/WAU, feature adoption) → CSM prioritizuje zásahy; churn −3,2 p.b. za 2 kvartály.
- Bankovnictví: cross-sell scoring pro kreditní kartu; uplift modeling zabraňuje nabídce „free riderům“; čistý přírůstek aktivních uživatelů ↑ o 12 % při stejném rozpočtu.
Šablona jednoduchého bodovacího modelu (scorecard)
Příklad pro lead scoring (B2B), 0–100 bodů:
- Odvětví fit (A/B/C) → 0/10/20
- Velikost firmy (1–50/51–250/>250 zaměstnanců) → 5/10/15
- Seniorita kontaktu (uživatel/manager/C-level) → 5/10/20
- Intent (navštívené stránky pricing/docs/webinář) → 5/10/20
- Zapojení e-mail (otevření/klik/odpověď) → 0/5/10
Pravidlo MQL: score ≥ 60 a alespoň jeden „high intent“ signál → handoff do sales; jinak nurture.
Segmentace a scoring jako trvalá kapacita
Segmentace definuje jazyk, kterým CRM „mluví“ o zákazní