Data řízený prodej: segmentace a scoring zákazníků v CRM systémech

Proč segmentace a scoring patří do jádra CRM

Efektivní CRM stojí na schopnosti identifikovat, kteří zákazníci jsou nejhodnotnější, co potřebují a kdy zasáhnout správným kanálem. Segmentace poskytuje strukturu trhu a zákaznické báze, scoring pak numericky vyjadřuje pravděpodobnost chování (nákup, odchod, reakce) nebo ekonomickou hodnotu (CLV). Společně umožňují personalizovat komunikaci, optimalizovat rozpočty a řídit P&L napříč kanály.

Termíny a definice

  • Segmentace: rozdělení zákazníků do homogenních skupin s podobnými potřebami nebo chováním.
  • Scoring: bodové hodnocení zákazníka na ose pravděpodobnost × hodnota × vhodný čas.
  • CLV (Customer Lifetime Value): očekávaná diskontovaná marže za celé trvání vztahu.
  • Propensity: pravděpodobnost konkrétního chování (nákup, up-sell, churn, reakce).
  • NBA/NBO: „Next Best Action/Offer“ – rozhodování o dalším kroku v reálném čase.

Typy segmentace: od pravidel po algoritmy

  • Pravidlová segmentace: jednoduchá business pravidla (např. RFM). Výhody: transparentnost, rychlá implementace. Nevýhody: omezená granularita.
  • Statistická/algoritmická segmentace: klastrování (k-means, k-prototypes, DBSCAN, hierarchická), snížení dimenzionality (PCA, t-SNE pro průzkum), segmentační stromy. Výhody: vyšší homogenita skupin. Nevýhody: náročnější interpretace a správa.
  • Hybridní segmentace: předdefinované „pilíře“ (např. životní cyklus) a uvnitř pilířů klastrování podle chování.

RFM a behaviorální základy

Model RFM (Recency–Frequency–Monetary) je robustní baseline pro většinu odvětví.

  • Recency (R): kolik dní od poslední transakce/aktivity.
  • Frequency (F): počet nákupů nebo interakcí v okně (např. 12 měsíců).
  • Monetary (M): kumulativní marže nebo tržby (preferovat marži).

Prakticky se používají kvantily/decily nebo normalizované skóre: RFM_score = 100*R_decile + 10*F_decile + M_decile. Následně se mapují do segmentů (VIP, Loyal, At Risk, Hibernating, New).

Rozměry segmentace v CRM

  • Demografické/firmografické: věk, příjem, odvětví, velikost firmy, geografie.
  • Behaviorální: nákupní kadence, košíkové mixy, kanálové preference, citlivost na cenu.
  • Psychografické: motivace, hodnoty, styl rozhodování (vyžaduje výzkum a průzkumy).
  • Stupeň vztahu: fáze životního cyklu (prospekt → nový zákazník → aktivní → rizikový → neaktivní → znovu získaný).
  • Hodnotové: maržový příspěvek, CLV, riziko odchodu, potenciál up-sellu.

Scoringové modely: přehled a využití

  • Lead scoring (B2B/B2C): likeliness-to-convert na základě fitu (firmografické/demografické) a intent signálů (webové chování, e-maily).
  • Propensity-to-buy: pravděpodobnost nákupu konkrétní kategorie v okně (např. 30 dní).
  • Churn risk scoring: pravděpodobnost odchodu nebo neaktivity v definovaném horizontu.
  • Upsell/Cross-sell scoring: vhodnost na balíček, add-on, vyšší plán.
  • CLV scoring: predikce budoucí hodnoty (t-CLV) s diskontem.

Modelovací techniky a interpretace

  • Baseline: logistická regresi (interpretovatelná), penalizace L1/L2, kalibrace (Platt/Isotonic).
  • Pokročilé: gradient boosting (XGBoost/LightGBM), náhodné lesy, neuronové sítě pro sekvenční data (RNN/Transformer).
  • Interpretace: SHAP hodnoty, partial dependence plots; pro governance export „reason codes“ (top 3 přispěvatelé skóre).

Výběr proměnných: featury, okna a granularita

  • Transakční: počty, sumy, průměry, percentile, košíkové asociace (market basket – lift/confidence).
  • Časové: trendové koeficienty (lineární trend nákupů), sezónnost, změny v posledních 7/30/90 dnech.
  • Kanálové: e-mail otevírání/kliky, webové události, call centrum, POS, mobilní app.
  • Cenová elasticita: reakce na promo, kupony, výprodeje vs. plná cena.
  • Produktové: kategorie, brand affinity, novinky vs. klasika.

Měření a validace scoringu

  • Klasifikace: ROC-AUC, PR-AUC, KS statistika, lift křivky (lift @ decile), confusion matrix při zvolených prahových hodnotách.
  • Regrese/CLV: RMSE/MAE, MAPE, coverage intervaly, kalibrace predikcí.
  • Business KPI: inkrementální marže na kontakt, ušetřený mediální spend, poměr zásahu k výnosu (precision vs. recall trade-off).

Prahování, prioritizace a nákladová funkce

Optimální práh p* se volí podle nákladů a přínosů: spustíme akci, pokud p* × (zisk při zásahu) − (1 − p*) × (náklad a/nebo riziko) > 0. V praxi se používá maximalizace očekávané marže na kontakt nebo omezení počtu zásahů (top N % zákazníků).

CLV: od heuristiky k pravděpodnostním modelům

  • Heuristiky: průměrná marže × očekávaná kadence × průměrná délka vztahu.
  • BG/NBD a Gamma-Gamma: necontractual modely pro frekvenci a peněžní hodnotu; vhodné pro retail/e-commerce.
  • Subscription modely: hazardní modely (Cox), survival analýza, Markovovy řetězce mezi stavy (Active, Grace, Churned).

Churn a retence: predikce a zásahy

  • Včasná varování: pokles používání klíčových funkcí, růst doby mezi nákupy, negativní sentiment v podpoře.
  • Zásahy: retenční nabídky, reaktivace obsahem, technická pomoc, přeškolení (B2B), preferenční nastavení.
  • Uplift modeling: modelování treatment effect (kdo zareaguje pozitivně na zásah) – vyhýbá se „penězům za free riders“.

B2B vs. B2C specifika

  • B2B: account-based scoring (firma-level) + contact-level; fit (odvětví, velikost, tech stack), intent (web, obsah), buying committee (DMU).
  • B2C: větší důraz na chování v digitálních touchpointech a cenovou elasticitu; častější necontractual vztahy.

Integrace do CRM a CDP: architektura dat

  • Golden record: sjednocení identit (deterministické ID, probabilistic stitching) a governance klíčů (e-mail, telefon, device ID).
  • Event hub: jednotná schéma událostí (nákup, zobrazení, klik, ticket) s časovými razítky.
  • Feature store: verzované featury pro modely; reprodukovatelnost a konzistence online/offline.
  • Real-time aktivace: streamingové scoringy (např. pod 200 ms) pro NBA v kanálech (web, app, call centrum, e-mail).

Aktivace segmentů a skóre: taktiky a kanály

  • Orchestrace: pravidla typu „pokud churn_score > 0,7 a CLV > X → nabídka retenčního balíčku přes e-mail + push + call“.
  • Personalizace: obsah, frekvence, načasování (send-time optimization), produktová doporučení.
  • Bid strategie: export skóre do placených kanálů (lookalike, suppression listy, bidding na hodnotu).

Governance, etika a právo

  • GDPR/privátnost: právní základy zpracování, minimalizace dat, právo na vysvětlení automatizovaného rozhodování, retenční politiky.
  • Fairness: audit zaujatosti (bias) napříč segmenty; vyloučení citlivých atributů a monitoring proxy proměnných.
  • Transparentnost: komunikační rámce pro zákazníky (proč vidí určitý obsah/nabídku).

Provoz modelů: MLOps a monitoring

  • Drift: sledování změny distribuce vstupů (data drift) a degradace výkonu (concept drift); alarmy při překročení prahů.
  • Champion–Challenger: paralelní porovnávání existujícího a nového modelu na části trafficu.
  • Rekalibrace: pravidelné přeučení, kontrola kalibrace pravděpodobností (reliability plots).
  • Verzionování: model, featury, datové vstupy, pipeline – auditovatelnost.

Dashboards a reporting

  • Segment health: velikost, růst, ARPU/ARPA, churn, share-of-wallet.
  • Scoring performance: AUC, lift @ decile, stabilita, kalibrace.
  • Aktivace: open/click/reply, konverze, inkrementální marže, potlačení nákladů (suppression saving).
  • Ekonomika: CAC vs. CLV, retenční marže, dopad na P&L dle kanálů.

Praktický postup zavedení segmentace a scoringu

  1. Scoping: definujte cíl (např. snížit churn o 2 p. b. za 6 měsíců) a KPI.
  2. Data: skatalogizujte zdroje (ERP, e-commerce, support, web, POS) a vyčistěte identitu (deduplikace).
  3. Baseline: RFM segmenty + jednoduchý churn model (logit), nastavte kontrolní skupiny.
  4. Aktivace: pilotní kampaně s jasným A/B rámcem a atribucí marže.
  5. Škálování: přidejte pokročilé modely (GBM), real-time scoring, NBA.
  6. Governance: dokumentace, audit, monitoring, refresh cykly.

Checklist datové kvality a připravenosti

  • Jednoznačné zákaznické ID a mapování účtů/kontaktů.
  • Normalizované produktové a kanálové taxonomie.
  • Kompletní časová razítka a měnové/DPH standardy.
  • Vyčištěné anomálie (vratky, chargebacky, interní pohyby).
  • Zdokumentované definice metrik (co je „aktivní zákazník“).

Časté chyby a jak se jim vyhnout

  • Model bez aktivace: výborné AUC, ale žádná změna v kampaních → vždy definujte use-case a kanál.
  • Jednorázové segmenty: segmentace rychle zastará → nastavte refresh a migrační pravidla.
  • Ignorování marže: optimalizace na obrat místo zisku → používejte maržové metriky.
  • Bez kontrolních skupin: nelze odhadnout inkrementalitu → vždy držte holdout.
  • Přetrénování: stovky featur bez validace → regularizujte, vybírejte featury a sledujte generalizaci.

Mini-příklady použití

  • Retail e-commerce: RFM + propensity na kategorii „obuv“ → top 20 % skóre dostává personalizované bundle; ROAS ↑ o 28 %, reklamace ↓ o 6 %.
  • SaaS B2B: account scoring z usage metrik (DAU/WAU, feature adoption) → CSM prioritizuje zásahy; churn −3,2 p. b. za 2 kvartály.
  • Bankovnictví: cross-sell scoring pro kreditní kartu; uplift modeling brání nabídce „free riders“; čistý přírůstek aktivních uživatelů ↑ o 12 % při stejném budgetu.

Šablona jednoduchého bodovacího modelu (scorecard)

Příklad pro lead scoring (B2B), 0–100 bodů:

  • Odvětví fit (A/B/C) → 0/10/20
  • Velikost firmy (1–50/51–250/>250) → 5/10/15
  • Seniorita kontaktu (user/manager/C-level) → 5/10/20
  • Intent (navštívené stránky pricing/docs/webinar) → 5/10/20
  • Zapojení e-mail (open/click/response) → 0/5/10

Pravidlo MQL: score ≥ 60 a alespoň jeden „high intent“ signál → předání do sales; jinak nurture.

Segmentace a scoring jako trvalá kapacita

Segmentace definuje jazyk, ve kterém CRM „mluví“ o zákaznících; scoring tomuto jazyku dává čísla a prioritu. Pokud jsou spojeny s kvalitními daty, governance a disciplinovanou aktivací, stávají se trvalou kapacitou organizace: zvyšují efektivitu rozpoč