Segmentace a scoring v CRM

Proč segmentace a scoring patří do jádra CRM

Efektivní CRM stojí na schopnosti identifikovat, kteří zákazníci jsou nejhodnotnější, co potřebují a kdy zasáhnout správným kanálem. Segmentace poskytuje strukturu trhu a zákaznické databáze, scoring pak číselně vyjadřuje pravděpodobnost chování (nákup, odchod, reakce) nebo ekonomickou hodnotu (CLV). Společně umožňují personalizovat komunikaci, optimalizovat rozpočty a řídit P&L napříč kanály.

Termíny a definice

  • Segmentace: rozdělení zákazníků do homogenních skupin s podobnými potřebami nebo chováním.
  • Scoring: bodové hodnocení zákazníka na ose pravděpodobnost × hodnota × vhodný čas.
  • CLV (Customer Lifetime Value): očekávaná diskontovaná marže za celé trvání vztahu.
  • Propensity: pravděpodobnost konkrétního chování (nákup, up-sell, churn, reakce).
  • NBA/NBO: „Next Best Action/Offer“ – rozhodování o dalším kroku v reálném čase.

Typy segmentace: od pravidel po algoritmy

  • Pravidlová segmentace: jednoduchá business pravidla (např. RFM). Výhody: transparentnost, rychlá implementace. Nevýhody: omezená granularita.
  • Statistická/algoritmická segmentace: klastrování (k-means, k-prototypes, DBSCAN, hierarchická), snížení dimenzionality (PCA, t-SNE pro průzkum), segmentační stromy. Výhody: vyšší homogenita skupin. Nevýhody: náročnější interpretace a správa.
  • Hybridní segmentace: předdefinované „pilíře“ (např. životní cyklus) a uvnitř pilířů klastrování podle chování.

RFM a behaviorální základy

Model RFM (Recency–Frequency–Monetary) je robustní základ pro většinu odvětví.

  • Recency (R): kolik dní od poslední transakce/aktivity.
  • Frequency (F): počet nákupů nebo interakcí v časovém okně (např. 12 měsíců).
  • Monetary (M): kumulativní marže nebo tržby (preferovat marži).

Prakticky se používají kvintily/decily nebo normalizované skóre: RFM_score = 100*R_decile + 10*F_decile + M_decile. Následně se mapují do segmentů (VIP, Loyal, At Risk, Hibernating, New).

Dimenze segmentace v CRM

  • Demografické/firmografické: věk, příjem, odvětví, velikost firmy, geografická poloha.
  • Behaviorální: nákupní kadence, košíkové mixy, preferované kanály, citlivost na cenu.
  • Psychografické: motivace, hodnoty, styl rozhodování (vyžaduje výzkum a průzkumy).
  • Stupeň vztahu: fáze životního cyklu (prospekt → nový zákazník → aktivní → rizikový → neaktivní → znovu získaný).
  • Hodnotové: maržový příspěvek, CLV, riziko odchodu, potenciál up-sellu.

Scoringové modely: přehled a využití

  • Lead scoring (B2B/B2C): pravděpodobnost konverze na základě fitu (firmografické/demografické) a intent signálů (webové chování, e-maily).
  • Propensity-to-buy: pravděpodobnost nákupu konkrétní kategorie v daném časovém okně (např. 30 dní).
  • Churn risk scoring: pravděpodobnost odchodu nebo neaktivity v definovaném horizontu.
  • Upsell/Cross-sell scoring: vhodnost na balík, add-on, vyšší plán.
  • CLV scoring: predikce budoucí hodnoty (t-CLV) s diskontem.

Modelovací techniky a interpretace

  • Základní model: logistická regrese (interpretovatelná), penalizace L1/L2, kalibrace (Platt/Isotonic).
  • Pokročilé metody: gradient boosting (XGBoost/LightGBM), náhodné lesy, neuronové sítě pro sekvenční data (RNN/Transformer).
  • Interpretace: SHAP hodnoty, partial dependence plots; pro governance export „důvodových kódů“ (top 3 přispěvatelé skoru).

Výběr proměnných: featury, okna a granularita

  • Transakční: počty, sumy, průměry, percentile, košíkové asociace (market basket – lift/confidence).
  • Časové: trendové koeficienty (lineární trend nákupů), sezónnost, změny v posledních 7/30/90 dnech.
  • Kanálové: otvírání e-mailů/kliky, webové události, call centrum, POS, mobilní aplikace.
  • Cenová elasticita: reakce na promoce, kupony, výprodeje vs. plná cena.
  • Produktové: kategorie, brand affinity, novinky vs. klasika.

Měření a validace scoringu

  • Klasifikace: ROC-AUC, PR-AUC, KS statistika, lift křivky (lift @ decile), confusion matrix při zvolených prahových hodnotách.
  • Regrese/CLV: RMSE/MAE, MAPE, intervaly pokrytí, kalibrace predikcí.
  • Obchodní KPI: inkrementální marže na kontakt, uspořený mediální rozpočet, poměr zásahu k výnosu (precision vs. recall trade-off).

Prahování, prioritizace a nákladová funkce

Optimální práh p* se volí podle nákladů a přínosů: spustíme akci, pokud p* × (zisk při zásahu) − (1 − p*) × (náklad a/nebo riziko) > 0. V praxi se používá maximalizace očekávané marže na kontakt nebo omezení počtu zásahů (top N % zákazníků).

CLV: od heuristiky k pravděpodobnostním modelům

  • Heuristiky: průměrná marže × očekávaná kadence × průměrná délka vztahu.
  • BG/NBD a Gamma-Gamma: necontractual modely pro frekvenci a peněžní hodnotu; vhodné pro retail/e-commerce.
  • Subscription modely: hazardní modely (Cox), survival analýza, Markovovy řetězce mezi stavy (Active, Grace, Churned).

Churn a retence: predikce a zásahy

  • Včasná varování: pokles využívání klíčových funkcí, prodlužování doby mezi nákupy, negativní sentiment v podpoře.
  • Zásahy: retenční nabídky, reaktivace obsahem, technická pomoc, proškolení (B2B), preferenční nastavení.
  • Uplift modeling: modelování treatment effect (kdo zareaguje pozitivně na zásah) – zabraňuje „penězům za free ridery“.

B2B vs. B2C specifika

  • B2B: account-based scoring (na úrovni firmy) + contact-level; fit (odvětví, velikost, tech stack), intent (web, obsah), buying committee (DMU).
  • B2C: větší důraz na chování v digitálních touchpointech a cenovou elasticitu; častější necontractual vztahy.

Integrace do CRM a CDP: architektura dat

  • Golden record: sjednocení identit (deterministické ID, probabilistické spojování) a governance klíčů (e-mail, telefon, device ID).
  • Event hub: jednotná schéma událostí (nákup, zobrazení, klik, ticket) s časovými razítky.
  • Feature store: verzované featury pro modely; reprodukovatelnost a konzistence online/offline.
  • Real-time aktivace: streamingové scoringy (např. pod 200 ms) pro NBA v kanálech (web, app, call centrum, e-mail).

Aktivace segmentů a skóre: taktiky a kanály

  • Orchestrace: pravidla typu „pokud churn_score > 0,7 a CLV > X → nabídka retenčního balíku přes e-mail + push + call“.
  • Personalizace: obsah, frekvence, načasování (send-time optimization), produktová doporučení.
  • Bid strategie: export skóre do placených kanálů (lookalike, suppression listy, bidding na hodnotu).

Governance, etika a právo

  • GDPR/privátnost: právní základy zpracování, minimalizace dat, právo na vysvětlení automatizovaného rozhodování, retenční politiky.
  • Fairness: audit zaujatosti (bias) napříč segmenty; vyloučení citlivých atributů a monitoring proxy proměnných.
  • Transparentnost: komunikační rámce pro zákazníky (proč vidí určitý obsah/nabídku).

Provoz modelů: MLOps a monitoring

  • Drift: sledovat změnu distribuce vstupů (data drift) a degradaci výkonu (concept drift); alarmy při překročení prahů.
  • Champion–Challenger: paralelní porovnávání stávajícího a nového modelu na části trafficu.
  • Rekalibrace: pravidelné přeučení, kontrola kalibrace pravděpodobností (reliability plots).
  • Verzování: model, featury, datové vstupy, pipeline – auditovatelnost.

Dashboardy a reporting

  • Segment health: velikost, růst, ARPU/ARPA, churn, share-of-wallet.
  • Scoring performance: AUC, lift @ decile, stabilita, kalibrace.
  • Aktivace: otevření/kliknutí/odpovědi, konverze, inkrementální marže, snížení nákladů (suppression saving).
  • Ekonomika: CAC vs. CLV, retenční marže, dopad na P&L podle kanálů.

Praktický postup zavedení segmentace a scoringu

  1. Scoping: definujte cíl (např. snížit churn o 2 p.b. během 6 měsíců) a KPI.
  2. Data: zkatalogizujte zdroje (ERP, e-commerce, support, web, POS) a vyčistěte identitu (deduplikace).
  3. Baseline: RFM segmenty + jednoduchý churn model (logit), nastavte kontrolní skupiny.
  4. Aktivace: pilotní kampaně s jasným A/B rámcem a atribucí marže.
  5. Škálování: přidejte pokročilé modely (GBM), real-time scoring, NBA.
  6. Governance: dokumentace, audit, monitoring, refresh cykly.

Checklist datové kvality a připravenosti

  • Jednoznačné zákaznické ID a mapování účtů/kontaktů.
  • Normalizované produktové a kanálové taxonomie.
  • Kompletní časová razítka a měnové/DPH standardy.
  • Vyčištěné anomálie (vratky, chargebacky, interní pohyby).
  • Dokumentované definice metrik (co je „aktivní zákazník“).

Časté chyby a jak se jim vyhnout

  • Model bez aktivace: vynikající AUC, ale žádná změna v kampaních → vždy definujte use-case a kanál.
  • Jednorázové segmenty: segmentace se rychle zastará → nastavte refresh a migrační pravidla.
  • Ignorování marže: optimalizace na obrat místo zisku → používejte maržové metriky.
  • Bez kontrolních skupin: nelze odhadnout inkrementalitu → vždy držte holdout.
  • Přetrénování: stovky featur bez validace → regularizujte, vybírejte featury a sledujte generalizaci.

Mini-příklady použití

  • Retail e-commerce: RFM + propensity na kategorii „obuv“ → top 20 % skóre dostává personalizované balíčky; ROAS ↑ o 28 %, vratky ↓ o 6 %.
  • SaaS B2B: account scoring z usage metrik (DAU/WAU, feature adoption) → CSM prioritizuje zásahy; churn −3,2 p.b. za 2 kvartály.
  • Bankovnictví: cross-sell scoring pro kreditní kartu; uplift modeling zabraňuje nabídce „free riderům“; čistý přírůstek aktivních uživatelů ↑ o 12 % při stejném rozpočtu.

Šablona jednoduchého bodovacího modelu (scorecard)

Příklad pro lead scoring (B2B), 0–100 bodů:

  • Odvětví fit (A/B/C) → 0/10/20
  • Velikost firmy (1–50/51–250/>250 zaměstnanců) → 5/10/15
  • Seniorita kontaktu (uživatel/manager/C-level) → 5/10/20
  • Intent (navštívené stránky pricing/docs/webinář) → 5/10/20
  • Zapojení e-mail (otevření/klik/odpověď) → 0/5/10

Pravidlo MQL: score ≥ 60 a alespoň jeden „high intent“ signál → handoff do sales; jinak nurture.

Segmentace a scoring jako trvalá kapacita

Segmentace definuje jazyk, kterým CRM „mluví“ o zákazní