Prediktivní policing: bezpečnost versus spravedlnost

Co je predictive policing a proč je téma kontroverzní

Predictive policing (prediktivní policejní analýzy) je soubor datově-analytických metod, které odhadují pravděpodobnost výskytu kriminality v čase a prostoru nebo riziko recidivy u jednotlivců. Cílem je efektivnější alokace zdrojů (hlídkové trasy, prevence, komunitní aktivity) a zkrácení reakční doby. Zároveň jde však o oblast s vysokým etickým, právním a společenským rizikem: algoritmy mohou reprodukovat historické nerovnosti, generovat nežádoucí stimuly a vytvářet samoplnící se zpětnovazební smyčky.

Typologie přístupů

  • Place-based (hot-spot) modely: predikují riziko incidentu pro geografické jednotky (síť, ulice, parcelace) v časových oknech (hodiny, dny). Vhodné pro plánování hlídek a situační opatření.
  • Person-based modely: skóre rizika pro jednotlivce (např. recidiva, viktimizace). Nejrizikovější z hlediska ochrany práv a spravedlnosti – vyžadují mimořádně přísné garance a často se doporučují nenasazovat.
  • Event-based modely: odhady pravděpodobnosti konkrétních typů událostí (např. krádeže aut vs. vloupání) s rozdílnými prediktory a sezonností.

Datový ekosystém a kvalita dat

  • Primární zdroje: hlášení incidentů (čas, GPS, typ), záznamy zásahů, volání na tísňovou linku, dopravní a environmentální senzory.
  • Sekundární zdroje: demografie na úrovni čtvrtí, urbanistická data (osvětlení, dopravní uzly), ekonomické indikátory, události (festivaly, zápasy), počasí.
  • Problémy kvality: nedohlášení (ne všechny delikty jsou hlášeny), selektivní zkreslení (více hlídek → více zjištění), nehomogenní kategorie skutků, změny v kódování.
  • Governance: jasné datové smlouvy, auditní stopa, verzování kategorií skutků, evidování intenzity sběru (hodiny hlídek, zastavení) pro korekci zkreslení.

Modelové přístupy a statistická logika

  • Intenzitní (poisson/negbin) a bodové procesy: Hawkesovy self-exciting modely zachycují prostorově-časovou difuzi (např. near-repeat efekt u vloupání).
  • Strojové učení: gradient boosting, náhodné lesy, regularizovaná logistická regrese; pro obrazové mřížky i konvoluční neuronové sítě.
  • Kauzální a robustní odhady: uplift modely pro vyhodnocení efektu zásahu, bayesovské hierarchické modely pro malé oblasti, domain adaptation při změně podmínek.
  • Kalibrace: nezbytná pro použitelnost; používá se reliabilitní křivka, Brier skóre a izotonická regrese.

Architektura řešení (referenční model)

  1. Ingest & staging: ETL/ELT z policejních systémů, anonymizace/pseudonymizace, geokódování, časové normalizace.
  2. Feature store: prostorově-časové agregace (rolling windows), časové zpoždění událostí, hustoty objektů zájmu, exogenní signály.
  3. Model serving: plánovač batch/stream predikcí, verzování modelů, shadow a canary režimy.
  4. Decisioning & UX: mapové heatmapy s intervaly nejistoty, doporučení s kontextem (proč), zásady použití (Do/Don’t), human-in-the-loop.
  5. Observabilita: monitorování driftu, fairness metrik, logging zásahů, zpětná vazba pro trénink s kontrolou smyčky.

Měření výkonu: metriky, které dávají smysl

Kategorie Metrika Poznámka
Přesnost Precision@K (plocha K % města) užitečnější než AUROC při extrémní nerovnováze tříd
Kalibrace Brier skóre, reliabilitní křivky pravděpodobnosti musí odpovídat frekvencím
Dopad Uplift vs. kontrola AB/stepped-wedge experimenty, ne jen korelace
Robustnost Stabilita při back-testing v různých oknech citlivost na sezónnost a exogenní šoky
Fairness Disparate impact, EO gap, false-positive rate parity měřeno na agregovaných geografických a demografických úrovních

Zpětnovazební smyčky a jak jim předcházet

Pokud model doporučí více hlídek v oblasti A, zjistí se tam více přestupků (zejména těch závislých na policejní přítomnosti), což posílí rizikovost oblasti v tréninkových datech. Výsledkem je algoritmické zesílení. Možné mitigace:

  • vážit incidenty podle zdroje (hlášení vs. proaktivní odhalení),
  • explicitně modelovat expozici (hodiny hlídek, zastavení) jako kovariátu,
  • zařadit randomizované a kontrolní zóny pro korekci zaujatosti,
  • nepoužívat výkonnostní metriky, které jsou samy funkcí zvýšené přítomnosti (např. počet zastavení).

Spravedlnost a práva: rámec hodnocení

  • Účel a proporcionalita: jasně vymezený cíl (např. snížení viktimizace) a test méně invazivních alternativ.
  • Transparentnost: zveřejněné metodiky, popis dat, model cards, vysvětlení na úrovni zóny (nikoli jednotlivců).
  • Fairness metriky: porovnávat zátěž zón a komunit; sledovat equalized odds a predictive parity v relevantních skupinách.
  • Etické limity: zákaz person-based blacklistů, zákaz použití citlivých atributů a proxy, zákaz skórování pravděpodobnosti spáchání pro jednotlivce.

Právní a regulační zásady (obecný pohled)

  • Ochrana osobních údajů: zákonný základ, minimalizace, pseudonymizace, přístupové kontroly, účelové vázání a retenční lhůty.
  • Vyšší riziko AI: předběžné posouzení dopadů (DPIA/ALTA), registr použití, nezávislé audity a možnost opt-out pro formy, které ovlivňují práva jednotlivců.
  • Zásada odpovědnosti: dokumentace rozhodovacích pravidel, dohled lidí, možnost stížnosti a nápravy.

Bezpečnost: útoky a obrana

  • Data poisoning: manipulativní hlášení nebo geotagging mohou zkreslit mapy rizika – nutná validace a detekce anomálií.
  • Model evasion: adaptivní chování pachatelů – důležité je kombinovat predikce se situačními opatřeními a komunitní prací.
  • Distribuční drift: události (pandemie, migrační vlny, ekonomické šoky) – vyžadují online monitoring a retraining s kontrolou stability.

Proces zavádění: od pilotu po provoz

  1. Definice problému: typ deliktu, měřítko prostoru, cílové KPI (ne více zásahů, ale méně viktimizace).
  2. DPIA/etický přehled: identifikace rizik, plán mitigací, participace komunity a nezávislých expertů.
  3. Datasety a kvalita: baseline audit, protokoly čištění, záznamy o expozici.
  4. Pilot s experimentem: randomizované alokace, stepped-wedge design, kontrolní pasy, předregistrované hypotézy.
  5. Governance: etická rada, model registry, schvalování verzí, incident response, pravidelné veřejné reporty.

Human-in-the-loop a design rozhodování

  • Doporučení ≠ pokyn: výstupy mají formu návrhů s nejistotou a odůvodněním; konečné rozhodnutí je na velitelích služeb.
  • Vysvětlitelnost v kontextu: klíčové faktory na úrovni zóny (čas, blízkost dopravních uzlů), nikoli atributy lidí.
  • Pravidla použití: explicitní Do/Don’t (např. Don’t: zastavovat lidi pouze na základě mapy rizika; Do: upravit trasu hlídky, koordinovat osvětu a osvětlení).

Fairness techniky a omezení

  • Re-weighting a re-sampling: korigují nerovnoměrně sbíraná data; pozor na zvýšení rozptylu.
  • Proxy detection: testy na koreláty citlivých znaků (např. jemná geografická data mohou být proxy pro etnicitu) a jejich odstranění/agregace.
  • Constrained optimization: trénování s fairness omezeními; kompromis výkon ↔ rovnost dopadu.
  • Counterfactual evaluation: odhad, jak by dopadly oblasti bez zvýšené přítomnosti; vyžaduje kauzální modely a experimenty.

KPI programu (nejen přesnost modelu)

KPI Definice Interpretace
Změna viktimizace Δ počtu hlášených trestných činů na 1 000 obyvatel hlavní cíl – snížení škod, ne zvýšení výkonu
Konverze doporučení % doporučení, která vedla k opatření operační přijetí bez nátlaku
Fairness gap rozdíl zátěže mezi komunitami alarm při překročení prahů
Transparency index dostupnost dokumentace, logů, reportů předpoklad důvěry a odpovědnosti
Complaint & remedy rate podání vs. uznané pochybení a nápravy funkčnost zpětnovazebních mechanismů

Syntetické případové scénáře

Hot-spot patrolování proti vloupáním do aut: 500×500 m mřížka, 24hodinová okna, Hawkes + gradient boosting. AB test s rotací zón: −14 % incidentů v intervenčních zónách při nezvýšeném počtu kontrol osob; fairness gap < 5 % mezi čtvrtěmi po re-weightingu.

Komunitní prevence vandalismu: model rizika používaný pro plánování osvětlení, úklidu a společenských akcí, nikoli zásahů. Výsledek: −22 % škod na majetku, pozitivní NPS obyvatel, nulové stížnosti na profilování.

Omezení použití a červené linie

  • nepoužívat pro individuální skórování viny nebo rozhodování o vině/trestu,
  • nepodmiňovat zákonné zásahy samotnou rizikovou heatmapou,
  • nezahrnovat citlivé znaky ani proxy atributy; minimalizovat jemnou geolokaci, není-li nezbytná,
  • nezavádět bez nezávislého auditu, experimentálního důkazu přínosu a mechanismu nápravy.

Roadmapa implementace (0–12 měsíců)

  • 0–90 dní: vymezení problému, DPIA/etické posouzení, datový audit, návrh experimentu a governance.
  • 90–180 dní: MVP place-based model, kalibrace, baseline fairness, školení operačních týmů, shadow provoz.
  • 180–270 dní: randomizovaný pilot, pravidelné veřejné reporty, iterace mitigací (re-weighting, modeling expozice).
  • 270–365 dní: rozhodnutí o škálování nebo ukončení; pokud škálovat, tak jen s pevnými guardrails, audity a komunitním dohledem.

Shrnutí

Prediktivní policejní analýzy mohou ve specifických, přísně regulovaných případech přispět k lepší prevenci a ochraně obětí. Podmínkou je však proporcionalita, transparentnost, důkaz kauzálního přínosu a spravedlnost. Bez nich hrozí posilování nerovností a eroze důvěry. Pokud se organizace rozhodne pro place-based analytiku, měla by ji vnímat jako podpůrný nástroj pro komunitně zakotvenou policejní práci