Co je predictive policing a proč je téma kontroverzní
Predictive policing (prediktivní policejní analýzy) je soubor datově-analytických metod, které odhadují pravděpodobnost výskytu kriminality v čase a prostoru nebo riziko recidivy u jednotlivců. Cílem je efektivnější alokace zdrojů (hlídkové trasy, prevence, komunitní aktivity) a zkrácení reakční doby. Zároveň jde však o oblast s vysokým etickým, právním a společenským rizikem: algoritmy mohou reprodukovat historické nerovnosti, generovat nežádoucí stimuly a vytvářet samoplnící se zpětnovazební smyčky.
Typologie přístupů
- Place-based (hot-spot) modely: predikují riziko incidentu pro geografické jednotky (síť, ulice, parcelace) v časových oknech (hodiny, dny). Vhodné pro plánování hlídek a situační opatření.
- Person-based modely: skóre rizika pro jednotlivce (např. recidiva, viktimizace). Nejrizikovější z hlediska ochrany práv a spravedlnosti – vyžadují mimořádně přísné garance a často se doporučují nenasazovat.
- Event-based modely: odhady pravděpodobnosti konkrétních typů událostí (např. krádeže aut vs. vloupání) s rozdílnými prediktory a sezonností.
Datový ekosystém a kvalita dat
- Primární zdroje: hlášení incidentů (čas, GPS, typ), záznamy zásahů, volání na tísňovou linku, dopravní a environmentální senzory.
- Sekundární zdroje: demografie na úrovni čtvrtí, urbanistická data (osvětlení, dopravní uzly), ekonomické indikátory, události (festivaly, zápasy), počasí.
- Problémy kvality: nedohlášení (ne všechny delikty jsou hlášeny), selektivní zkreslení (více hlídek → více zjištění), nehomogenní kategorie skutků, změny v kódování.
- Governance: jasné datové smlouvy, auditní stopa, verzování kategorií skutků, evidování intenzity sběru (hodiny hlídek, zastavení) pro korekci zkreslení.
Modelové přístupy a statistická logika
- Intenzitní (poisson/negbin) a bodové procesy: Hawkesovy self-exciting modely zachycují prostorově-časovou difuzi (např. near-repeat efekt u vloupání).
- Strojové učení: gradient boosting, náhodné lesy, regularizovaná logistická regrese; pro obrazové mřížky i konvoluční neuronové sítě.
- Kauzální a robustní odhady: uplift modely pro vyhodnocení efektu zásahu, bayesovské hierarchické modely pro malé oblasti, domain adaptation při změně podmínek.
- Kalibrace: nezbytná pro použitelnost; používá se reliabilitní křivka, Brier skóre a izotonická regrese.
Architektura řešení (referenční model)
- Ingest & staging: ETL/ELT z policejních systémů, anonymizace/pseudonymizace, geokódování, časové normalizace.
- Feature store: prostorově-časové agregace (rolling windows), časové zpoždění událostí, hustoty objektů zájmu, exogenní signály.
- Model serving: plánovač batch/stream predikcí, verzování modelů, shadow a canary režimy.
- Decisioning & UX: mapové heatmapy s intervaly nejistoty, doporučení s kontextem (proč), zásady použití (Do/Don’t), human-in-the-loop.
- Observabilita: monitorování driftu, fairness metrik, logging zásahů, zpětná vazba pro trénink s kontrolou smyčky.
Měření výkonu: metriky, které dávají smysl
| Kategorie | Metrika | Poznámka |
|---|---|---|
| Přesnost | Precision@K (plocha K % města) | užitečnější než AUROC při extrémní nerovnováze tříd |
| Kalibrace | Brier skóre, reliabilitní křivky | pravděpodobnosti musí odpovídat frekvencím |
| Dopad | Uplift vs. kontrola | AB/stepped-wedge experimenty, ne jen korelace |
| Robustnost | Stabilita při back-testing v různých oknech | citlivost na sezónnost a exogenní šoky |
| Fairness | Disparate impact, EO gap, false-positive rate parity | měřeno na agregovaných geografických a demografických úrovních |
Zpětnovazební smyčky a jak jim předcházet
Pokud model doporučí více hlídek v oblasti A, zjistí se tam více přestupků (zejména těch závislých na policejní přítomnosti), což posílí rizikovost oblasti v tréninkových datech. Výsledkem je algoritmické zesílení. Možné mitigace:
- vážit incidenty podle zdroje (hlášení vs. proaktivní odhalení),
- explicitně modelovat expozici (hodiny hlídek, zastavení) jako kovariátu,
- zařadit randomizované a kontrolní zóny pro korekci zaujatosti,
- nepoužívat výkonnostní metriky, které jsou samy funkcí zvýšené přítomnosti (např. počet zastavení).
Spravedlnost a práva: rámec hodnocení
- Účel a proporcionalita: jasně vymezený cíl (např. snížení viktimizace) a test méně invazivních alternativ.
- Transparentnost: zveřejněné metodiky, popis dat, model cards, vysvětlení na úrovni zóny (nikoli jednotlivců).
- Fairness metriky: porovnávat zátěž zón a komunit; sledovat equalized odds a predictive parity v relevantních skupinách.
- Etické limity: zákaz person-based blacklistů, zákaz použití citlivých atributů a proxy, zákaz skórování pravděpodobnosti spáchání pro jednotlivce.
Právní a regulační zásady (obecný pohled)
- Ochrana osobních údajů: zákonný základ, minimalizace, pseudonymizace, přístupové kontroly, účelové vázání a retenční lhůty.
- Vyšší riziko AI: předběžné posouzení dopadů (DPIA/ALTA), registr použití, nezávislé audity a možnost opt-out pro formy, které ovlivňují práva jednotlivců.
- Zásada odpovědnosti: dokumentace rozhodovacích pravidel, dohled lidí, možnost stížnosti a nápravy.
Bezpečnost: útoky a obrana
- Data poisoning: manipulativní hlášení nebo geotagging mohou zkreslit mapy rizika – nutná validace a detekce anomálií.
- Model evasion: adaptivní chování pachatelů – důležité je kombinovat predikce se situačními opatřeními a komunitní prací.
- Distribuční drift: události (pandemie, migrační vlny, ekonomické šoky) – vyžadují online monitoring a retraining s kontrolou stability.
Proces zavádění: od pilotu po provoz
- Definice problému: typ deliktu, měřítko prostoru, cílové KPI (ne více zásahů, ale méně viktimizace).
- DPIA/etický přehled: identifikace rizik, plán mitigací, participace komunity a nezávislých expertů.
- Datasety a kvalita: baseline audit, protokoly čištění, záznamy o expozici.
- Pilot s experimentem: randomizované alokace, stepped-wedge design, kontrolní pasy, předregistrované hypotézy.
- Governance: etická rada, model registry, schvalování verzí, incident response, pravidelné veřejné reporty.
Human-in-the-loop a design rozhodování
- Doporučení ≠ pokyn: výstupy mají formu návrhů s nejistotou a odůvodněním; konečné rozhodnutí je na velitelích služeb.
- Vysvětlitelnost v kontextu: klíčové faktory na úrovni zóny (čas, blízkost dopravních uzlů), nikoli atributy lidí.
- Pravidla použití: explicitní Do/Don’t (např. Don’t: zastavovat lidi pouze na základě mapy rizika; Do: upravit trasu hlídky, koordinovat osvětu a osvětlení).
Fairness techniky a omezení
- Re-weighting a re-sampling: korigují nerovnoměrně sbíraná data; pozor na zvýšení rozptylu.
- Proxy detection: testy na koreláty citlivých znaků (např. jemná geografická data mohou být proxy pro etnicitu) a jejich odstranění/agregace.
- Constrained optimization: trénování s fairness omezeními; kompromis výkon ↔ rovnost dopadu.
- Counterfactual evaluation: odhad, jak by dopadly oblasti bez zvýšené přítomnosti; vyžaduje kauzální modely a experimenty.
KPI programu (nejen přesnost modelu)
| KPI | Definice | Interpretace |
|---|---|---|
| Změna viktimizace | Δ počtu hlášených trestných činů na 1 000 obyvatel | hlavní cíl – snížení škod, ne zvýšení výkonu |
| Konverze doporučení | % doporučení, která vedla k opatření | operační přijetí bez nátlaku |
| Fairness gap | rozdíl zátěže mezi komunitami | alarm při překročení prahů |
| Transparency index | dostupnost dokumentace, logů, reportů | předpoklad důvěry a odpovědnosti |
| Complaint & remedy rate | podání vs. uznané pochybení a nápravy | funkčnost zpětnovazebních mechanismů |
Syntetické případové scénáře
Hot-spot patrolování proti vloupáním do aut: 500×500 m mřížka, 24hodinová okna, Hawkes + gradient boosting. AB test s rotací zón: −14 % incidentů v intervenčních zónách při nezvýšeném počtu kontrol osob; fairness gap < 5 % mezi čtvrtěmi po re-weightingu.
Komunitní prevence vandalismu: model rizika používaný pro plánování osvětlení, úklidu a společenských akcí, nikoli zásahů. Výsledek: −22 % škod na majetku, pozitivní NPS obyvatel, nulové stížnosti na profilování.
Omezení použití a červené linie
- nepoužívat pro individuální skórování viny nebo rozhodování o vině/trestu,
- nepodmiňovat zákonné zásahy samotnou rizikovou heatmapou,
- nezahrnovat citlivé znaky ani proxy atributy; minimalizovat jemnou geolokaci, není-li nezbytná,
- nezavádět bez nezávislého auditu, experimentálního důkazu přínosu a mechanismu nápravy.
Roadmapa implementace (0–12 měsíců)
- 0–90 dní: vymezení problému, DPIA/etické posouzení, datový audit, návrh experimentu a governance.
- 90–180 dní: MVP place-based model, kalibrace, baseline fairness, školení operačních týmů, shadow provoz.
- 180–270 dní: randomizovaný pilot, pravidelné veřejné reporty, iterace mitigací (re-weighting, modeling expozice).
- 270–365 dní: rozhodnutí o škálování nebo ukončení; pokud škálovat, tak jen s pevnými guardrails, audity a komunitním dohledem.
Shrnutí
Prediktivní policejní analýzy mohou ve specifických, přísně regulovaných případech přispět k lepší prevenci a ochraně obětí. Podmínkou je však proporcionalita, transparentnost, důkaz kauzálního přínosu a spravedlnost. Bez nich hrozí posilování nerovností a eroze důvěry. Pokud se organizace rozhodne pro place-based analytiku, měla by ji vnímat jako podpůrný nástroj pro komunitně zakotvenou policejní práci