Hardwarová verifikace a vysvětlitelná umělá inteligence v kritických systémech: Základ bezpečné autonomie UAV

Proč „bezpečná AI“ pro UAV není jen o přesnosti

Autonomní bezpilotní letadla (UAV) stále častěji využívají modely strojového učení a plánování založeného na AI v kritických smyčkách vnímání–rozhodování–řízení. Vysoká přesnost detekce překážek nebo kvalitní trajektorie však samy o sobě negarantují bezpečnost. Potřebujeme verifikovatelné politiky, které formálně vynucují omezení, a interpretovatelnost, která umožní lidem rozumět a auditovat chování modelů. Tento článek představuje integrovaný rámec bezpečné AI pro UAV – od specifikace bezpečnostních cílů, přes formální ověřování a runtime „shielding“, až po metriky interpretovatelnosti a procesy MLOps v regulovaném prostředí.

Referenční architektura: od ODD k bezpečnostním cílům

  • ODD (Operational Design Domain): prostorové (typ vzdušného prostoru, urbanizace), environmentální (vítr, srážky, dohlednost), provozní (VLOS/BVLOS, výška) hranice, ve kterých je politika AI platná.
  • Bezpečnostní cíle: např. „pravděpodobnost kolize < 10−x na letovou hodinu“, „žádný přelet nad vyhrazenými zónami“, „vyhnutí se lidem do vzdálenosti > d“.
  • Oddělení úloh: (i) percepce (detekce/SLAM), (ii) predikce (trajektorie jiných), (iii) rozhodování (plánování/RL), (iv) řízení (CBF/LQR), (v) dozor (monitor/shield).

Formální specifikace: od logiky ke kontraktům

  • Temporální logiky: LTL/MTL/STL pro vyjádření požadavků typu „vždy drž horizontální separaci ≥ R“, „pokud hrozí kolize, do T sekund iniciuj úhybný manévr“.
  • Kontrakty: assume–guarantee rámec pro komponenty (senzory, plánovač, autopilot). Např. „pokud latence vnímání < 80 ms a chyba pozice < 0,5 m, plánovač garantuje bezpečný manévr“.
  • Oblast bezpečného stavu: invarianty v prostoru stavů; definice unsafe set (kolize, porušení geofencingu, saturace aktuátorů).

Ověřování rozhodování: model checking, dosažitelnost a CBF

  • Reachability analysis: dopředné/obrácené dosažení se zohledněním poruch větru a nejistoty odhadu; výpočet „tubusů“ kolem referenční trajektorie.
  • Control Barrier Functions (CBF): online řešení QP, které koriguje příkazy tak, aby derivace bariérové funkce splňovala bezpečnostní nerovnost.
  • Model checking: abstrakce politiky (např. diskrétní stavy úrovně rizika) a verifikace LTL vlastností nad konečným automatem.
  • Robustní MPC: plánování s „tube“ obálkou a tvrdými omezeními; garantovaná realizovatelnost.

RL pod kontrolou: bezpečné učení a „shielding“

  • Safety layer: projekce akce z RL přes QP/CBF před odesláním do autopilota (akce je modifikována na nejbližší bezpečnou).
  • Constrained RL: optimalizace s Lagrangeovými multiplikátory nebo CMDP; penalizace porušení bezpečnostních rozpočtů (např. výdaj rizika).
  • Curriculum a sim2real: postupné zvyšování obtížnosti, doménový randomizmus (vítr, odezvy) a rozšířená penalizace OOD stavů.
  • Offline/Batch RL s verifikací: učení nad kurátorským datasetem bezpečných trajektorií; verifikace politiky před nasazením.

Runtime monitorování: od „shields“ po diagnózu

  • Monitor STL: robustní stupeň splnění formule (robustness degree) jako zpětná vazba – pokud klesne pod práh, vyvolej failsafe.
  • Watchdogs a kontrakty: dohled nad latencí, ztrátou paketů, saturacemi; automatický přechod na hover nebo RTH.
  • Ensembles a runtime certifikát: „two-tier“ politika – rychlá neuronová politika + pomalejší certifikovaný kontrolér k nápravě.

Nejistota, OOD a robustnost vnímání

  • Kalibrace pravděpodobností: teplotní kalibrace, Dirichlet prior, expected calibration error jako metrika.
  • OOD detekce: energetické skóre, Mahalanobisova vzdálenost v prostoru embeddingu, „deep ensembles“.
  • Adversariální a fyzikální útoky: augmentace, randomized smoothing, robustní architektury; validace v přítomnosti odlesků, deště, rolling-shutter efektu.
  • Fúze senzorů: redundance (stereo+LiDAR+IMU), explicitní modely chyb a „gating“ měření v EKF/UKF se zpožděním.

Interpretovatelnost modelů: od salience po kauzalitu

  • Lokální metody: gradientové mapy, CAM/Grad-CAM, occlusion testy pro detektory překážek.
  • Globální metody: SHAP/Integrated Gradients pro rozhodovací politiky; identifikace dominantních rysů (vítr, vzdálenost ke zóně, rychlost).
  • Konceptuální interpretace: TCAV – „do jaké míry koncept lidský dav ovlivňuje akci zpomalit?“
  • Kauzální grafy: SCM (Structural Causal Models) pro oddělení korelací od příčin; kontrafaktuální scénáře (counterfactuals) v simulaci.

Vysvětlitelné rozhraní pro operátory a dozor

  • „Proč“ a „proč ne“: stručná textová zdůvodnění politiky („zvýšení výšky kvůli nízkému robustness degree na STL: sep ≥ R“).
  • Konfidenční pásma: vizualizace nejistoty predikcí a rizikového rozpočtu v GCS (ground control station).
  • Audit trail: záznam vstupů, mezi-reprezentací a důvodů zásahu shieldu pro pozdější forenziku.

Swarm bezpečnost: multi-agentní politiky a důkazy

  • Formální specifikace pro roje: globální LTL vlastnosti („žádné kolize“, „připojenost grafu ≥ k“) a lokální pravidla (vzájemná separace, finite-time konsensus).
  • Distribuované CBF: lokální QP s omezeními od sousedů; garantovaná kolizní bezpečnost bez centrální autority.
  • Komunikační selhání: politiky graceful degradation při ztrátě spojení (přechod na formaci s nižší hustotou, návratové body).

Data, bias a kurátorství: od sběru po verifikaci

  • Dataset governance: původ, licence, reprezentativita napříč ODD; měření a zmírňování biasu (scény, počasí, infrastruktura).
  • Výběr scénářů: „hard case“ jádro (vítr v poryvech, ptáci, nízká dohlednost) a syntetika s fotorealismem.
  • Validační sady: rozdělení podle rizika; OOD testy; metriky bezpečnosti (minimální separace, míra porušení STL).

Zkoušky a metriky: nad rámec mAP a RMSE

  • Safety KPI: minimální horizontální/vertikální separace, počet zásahů shieldu za hodinu, 99,9. percentil reakční doby.
  • Formální robustnost: průměrný a nejhorší robustness degree STL během mise.
  • Rizikové metriky: CVaR/TVaR z rozdělení ztrát v Monte Carlo simulaci s poruchami větru a selháním senzorů.

Procesy a MLOps v regulovaném prostředí

  • Traceability: vazba požadavek–model–test–let; podepisované artefakty, neměnné buildy.
  • Verifikované knihovny: deterministické závislosti, kontrolované optimalizační rutiny (QP/SOCP) s důkazy konvergence.
  • Kontinuální verifikace: každá změna modelu spouští sadu formálních a simulačních testů; deploy brány dle úrovně rizika.
  • Post-deployment monitoring: telemetrie bezpečnostních KPI, detekce driftu, mechanismus rychlého roll-backu.

Kyberbezpečnost a odolnost vůči útokům na AI

  • Útoky na vnímání: fyzické markery, spoofing; vícesenzorové ověřování a sanity-checky geometrie.
  • Útoky na politiku: policy extraction/poisoning; podpisy datasetů, kontrolní součty modelů, izolované spouštěcí prostředí.
  • Bezpečné aktualizace: ověřené OTA, „canary“ flotily a staged rollout s monitorováním rizika.

Fail-safe a „graceful degradation“

  • Hierarchie režimů: autonomní → konzervativní → stabilizační → hover/RTH → bezpečné přistání.
  • Bezpečnostní automaty: explicitní přechody dle monitorů (latence, nejistota, porušení STL); důkladně testované „dead-end free“ grafy.
  • Energetický management: bezpečnostní rezervy baterií vázané na ODD a alternativní plochy.

Příklad integračního návrhu (schéma)

  1. Specifikace: ODD, STL vlastnosti, kontrakty komponent.
  2. Návrh politiky: RL/MPC s CBF safety layerem.
  3. Formální ověření: dosažitelnost + model checking abstrahovaného automatu.
  4. Simulace: Monte Carlo se scénáři OOD a poruchami; metriky KPI/STL robustnosti.
  5. HIL/SIL: latence v smyčce, porovnání s limity; validace shieldu.
  6. Letové testy: staged (upevněné → uzavřený prostor → reálné ODD), s runtime monitorem a audit trailem.
  7. Provoz: telemetrie, detekce driftu, pravidelná re-verifikace po aktualizaci.

Checklist pro bezpečnou AI v UAV

  • ODD zdokumentován a navázán na limity modelů a senzorů.
  • STL/LTL specifikace pokrývají separaci, geofencing, energetiku a komunikační selhání.
  • Safety layer (CBF/QP) úspěšně koriguje akce > 99,9 % případů v simulaci.
  • OOD a nejistota jsou monitorovány; definovány prahy pro fallback.
  • Interpretovatelnost: alespoň jedna lokální a jedna globální metoda v GCS.
  • Audit trail: deterministické buildy, podpisy datasetů, plná trasovatelnost.
  • Swarm: distribuční pravidla a důkazy připojenosti; režimy degradace při ztrátě komunikace.

Bezpečná AI pro UAV vyžaduje souhru formálních metod, robustního řízení a praktické interpretovatelnosti. Politika, která je verifikovatelná vůči explicitním požadavkům, doplněná o runtime „shielding“ a transparentní vysvětlování rozhodnutí, poskytuje předvídatelné chování i v neideálních podmínkách. Takový přístup umožňuje škálovat autonomii od jednotlivých dronů k rojům a zároveň zachovat důvěru regulátorů, operátorů a veřejnosti.