Víceagentní SLAM

Proč multi-agentní SLAM

Multi-agentní SLAM (Simultaneous Localization and Mapping) rozšiřuje klasický SLAM na skupinu kooperujících robotů nebo UAV, kteří současně lokalizují vlastní polohu a sdílejí či spojují mapy prostředí. Cíle jsou zřejmé: rychlejší pokrytí prostoru, vyšší robustnost vůči selháním jednotlivců, redundance měření a vytváření bohatších, konzistentních a mnohem rychleji aktualizovaných map. Klíčovou výzvou je dosáhnout konsensu nad stavem (pozice, orientace, struktura prostředí) v reálném čase při omezené šířce pásma a nespolehlivých linkách.

Architektonické vzory: centralizovaný, decentralizovaný a hierarchický SLAM

  • Centralizovaný (server-based) SLAM: agenti posílají keyframové balíčky (obrazy, feature deskriptory, lidarové skeny, odometrii) na pozemní/edge server, který provádí optimalizaci pose-graphu. Výhoda: globálně optimální řešení a jednoduchá správa smyček. Nevýhoda: jediné místo selhání a nároky na uplink.
  • Plně decentralizovaný SLAM: každý agent udržuje vlastní graf a provádí distribuovanou optimalizaci (např. přes Gauss–Seidel, ADMM nebo gradientní konsensus) s výměnou minimálních shrnutí (marginalizovaných faktorů). Výhoda: škálovatelnost a robustnost. Nevýhoda: složitější zajistit globálně konzistentní gauge a řešit konfliktní smyčky mezi agenty.
  • Hierarchický SLAM: seskupování agentů do buněk (klastrů) s lokálním lídrem (edge node). Lídři řeší submapy a výměny probíhají mezi lídry; centrální jádro pouze spojuje super-uzly. Dobrá praktická volba pro roje s desítkami UAV.

Reprezentace mapy a stavu: grafy, submapy a vzdálenostní pole

  • Pose-graph SLAM: uzly reprezentují pózy keyframů; hrany jsou odometrické a smyčkové faktory (vizuální/lidarové). Optimalizace probíhá pomocí nelineárního least-squares na SE(3).
  • Submap SLAM: lokální husté mapy (TSDF/ESDF) nebo 2.5D výškové mapy se připojují jako balíky. Inter-robotická registrace probíhá mezi submapami (ICP, NDT, TEASER++ před optimalizací).
  • Multimodální vrstvy: kromě geometrie se udržují semantické třídy (IMU-naviazané objekty, navigační orientační body, dynamické objekty) a nejistota (kovariance) pro bezpečný konsensus.

Detekce korespondencí a smyček mezi agenty

Nejdražší operací je zjistit, kdy dvě či více UAV pozorovaly stejné místo:

  • Vizuální rozpoznávání míst: Bag-of-Words (DBoW2), NetVLAD, regionální deskriptory; klíčové je re-ranking pomocí geometrické verifikace (RANSAC/epipolární kontrola).
  • Feature matching nové generace: SuperPoint/SuperGlue nebo LoFTR pro robustní párování i při výrazných změnách pozorovacího úhlu a osvětlení.
  • Lidarové smyčky: NDT/ICP s hrubým odhadem z globálních signatur (FPFH, SHOT) a následným jemným přiblížením; při velkých mapách probíhá nejprve kandidátní výběr přes hashování.

Po navržení meziagentového transformačního faktoru je nezbytná filtrace odlehlých hodnot (outlier): robustní ztráty (Huber, Cauchy), graduated non-convexity nebo certifikovatelné metody (např. SE-Sync) pro globální registraci.

Distribuovaná optimalizace a konsensus

Cílem je vyřešit rozdělený nelineární least-squares bez centrálního koordinátora (nebo s minimem koordinace):

  • DDF-SAM / iSAM2 s výměnou hranic: každý agent předává sousedům schur-marginalizované faktory přes hranice submapy (separator variables). Aktualizace probíhá inkrementálně.
  • Gauss–Seidel / Jacobi v prostoru póz: agenti iterativně aktualizují své stavy na základě posledních odhadů sousedů. Rychlé pro řídké grafové struktury.
  • ADMM a konsenzuální penalizace: sdílené proměnné (např. relativní transformace mezi submapami) jsou přidělovány násobitelům; konvergenční záruky pro konvexifikované aproximativní úlohy.
  • Certifikovatelné formulace: relaxace na semidefinitní programy pro SE(2)/SE(3) (SE-Sync) s projekcí zpět; složitější na edge, ale vhodné pro přehodnocení těžkých smyček.

Kalibrace časů, latencí a referenčních rámců

U multi-agentního SLAM se chyby časové synchronizace přenášejí do falešných transformací:

  • Čas: PTP/NTP s kompenzací jitteru; online odhad časových offsetů jako dalších latentních proměnných ve faktorizovaném grafu.
  • Rámce: každý agent má lokální world; po smyčce s jiným agentem je třeba dohodnout gauge (globální měřítko a počátek). Pokud chybí absolutní ukotvení (GNSS/UWB), řeší se pouze do měřítka (v monoculárním VIO).
  • Extrinsiky senzorů: průběžná samokalibrace kamera–IMU–LiDAR jako faktor v grafu, aby se zabránilo driftu při výměnách submap.

Komunikační strategie: co, kdy a kolik posílat

  • Selektivní sdílení: místo surových snímků se posílají pouze keyframy (odlehčené JPEG/AV1) a komprimované deskriptory (Product Quantization, Hamming embedding).
  • Pragmatické filtry: Bloom filtry/sketching struktury pro rychlé testy, zda má smysl poslat kandidátní keyframe jinému agentovi.
  • Místní broadcasty vs. směrované toky: mesh sítě s store-and-forward, priorita paketů (loop-closure > odometrie > husté body).
  • Rozpočty a adaptivita: dynamická změna frekvence sdílení podle RSSI/šumových podmínek; při přetížení se přechází do režimu pouze „landmark summaries“.

Sloučení map: od lokální registrace po globální konsensus

Pipeline sloučení obvykle zahrnuje (i) detekci kandidátních překrývajících se oblastí, (ii) robustní registraci, (iii) zavedení meziagentových faktorů do grafu a (iv) globální optimalizaci. V praxi se využívá:

  • Submap-to-submap ICP/NDT s inicializací z vizuálního rozpoznávání míst.
  • Covariance Intersection při fúzi odhadů bez spolehlivé znalosti korelací (zabraňuje nadměrnému zvyšování jistoty).
  • Outlier management: konzervativní brány (Mahalanobis) a následné switchable constraints v optimalizaci.

Heterogenní roje: kamery, LiDAR, UWB, GNSS a VIO

Různé UAV mohou nést odlišné senzory; klíčem je faktorový graf, který přirozeně spojuje různé modality:

  • VIO + UWB: UWB poskytuje robustní relativní rozsahy/lehký absolutní fix; VIO nabízí hladké krátkodobé pózy.
  • LiDAR + kamera: kamera pomáhá v texturovaných prostorách, LiDAR v nestrukturovaných; vzájemné cross-modal loop closures jsou náročné, ale velmi přínosné.
  • GNSS/RTK: ukotvení měřítka a globálního počátku; při výpadcích přechod na plně inerciální/relativní režim.

Práce s dynamikou: pohyblivé objekty a dočasné struktury

Multi-agentní scénáře často zahrnují davy lidí, vozidla a další UAV:

  • Maskování dynamiky: segmentace pohyblivých bodů (optický tok, prostorově-časová konzistence) a jejich zpracování mimo statickou mapu.
  • Dočasné vrstvy: short-term occupancy mapy pro taktické plánování; dlouhodobá mapa zůstává očištěná od dynamiky.
  • Predikce trajektorií: faktory modelující drifty a krátkodobé blokování při plánování v roji.

Reálné časové omezení a výpočetní rozdělení

Pro UAV je kritické dodržet frekvence 20–60 Hz pro odometrii a 1–5 Hz pro globální aktualizace:

  • Oddělení smyček: rychlý lokální odhad (VIO/LIO) běží na autopilotu/edge; globální graf se aktualizuje méně často na výkonnějším uzlu.
  • Teplé starty: při každém konsensu se inicializuje z předchozího řešení; omezuje se počet aktivních uzlů pomocí keyframe selection.
  • Marginalizace oken: sliding-window udržuje konstantní počet uzlů; starší informace přispívají přes prior faktory.

Robustnost, bezpečnost a kybernetická integrita

  • Ochrana proti spoofingu a podvrhům smyček: kryptografické podpisy odesílaných faktorů a zdrojových deskriptorů, kontrola věrohodnosti.
  • Detekce selhání: monitorování kondice grafu (rezidua, kondiční čísla, rank deficiency), fallback na lokální odhad při odpojení sítě.
  • Soukromí: selektivní sdílení pouze strukturálních prvků (hrany/uzly bez surových obrazů), pseudonymizace semantických vrstev a kontrola politik uchovávání dat.

Propojení s plánováním a řízením roje

Výstupem multi-agentního SLAM nemá být pouze mapa, ale i konzistentní stav pro plánování trajektorií a vyhýbání se překážkám:

  • Safe Flight Corridors (ESDF): přímo sdílené pro lokální MPC plánovače jednotlivých UAV.
  • Task allocation: sdílené mapy umožňují frontier-based exploration a rozumné přidělování sektorů podle nejistoty.
  • De-konflikce: společný rámec poloh (po konsensu) usnadňuje predikci kolizí a koordinované přeplánování.

Metodika hodnocení: metriky a scénáře

  • Přesnost póz: ATE (Absolute Trajectory Error), RPE (Relative Pose Error) na společných referenčních úsecích.
  • Kvalita mapy: surface reconstruction error, úplnost pokrytí a konzistence mezi submapami (ICP rezidua po sloučení).
  • Komunikační náklady: průměrná a p95 šířka pásma, latence, podíl ztracených paketů.
  • Čas konvergence konsensu: doba od detekce meziagentní smyčky po stabilizovaný globální odhad.
  • Škálování: degradace kvality a latence při nárůstu počtu agentů (10 → 50 → 100).

Praktická doporučení a vzory implementace

  • „Submap-first“ strategie: posílejte kompaktní submapy se signaturami; hustá data pouze na vyžádání a lokální sloučení.
  • Hybridní konsensus: rychlý lokální Gauss–Seidel mezi sousedy + periodické globální re-ankorování (GNSS/UWB nebo „maják“ UAV).
  • Bezpečný loop-closure pipeline: dvojí ověření (vizuální + lidar), robustní optimalizace se switchable constraints a detekce nekonzistencí před publikováním do COP/autopilota.
  • QoS pro ROS 2/middleware: spolehlivé topiky pro faktory, best-effort pro náhledy; prahové publikování podle důležitosti.

Budoucí trendy

Učené place-recognizery odolné vůči počasí a sezónnosti, certifikovatelné distribuční metody s formálními zárukami konvergence, lifelong mapy sdílené mezi misemi a flotilami a propojení s U-space/UTM pro globální referencování dronů v městské 3D infrastruktuře. Očekává se širší nasazení neural implicit maps (SDF pole) s kvázi-lineární aktualizací a federated learning pro sémantiku bez přenosu surových dat.

Multi-agentní SLAM je páteří autonomních rojů: umožňuje sdílet konzistentní model světa, přijímat kolektivní rozhodnutí a bezpečně operovat v komplexních prostorech. Úspěch v praxi stojí na správné volbě architektury (hierarchický/decentralizovaný), robustní detekci meziagentních smyček, distribuovaném konsensu s omezenou komunikací a těsné integraci s plánováním a řízením. Při dodržení těchto principů roje UAV získávají škálovatelnost, rychlost a spolehlivost, kterou sólo platformy nedosáhnou.