Proč multi-agentní SLAM
Multi-agentní SLAM (Simultaneous Localization and Mapping) rozšiřuje klasický SLAM na skupinu kooperujících robotů nebo UAV, kteří současně lokalizují vlastní polohu a sdílejí či spojují mapy prostředí. Cíle jsou zřejmé: rychlejší pokrytí prostoru, vyšší robustnost vůči selháním jednotlivců, redundance měření a vytváření bohatších, konzistentních a mnohem rychleji aktualizovaných map. Klíčovou výzvou je dosáhnout konsensu nad stavem (pozice, orientace, struktura prostředí) v reálném čase při omezené šířce pásma a nespolehlivých linkách.
Architektonické vzory: centralizovaný, decentralizovaný a hierarchický SLAM
- Centralizovaný (server-based) SLAM: agenti posílají keyframové balíčky (obrazy, feature deskriptory, lidarové skeny, odometrii) na pozemní/edge server, který provádí optimalizaci pose-graphu. Výhoda: globálně optimální řešení a jednoduchá správa smyček. Nevýhoda: jediné místo selhání a nároky na uplink.
- Plně decentralizovaný SLAM: každý agent udržuje vlastní graf a provádí distribuovanou optimalizaci (např. přes Gauss–Seidel, ADMM nebo gradientní konsensus) s výměnou minimálních shrnutí (marginalizovaných faktorů). Výhoda: škálovatelnost a robustnost. Nevýhoda: složitější zajistit globálně konzistentní gauge a řešit konfliktní smyčky mezi agenty.
- Hierarchický SLAM: seskupování agentů do buněk (klastrů) s lokálním lídrem (edge node). Lídři řeší submapy a výměny probíhají mezi lídry; centrální jádro pouze spojuje super-uzly. Dobrá praktická volba pro roje s desítkami UAV.
Reprezentace mapy a stavu: grafy, submapy a vzdálenostní pole
- Pose-graph SLAM: uzly reprezentují pózy keyframů; hrany jsou odometrické a smyčkové faktory (vizuální/lidarové). Optimalizace probíhá pomocí nelineárního least-squares na SE(3).
- Submap SLAM: lokální husté mapy (TSDF/ESDF) nebo 2.5D výškové mapy se připojují jako balíky. Inter-robotická registrace probíhá mezi submapami (ICP, NDT, TEASER++ před optimalizací).
- Multimodální vrstvy: kromě geometrie se udržují semantické třídy (IMU-naviazané objekty, navigační orientační body, dynamické objekty) a nejistota (kovariance) pro bezpečný konsensus.
Detekce korespondencí a smyček mezi agenty
Nejdražší operací je zjistit, kdy dvě či více UAV pozorovaly stejné místo:
- Vizuální rozpoznávání míst: Bag-of-Words (DBoW2), NetVLAD, regionální deskriptory; klíčové je re-ranking pomocí geometrické verifikace (RANSAC/epipolární kontrola).
- Feature matching nové generace: SuperPoint/SuperGlue nebo LoFTR pro robustní párování i při výrazných změnách pozorovacího úhlu a osvětlení.
- Lidarové smyčky: NDT/ICP s hrubým odhadem z globálních signatur (FPFH, SHOT) a následným jemným přiblížením; při velkých mapách probíhá nejprve kandidátní výběr přes hashování.
Po navržení meziagentového transformačního faktoru je nezbytná filtrace odlehlých hodnot (outlier): robustní ztráty (Huber, Cauchy), graduated non-convexity nebo certifikovatelné metody (např. SE-Sync) pro globální registraci.
Distribuovaná optimalizace a konsensus
Cílem je vyřešit rozdělený nelineární least-squares bez centrálního koordinátora (nebo s minimem koordinace):
- DDF-SAM / iSAM2 s výměnou hranic: každý agent předává sousedům schur-marginalizované faktory přes hranice submapy (separator variables). Aktualizace probíhá inkrementálně.
- Gauss–Seidel / Jacobi v prostoru póz: agenti iterativně aktualizují své stavy na základě posledních odhadů sousedů. Rychlé pro řídké grafové struktury.
- ADMM a konsenzuální penalizace: sdílené proměnné (např. relativní transformace mezi submapami) jsou přidělovány násobitelům; konvergenční záruky pro konvexifikované aproximativní úlohy.
- Certifikovatelné formulace: relaxace na semidefinitní programy pro SE(2)/SE(3) (SE-Sync) s projekcí zpět; složitější na edge, ale vhodné pro přehodnocení těžkých smyček.
Kalibrace časů, latencí a referenčních rámců
U multi-agentního SLAM se chyby časové synchronizace přenášejí do falešných transformací:
- Čas: PTP/NTP s kompenzací jitteru; online odhad časových offsetů jako dalších latentních proměnných ve faktorizovaném grafu.
- Rámce: každý agent má lokální world; po smyčce s jiným agentem je třeba dohodnout gauge (globální měřítko a počátek). Pokud chybí absolutní ukotvení (GNSS/UWB), řeší se pouze do měřítka (v monoculárním VIO).
- Extrinsiky senzorů: průběžná samokalibrace kamera–IMU–LiDAR jako faktor v grafu, aby se zabránilo driftu při výměnách submap.
Komunikační strategie: co, kdy a kolik posílat
- Selektivní sdílení: místo surových snímků se posílají pouze keyframy (odlehčené JPEG/AV1) a komprimované deskriptory (Product Quantization, Hamming embedding).
- Pragmatické filtry: Bloom filtry/sketching struktury pro rychlé testy, zda má smysl poslat kandidátní keyframe jinému agentovi.
- Místní broadcasty vs. směrované toky: mesh sítě s store-and-forward, priorita paketů (loop-closure > odometrie > husté body).
- Rozpočty a adaptivita: dynamická změna frekvence sdílení podle RSSI/šumových podmínek; při přetížení se přechází do režimu pouze „landmark summaries“.
Sloučení map: od lokální registrace po globální konsensus
Pipeline sloučení obvykle zahrnuje (i) detekci kandidátních překrývajících se oblastí, (ii) robustní registraci, (iii) zavedení meziagentových faktorů do grafu a (iv) globální optimalizaci. V praxi se využívá:
- Submap-to-submap ICP/NDT s inicializací z vizuálního rozpoznávání míst.
- Covariance Intersection při fúzi odhadů bez spolehlivé znalosti korelací (zabraňuje nadměrnému zvyšování jistoty).
- Outlier management: konzervativní brány (Mahalanobis) a následné switchable constraints v optimalizaci.
Heterogenní roje: kamery, LiDAR, UWB, GNSS a VIO
Různé UAV mohou nést odlišné senzory; klíčem je faktorový graf, který přirozeně spojuje různé modality:
- VIO + UWB: UWB poskytuje robustní relativní rozsahy/lehký absolutní fix; VIO nabízí hladké krátkodobé pózy.
- LiDAR + kamera: kamera pomáhá v texturovaných prostorách, LiDAR v nestrukturovaných; vzájemné cross-modal loop closures jsou náročné, ale velmi přínosné.
- GNSS/RTK: ukotvení měřítka a globálního počátku; při výpadcích přechod na plně inerciální/relativní režim.
Práce s dynamikou: pohyblivé objekty a dočasné struktury
Multi-agentní scénáře často zahrnují davy lidí, vozidla a další UAV:
- Maskování dynamiky: segmentace pohyblivých bodů (optický tok, prostorově-časová konzistence) a jejich zpracování mimo statickou mapu.
- Dočasné vrstvy: short-term occupancy mapy pro taktické plánování; dlouhodobá mapa zůstává očištěná od dynamiky.
- Predikce trajektorií: faktory modelující drifty a krátkodobé blokování při plánování v roji.
Reálné časové omezení a výpočetní rozdělení
Pro UAV je kritické dodržet frekvence 20–60 Hz pro odometrii a 1–5 Hz pro globální aktualizace:
- Oddělení smyček: rychlý lokální odhad (VIO/LIO) běží na autopilotu/edge; globální graf se aktualizuje méně často na výkonnějším uzlu.
- Teplé starty: při každém konsensu se inicializuje z předchozího řešení; omezuje se počet aktivních uzlů pomocí keyframe selection.
- Marginalizace oken: sliding-window udržuje konstantní počet uzlů; starší informace přispívají přes prior faktory.
Robustnost, bezpečnost a kybernetická integrita
- Ochrana proti spoofingu a podvrhům smyček: kryptografické podpisy odesílaných faktorů a zdrojových deskriptorů, kontrola věrohodnosti.
- Detekce selhání: monitorování kondice grafu (rezidua, kondiční čísla, rank deficiency), fallback na lokální odhad při odpojení sítě.
- Soukromí: selektivní sdílení pouze strukturálních prvků (hrany/uzly bez surových obrazů), pseudonymizace semantických vrstev a kontrola politik uchovávání dat.
Propojení s plánováním a řízením roje
Výstupem multi-agentního SLAM nemá být pouze mapa, ale i konzistentní stav pro plánování trajektorií a vyhýbání se překážkám:
- Safe Flight Corridors (ESDF): přímo sdílené pro lokální MPC plánovače jednotlivých UAV.
- Task allocation: sdílené mapy umožňují frontier-based exploration a rozumné přidělování sektorů podle nejistoty.
- De-konflikce: společný rámec poloh (po konsensu) usnadňuje predikci kolizí a koordinované přeplánování.
Metodika hodnocení: metriky a scénáře
- Přesnost póz: ATE (Absolute Trajectory Error), RPE (Relative Pose Error) na společných referenčních úsecích.
- Kvalita mapy: surface reconstruction error, úplnost pokrytí a konzistence mezi submapami (ICP rezidua po sloučení).
- Komunikační náklady: průměrná a p95 šířka pásma, latence, podíl ztracených paketů.
- Čas konvergence konsensu: doba od detekce meziagentní smyčky po stabilizovaný globální odhad.
- Škálování: degradace kvality a latence při nárůstu počtu agentů (10 → 50 → 100).
Praktická doporučení a vzory implementace
- „Submap-first“ strategie: posílejte kompaktní submapy se signaturami; hustá data pouze na vyžádání a lokální sloučení.
- Hybridní konsensus: rychlý lokální Gauss–Seidel mezi sousedy + periodické globální re-ankorování (GNSS/UWB nebo „maják“ UAV).
- Bezpečný loop-closure pipeline: dvojí ověření (vizuální + lidar), robustní optimalizace se switchable constraints a detekce nekonzistencí před publikováním do COP/autopilota.
- QoS pro ROS 2/middleware: spolehlivé topiky pro faktory, best-effort pro náhledy; prahové publikování podle důležitosti.
Budoucí trendy
Učené place-recognizery odolné vůči počasí a sezónnosti, certifikovatelné distribuční metody s formálními zárukami konvergence, lifelong mapy sdílené mezi misemi a flotilami a propojení s U-space/UTM pro globální referencování dronů v městské 3D infrastruktuře. Očekává se širší nasazení neural implicit maps (SDF pole) s kvázi-lineární aktualizací a federated learning pro sémantiku bez přenosu surových dat.
Multi-agentní SLAM je páteří autonomních rojů: umožňuje sdílet konzistentní model světa, přijímat kolektivní rozhodnutí a bezpečně operovat v komplexních prostorech. Úspěch v praxi stojí na správné volbě architektury (hierarchický/decentralizovaný), robustní detekci meziagentních smyček, distribuovaném konsensu s omezenou komunikací a těsné integraci s plánováním a řízením. Při dodržení těchto principů roje UAV získávají škálovatelnost, rychlost a spolehlivost, kterou sólo platformy nedosáhnou.