Řízení multirotorů: Praktické využití LQR a MPC versus tradiční PID regulátory

Přehled: proč porovnávat PID, LQR a MPC u multirotorů

Řízení multirotorů (kvadrokoptéry, hexa-, oktokoptéry) musí zajistit rychlou stabilizaci, přesné sledování trajektorie a odolnost vůči poruchám (vítr, změny hmotnosti, saturace tahu). Tradiční PID regulátory dominují v průmyslu díky jednoduchosti a vysoké spolehlivosti. LQR (Linear Quadratic Regulator) nabízí systematické nastavení zisků pro lineární modely a MPC (Model Predictive Control) navíc dokáže pracovat s omezeními (tah, rychlosti, náklony) a optimalizovat budoucí průběh. V praxi se často používá hybridní architektura: PID/LQR na vnitřních smyčkách (attitude, rate) a MPC/LQR/PID na vnějších smyčkách (pozice, rychlost, výška) podle výpočetních možností a požadavků mise.

Dynamika multirotoru a vrstvy řízení

  • Vnitřní smyčka (body rates, attitude): Řídí úhly a úhlové rychlosti (p, q, r; roll φ, pitch θ, yaw ψ). Má nejvyšší šířku pásma (typicky 200–1000 Hz).
  • Střední smyčka (výška / vertikální tah): Regulace tahu a vztlaku; 100–400 Hz.
  • Vnější smyčka (rychlost/pozice): Navigační řízení v inerciálním rámci; 50–200 Hz.
  • Plánování trajektorie: Generování referencí (jerk-limited, snap-optimal), 10–50 Hz.

Lineární modely se běžně získávají kolem provozního bodu (hover). Pro malé odchylky platí dot{x} = A x + B u, výstupy y = C x, kde x zahrnuje pozice, rychlosti, attitude a úhlové rychlosti, u jsou přírůstky tahů rotorů.

PID: síla v jednoduchosti a dobré implementaci

Výhody: minimální nároky na procesor, snadné ladění (Ziegler–Nichols, relay autotune, frekvenční metody), robustnost vůči mírným nejistotám modelu. Nevýhody: složitější řešení saturací a multivariantních vazeb (roll–pitch–z–yaw jsou spojeny přes omezené tahy), žádná predikce budoucích omezení.

  • Anti-windup: zpětná kalkulace nebo clamping při saturaci motorů.
  • Feedforward: odlehčení PI větve znalostí modelu (např. gravitační kompenzace a křížové vazby mezi osami).
  • Gain scheduling: přepínání KP, KI, KD podle režimu (payload, rychlost, úhel náklonu).
  • Frekvenční robustnost: filtry (notch, low-pass) na potlačení vibrací od vrtulí; důsledné nastavení D-členu s derivative-on-measurement.

LQR: optimální lineární řízení pro decouplované i MIMO osy

LQR minimalizuje kvadratické kritérium J = ∫ (xᵀQx + uᵀRu) dt a poskytne zpětnovazební zákon u = −Kx. V praxi:

  • Výběr Q a R: Q penalizuje odchylky stavů (úhly, rychlosti), R penalizuje práci motorů a povely. Pomůcka: škálovat stavy na stejné řády a volit R tak, aby se předešlo saturaci tahů.
  • Decentralizace: LQR pro (φ, p), (θ, q), (ψ, r) samostatně nebo plný MIMO design pro křížové vazby (užitečné při velkých úhlech či asymetrické geometrii).
  • Reference: přidat integrátory (LQI) pro nulovou ustálenou odchylku rychlostí/úhlů nebo používat state augmentation.
  • Robustnost: LQR implicitně poskytuje určitou odolnost (loop shaping v kvadratické normě), ale pro velké nejistoty je vhodné doplnit gain scheduling nebo μ-syntézu.

Vnitřní smyčky LQR dosahují vyšší šířky pásma při stejném nebo menším šumu na výstupu než PID a lépe zvládají křížové vazby bez heuristik.

MPC: prediktivní řízení s omezeními

MPC řeší na horizontu N optimalizační úlohu s modelem (lineárním nebo lineárně parametricky závislým, LPV) a explicitně počítá s omezeními:

  • Kritérium: min ∑ (xᵢ−xref)ᵀQ(xᵢ−xref) + ∑ ΔuᵢᵀRΔuᵢ, s terminální penalizací a/nebo terminální množinou.
  • Omezení: u ∈ [umin, umax] (tahy), |φ|, |θ| ≤ φmax, rychlosti a zrychlení (jerk, snap) podle platformy a gimbalu.
  • Model: diskretizovaný xk+1 = A xk + B uk (hover) nebo LPV podle náklonu a tahu; případně NMPC s diferenciálními rovnicemi a CasADi/ACADO na generování kódu.
  • Řešič: QP (kvadratický program) pro lineární MPC; SQP/IPM pro nelineární. Důležitý je deterministický čas výpočtu na embedded HW.

Přínosy MPC: jemné řešení saturací a koordinace os, méně „clippingu“ motorů, stabilní RTH při bočním větru, bezpečné dodržování limitů náklonu pro kvalitu videa/mapování. Nevýhody: vyšší výpočetní nároky, závislost na kvalitě modelu a latenci estimátoru.

Estimace stavů: EKF/UKF vs. komplementární filtry

Bez kvalitní estimace se ani nejlepší regulátor neprosadí. Standardem je EKF nad IMU, magnetometrem, barometrem a GNSS/vision (VIO). Pro vnitřní smyčky často stačí komplementární filtr (gyro + akcelerometr) s latencí < 1 ms. V MPC/LQR je důležité mít odhad rychlosti a náklonů s nízkým šumem; při VIO/optickém toku je nutné kompenzovat zpoždění (time offset) a použít predictor (zero-order hold nebo model-based forward prediction).

Implementační architektura: kde který regulátor použít

Vrstva Preferovaný regulátor Důvod Frekvence
Body-rate PID nebo LQR Nejvyšší nároky na rychlost, stabilizace šumu; LQR zvládá vazby 250–1 000 Hz
Attitude PID/LQR Rychlé sledování referenčních úhlů 200–500 Hz
Rychlost/pozice MPC nebo PID+feedforward/LQR Omezení náklonu, tahu, jerk; trajektorie 50–200 Hz
Výška PID s feedforward (T≈mg) nebo MPC (při omezeních) Přesná stoupání/klesání v rámci limitů 100–400 Hz

Robustnost a saturace: klíčové rozdíly v praxi

  • PID: potřebuje anti-windup; při hraničních náklonech a silných nárazech může dojít k delším saturacím motorů a zhoršení ovladatelnosti (yaw drift).
  • LQR: lepší loop-shaping, ale bez explicitních omezení. Při saturaci ztrácí optimálnost – vhodné je doplnit reference governor nebo command limiting.
  • MPC: explicitně pracuje s limity, minimalizuje chattering a clipping; dokáže „odmítnout“ nereálné reference (safe infeasibility handling).

Ladění a postup zavedení

  1. Model a identifikace: získat A, B matice z linearizace (hover) nebo subspace ID; určit zpoždění a frekvenční charakteristiky rámu.
  2. Vnitřní smyčky: začít PID (rate) → ověřit stabilitu a šířku pásma; pro LQR navrhnout Q/R tak, aby výstupy kopírovaly PID výkon, následně zvýšit výkon podle potřeby.
  3. Vnější smyčky: zavést MPC nejprve v simulaci (SIL/HIL), nastavit horizont N (8–20 kroků) a čas kroku podle senzoru; přidat limity náklonu, rychlosti, tahu.
  4. Bezpečnostní obaly: saturace povelů, rate limiter, jerk limiter, geofence, failsafe při ztrátě GNSS/VIO; watchdog pro solver MPC (time-out → fallback).
  5. Validace: step testy (5–10° attitude, 1–2 m/s rychlost), nárazové nárazy (ventilátor), klasické testy (hover, kružnice, osmičky, RTH proti větru) a metriky (ISE, ITAE, % saturace, spotřeba Wh/km).

Výpočetní nároky a hardwarové možnosti

  • PID/LQR běží komfortně na MCU třídy STM32F4/F7/H7 (100–400 MHz) při 1 kHz smyčkách.
  • Lineární MPC (QP): s N≈10, stavy < 12 a vstupy < 4 je možné dosáhnout 100–200 Hz na H7 při využití real-time QP (osqp, qpOASES s partial condensing). Pro složitější úlohy je vhodný companion computer (Raspberry Pi 4/5, NVIDIA Jetson) a smyčka 50–100 Hz.
  • NMPC vyžaduje generování kódu a starostlivé determinování výpočetního času; na embedded je praktický pouze s krátkým horizontem a dobrým teplým startem.

Vliv modelových chyb a adaptabilita

Mění se hmotnost, CG a aerodynamické ztráty (např. gimbal, payload). Strategie:

  • Gain scheduling: tabulka zisků podle hmotnosti/polohy CG a napětí baterie.
  • Online identifikace: odhad kT a kQ (tah/krouticí moment) z telemetrie proudů a úhlových odezev.
  • Disturbance observer (DOB) nebo integrátor poruchy v MPC jako rozšířený stav pro vítr/slabé nepřesnosti.

Trajektorie, komfort kamery a kvalita dat

Pro filmové/inspekční mise jsou kritická omezení jerk/snap kvůli gimbalu a kvalitě obrazu. MPC přirozeně respektuje tyto limity a minimalizuje náklonové přetížení, zatímco PID/LQR vyžadují dodatečné profily referencí (S-křivky, minimum jerk) a command filtry.

Hluk, energetika a teplota

Měkké řídicí profily (MPC s penalizací Δu, LQR s vyšším R) redukují proudové špičky → nižší hluk a zahřívání ESC/motorů, lepší energetická bilance. PID s příliš agresivním D může zvyšovat šum a tonální piky. V praxi sledujte % času v saturaci a RMS proud jako proxy pro tepelný stres.

Integrace s autopiloty a softwarový stack

  • PX4/ArduPilot: PID uvnitř; LQR lze vložit jako alternativní regulátory rate/attitude; MPC pro pozici na companion počítači přes offboard rozhraní (uPX4/MAVSDK, ROS 2).
  • ROS 2 pipeline: Estimace (VIO/EKF), MPC uzel (QP solver), generátor trajektorií (polynomy 7. řádu / minimum snap), synchronizace časů přes time synchronization.
  • Bezpečnostní vrstvy: health monitor (IMU saturace, kvalita GPS), fallback strom (MPC→LQR→PID→land), logging (uLog/ROSbag) pro analýzu.

Benchmark: jak spravedlivě porovnat PID, LQR a MPC

  1. Scénáře: step v pozici (1 m), kružnice (r = 5 m, v = 2 m/s), náraz větru (simulátor/ventilátor), limit tahu (zátěž).
  2. Metriky: ITAE/ISE, overshoot, doba ustálení, průměrná/špičková spotřeba, % saturace motorů, RMS proud, maximum náklonu, kvalita videa (std. dev. gyra na gimbalu), porušování limitů.
  3. Latence: end-to-end (senzor→řadič→motor) a jitter; pro MPC změřit čas řešení a výpadky > 1 % cyklů.
  4. Robustnost: variace hmotnosti (±20 %), posun CG (±1–2 cm), degradované senzory (mag dropout, GNSS multipath).

Doporučená vzorová nastavení

Platforma Vnitřní smyčky Vnější smyčky