Model-based planning using GPU-accelerated Simulator as a World Model
Laen...
Kuupäev
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
Manipulator robots are increasingly deployed in real-world tasks that require
smooth, reactive motion and robust collision avoidance, particularly in dynamic and
unstructured environments. This thesis presents a model-based, collision-free, online
trajectory optimization framework tailored for such scenarios. The method involves
sampling hundreds of trajectories from a multivariate normal distribution, shaping them
with Bernstein polynomials, and evaluating them in parallel within a MuJoCo simulation.
These trajectories are then optimized using the cross-entropy method. The system
achieves real-time, in-the-loop planning by integrating a model predictive control strategy.
The experiment, both in simulation and in real-world tests, demonstrated successful
manipulation in an environment with multiple obstacles. In addition, the framework
supports flexible task objectives by adjusting the cost function, enabling goal-driven
behavior under varying conditions.
Kirjeldus
Manipulatorroboteid kasutatakse üha enam reaalses maailmas ülesannete
täitmisel, mis nõuavad sujuvat, reageerimisvõimelist liikumist ja tõhusat kokkupõrgete
vältimist, eriti dünaamilistes ja struktureerimata keskkondades. Käesolev magistritöö esitleb
mudelipõhist, kokkupõrgetevaba, käitusaegset trajektoori optimeerimise raamistikku,
mis on kohandatud just sellisteks olukordadeks. Meetod hõlmab sadade trajektooride
genereerimist mitmemõõtmelisest normaaljaotusest, nende kuju määramist Bernsteini
polünoomide abil ning paralleelset hindamist MuJoCo simulatsioonis. Seejärel optimeeritakse
trajektoorid ristentroopia meetodil. Süsteem saavutab reaalajas, töötsüklis
planeerimise, integreerides mudeliprognoosiva juhtimisstrateegia. Eksperimendid, nii
simulatsioonis kui ka reaalses maailmas, demonstreerisid edukat manipuleerimist mitmete
takistustega keskkonnas. Lisaks võimaldab raamistik paindlikke ülesandeid kulufunktsiooni
kohandamise kaudu, võimaldades eesmärgist lähutvat käitumist erinevates
tingimustes.
Märksõnad
Model-based planning, model predictive control, cross-entropy method, online planning