Model-based planning using GPU-accelerated Simulator as a World Model

Laen...
Pisipilt

Kuupäev

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

Manipulator robots are increasingly deployed in real-world tasks that require smooth, reactive motion and robust collision avoidance, particularly in dynamic and unstructured environments. This thesis presents a model-based, collision-free, online trajectory optimization framework tailored for such scenarios. The method involves sampling hundreds of trajectories from a multivariate normal distribution, shaping them with Bernstein polynomials, and evaluating them in parallel within a MuJoCo simulation. These trajectories are then optimized using the cross-entropy method. The system achieves real-time, in-the-loop planning by integrating a model predictive control strategy. The experiment, both in simulation and in real-world tests, demonstrated successful manipulation in an environment with multiple obstacles. In addition, the framework supports flexible task objectives by adjusting the cost function, enabling goal-driven behavior under varying conditions.

Kirjeldus

Manipulatorroboteid kasutatakse üha enam reaalses maailmas ülesannete täitmisel, mis nõuavad sujuvat, reageerimisvõimelist liikumist ja tõhusat kokkupõrgete vältimist, eriti dünaamilistes ja struktureerimata keskkondades. Käesolev magistritöö esitleb mudelipõhist, kokkupõrgetevaba, käitusaegset trajektoori optimeerimise raamistikku, mis on kohandatud just sellisteks olukordadeks. Meetod hõlmab sadade trajektooride genereerimist mitmemõõtmelisest normaaljaotusest, nende kuju määramist Bernsteini polünoomide abil ning paralleelset hindamist MuJoCo simulatsioonis. Seejärel optimeeritakse trajektoorid ristentroopia meetodil. Süsteem saavutab reaalajas, töötsüklis planeerimise, integreerides mudeliprognoosiva juhtimisstrateegia. Eksperimendid, nii simulatsioonis kui ka reaalses maailmas, demonstreerisid edukat manipuleerimist mitmete takistustega keskkonnas. Lisaks võimaldab raamistik paindlikke ülesandeid kulufunktsiooni kohandamise kaudu, võimaldades eesmärgist lähutvat käitumist erinevates tingimustes.

Märksõnad

Model-based planning, model predictive control, cross-entropy method, online planning

Viide