Model-based planning using GPU-accelerated Simulator as a World Model

dc.contributor.advisorSingh, Arun Kumar, juhendaja
dc.contributor.advisorKruusamäe, Karl, juhendaja
dc.contributor.authorHurova, Iryna
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Tehnoloogiainstituutet
dc.date.accessioned2026-04-26T15:52:40Z
dc.date.available2026-04-26T15:52:40Z
dc.date.issued2025
dc.descriptionManipulatorroboteid kasutatakse üha enam reaalses maailmas ülesannete täitmisel, mis nõuavad sujuvat, reageerimisvõimelist liikumist ja tõhusat kokkupõrgete vältimist, eriti dünaamilistes ja struktureerimata keskkondades. Käesolev magistritöö esitleb mudelipõhist, kokkupõrgetevaba, käitusaegset trajektoori optimeerimise raamistikku, mis on kohandatud just sellisteks olukordadeks. Meetod hõlmab sadade trajektooride genereerimist mitmemõõtmelisest normaaljaotusest, nende kuju määramist Bernsteini polünoomide abil ning paralleelset hindamist MuJoCo simulatsioonis. Seejärel optimeeritakse trajektoorid ristentroopia meetodil. Süsteem saavutab reaalajas, töötsüklis planeerimise, integreerides mudeliprognoosiva juhtimisstrateegia. Eksperimendid, nii simulatsioonis kui ka reaalses maailmas, demonstreerisid edukat manipuleerimist mitmete takistustega keskkonnas. Lisaks võimaldab raamistik paindlikke ülesandeid kulufunktsiooni kohandamise kaudu, võimaldades eesmärgist lähutvat käitumist erinevates tingimustes.
dc.description.abstractManipulator robots are increasingly deployed in real-world tasks that require smooth, reactive motion and robust collision avoidance, particularly in dynamic and unstructured environments. This thesis presents a model-based, collision-free, online trajectory optimization framework tailored for such scenarios. The method involves sampling hundreds of trajectories from a multivariate normal distribution, shaping them with Bernstein polynomials, and evaluating them in parallel within a MuJoCo simulation. These trajectories are then optimized using the cross-entropy method. The system achieves real-time, in-the-loop planning by integrating a model predictive control strategy. The experiment, both in simulation and in real-world tests, demonstrated successful manipulation in an environment with multiple obstacles. In addition, the framework supports flexible task objectives by adjusting the cost function, enabling goal-driven behavior under varying conditions.
dc.identifier.urihttps://hdl.handle.net/10062/120647
dc.language.isoen
dc.publisherTartu Ülikoolet
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Estoniaen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/ee/
dc.subjectModel-based planning
dc.subjectmodel predictive control
dc.subjectcross-entropy method
dc.subjectonline planning
dc.subject.othermagistritöödet
dc.titleModel-based planning using GPU-accelerated Simulator as a World Model
dc.title.alternativeMudelipõhine planeerimine, kasutades GPU-kiirendusega simulaatorit maailmamudelina
dc.typeThesisen

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
Hurova_MSc2025.pdf
Suurus:
7.55 MB
Formaat:
Adobe Portable Document Format