Model-based planning using GPU-accelerated Simulator as a World Model

Hurova, Iryna

Model-based planning using GPU-accelerated Simulator as a World Model

dc.contributor.advisor	Singh, Arun Kumar, juhendaja
dc.contributor.advisor	Kruusamäe, Karl, juhendaja
dc.contributor.author	Hurova, Iryna
dc.contributor.other	Tartu Ülikool. Loodus- ja täppisteaduste valdkond	et
dc.contributor.other	Tartu Ülikool. Tehnoloogiainstituut	et
dc.date.accessioned	2026-04-26T15:52:40Z
dc.date.available	2026-04-26T15:52:40Z
dc.date.issued	2025
dc.description	Manipulatorroboteid kasutatakse üha enam reaalses maailmas ülesannete täitmisel, mis nõuavad sujuvat, reageerimisvõimelist liikumist ja tõhusat kokkupõrgete vältimist, eriti dünaamilistes ja struktureerimata keskkondades. Käesolev magistritöö esitleb mudelipõhist, kokkupõrgetevaba, käitusaegset trajektoori optimeerimise raamistikku, mis on kohandatud just sellisteks olukordadeks. Meetod hõlmab sadade trajektooride genereerimist mitmemõõtmelisest normaaljaotusest, nende kuju määramist Bernsteini polünoomide abil ning paralleelset hindamist MuJoCo simulatsioonis. Seejärel optimeeritakse trajektoorid ristentroopia meetodil. Süsteem saavutab reaalajas, töötsüklis planeerimise, integreerides mudeliprognoosiva juhtimisstrateegia. Eksperimendid, nii simulatsioonis kui ka reaalses maailmas, demonstreerisid edukat manipuleerimist mitmete takistustega keskkonnas. Lisaks võimaldab raamistik paindlikke ülesandeid kulufunktsiooni kohandamise kaudu, võimaldades eesmärgist lähutvat käitumist erinevates tingimustes.
dc.description.abstract	Manipulator robots are increasingly deployed in real-world tasks that require smooth, reactive motion and robust collision avoidance, particularly in dynamic and unstructured environments. This thesis presents a model-based, collision-free, online trajectory optimization framework tailored for such scenarios. The method involves sampling hundreds of trajectories from a multivariate normal distribution, shaping them with Bernstein polynomials, and evaluating them in parallel within a MuJoCo simulation. These trajectories are then optimized using the cross-entropy method. The system achieves real-time, in-the-loop planning by integrating a model predictive control strategy. The experiment, both in simulation and in real-world tests, demonstrated successful manipulation in an environment with multiple obstacles. In addition, the framework supports flexible task objectives by adjusting the cost function, enabling goal-driven behavior under varying conditions.
dc.identifier.uri	https://hdl.handle.net/10062/120647
dc.language.iso	en
dc.publisher	Tartu Ülikool	et
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Estonia	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/ee/
dc.subject	Model-based planning
dc.subject	model predictive control
dc.subject	cross-entropy method
dc.subject	online planning
dc.subject.other	magistritööd	et
dc.title	Model-based planning using GPU-accelerated Simulator as a World Model
dc.title.alternative	Mudelipõhine planeerimine, kasutades GPU-kiirendusega simulaatorit maailmamudelina
dc.type	Thesis	en

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1

Nimi:: Hurova_MSc2025.pdf
Suurus:: 7.55 MB
Formaat:: Adobe Portable Document Format

Lae alla

Kollektsioonid

Robotics and Computer Engineering - Master's theses