INTUIT-VLNCE: Autonomous Navigation through Vision-and-Language

Rodionov, Kirill

INTUIT-VLNCE: Autonomous Navigation through Vision-and-Language

Failid

Rodionov_MSc2024.pdf (8.95 MB)

Kuupäev

2024

Autorid

Rodionov, Kirill

Kirjastaja

Tartu Ülikool

Abstrakt

The aim of this thesis was to developed an Embodied Agent with explicit intuition capable of navigating indoor Continuous Environments based on provided Natural Language instruction and Agent’s egocentric vision as part of a Vision-and-Language Navigation task. The thesis proposes creating explicit intuition by making an Agent predict not only an action to perform at a given time, but also predicting actions for the future. An Agent’s policy was trained mimicking the training procedure from LAW-VLNCE project [1]. Evaluations showed negative results after implementing proposed method.

Kirjeldus

Käesoleva lõputöö eesmärk oli ilmse intuitsiooniga Kehastunud Agendi arendus. Kehastunud Agent peab navigeerima läbi pideva siseruumi, kasutades antud Loomuliku Keele instruktsiooni ja egotsentrilist nägemust, nagu on kirjeldatud Nägemus-ja-Keel ülesannes. Lõputöö pakub välja luua ilmset intuitsiooni: Agent ennustab ette nii tegu, mida on vaja hetkseisul sooritada, kui ka tegusid, mida kavatsetakse sooritada tulevikus.

Märksõnad

robotics, natural language, embodied agent, autonomy

URI

https://hdl.handle.net/10062/107730

Kollektsioonid

Robotics and Computer Engineering - Master's theses

Kirje täielik lehekülg

INTUIT-VLNCE: Autonomous Navigation through Vision-and-Language

Failid

Kuupäev

Autorid

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Abstrakt

Kirjeldus

Märksõnad

Viide

URI

Kollektsioonid