Development of a testing framework for monocular depth estimation models on targeted hardware
Laen...
Kuupäev
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
This thesis presents the development of a testing framework designed to evaluate monocular
depth estimation (MDE) models on targeted embedded hardware. The work is motivated by the
KuupKulgur lunar microrover project, where traditional depth sensing methods are impractical
due to size, weight, and power limitations. MDE models have demonstrated strong accuracy.
However, their real-time performance on targeted hardware requires validation.
A modular pipeline was implemented to benchmark various MDE models on the NVIDIA
Jetson Orin Nano platform. The framework supports multiple inference backends and weight
precisions, enabling comparison between PyTorch and Open Neural Network Exchange (ONNX)
Runtime using Floating Point (FP)32 and FP16 precision weights. The framework gathers time
and hardware usage data during benchmarking.
The developed testing framework provides a valuable tool for evaluating MDE models in
robotic systems, including future lunar rovers.
Four MDE models were tested: Depth Anything V2, Metric3Dv2, Depth Pro and SPIdepth.
Once optimisation with NVIDIA TensorRT (TRT) was applied, all models showed improved
inference times over PyTorch when using FP16 precision weights. When using FP32 values,
PyTorch outperformed TRT, with a few exceptions. The best-performing model was Depth
Anything V2’s smallest relative model when using TRT optimisation level 2 and FP16 precision
weights.
Kirjeldus
Käesolev töö tutvustab testimisraamistiku väljatöötamist, mille eesmärk on hinnata monokulaarseid sügavushinnangu (MSH) mudeleid sihtotstarbelisel manussüsteemi riistvaral. Töö on tehtud KuupKulguri, kuu-mikrokulguri projekti raames, kus traditsioonilised sügavusandmete leidmise võimalused ei ole praktilised piiratud suuruse, kaalu ja energiatarbimise tõttu. MSH mudelid on tõestanud oma täpsust, kuid nende reaalajas toimivus sihtotstarbelisel riistvaral vajab valideerimist.
Loodi testimisraamistik, et võrrelda erinevaid MSH mudeleid NVIDIA Jetson Orin Nano platvormil. Raamistik toetab mitmeid inferentsi võimaldavaid Pythoni teeke, võimaldades võrrelda PyTorchi ja Open Neural Network Exchange (ONNX) Runtime’i, kasutades nii ujukomaarvulisi (FP32) kui ka FP16 andmetüübiga kaalusid. Raamistik kogub testimise käigus protsessidele kulunud aegu ja riistvarakasutuse andmeid.
Arendatud testimisraamistik võimaldab efektiivsemalt hinnata MSH mudeleid ja nende kasutuselevõtu kõlblikkust robotsüsteemides, sealhulgas tulevastes kuukulgurites.
Testiti nelja MSH mudelit: Depth Anything V2, Metric3Dv2, Depth Pro ja SPIdepth. Pärast optimeerimist kasutades NVIDIA TensorRT-d (TRT) paranes kõigi mudelite inferentsi aeg võrreldes PyTorchi kasutamisega, kui kasutati FP16 kaalusid. FP32 väärtuste kasutamisel oli PyTorchi jõudlus parem kui TRT puhul, mõningate eranditega. Parimate ajaliste tulemustega mudel oli Depth Anything.
Märksõnad
monocular depth estimation, robotics, NVIDIA Jetson, testing framework