Sirvi Autor "Khajuria, Tarun" järgi

Nüüd näidatakse 1 - 2 2

listelement.badge.access-status Avatud juurdepääs ,
A unified account of visual search using a computational model
(Tartu Ülikool, 2020) Khajuria, Tarun; Vicente, Raul, juhendaja; Aru, Jaan, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituut
Visual Search is a task ubiquitously performed by humans in everyday life. In the laboratory, to understand more about this process, experiments have characterised the time that humans need to locate a particular target object amongst others. Based on this search time’s dependence on the number of objects in the image, it is believed that two kinds of search take place. Feature search, where the target pops-out of the search image and is instantly found using a parallel search mechanism, and conjunction search, with more complex objects where the search is serial and the search time increases with the number of objects. In this work, we use a computational model to propose a unified process that can result in feature or conjunction search characteristics depending on the precision of the attention guidance mechanism. We show that the search performance can be partly explained by the precision or capacity of the encoding of distinct features that is used to guide attention during the search process.
listelement.badge.access-status Avatud juurdepääs ,
Scene understanding in human and computer vision
(Tartu Ülikooli Kirjastus, 2026-04-10) Khajuria, Tarun; Aru, Jaan, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond
Inimestel on võime tõlgendada sama visuaalset stseeni paindlikult mitmel moel. Näiteks kinosaalis suudame identifitseerida üksikuid istmeid toolide, kott-toolide või diivanitena, tajudes neid samal ajal ka osana suuremast struktuurist – ridadest ja sektsioonidest, mis määravad kõnniteed. See paindlikkus aitab kaasa ka meie nägemissüsteemi vastupidavusele keerulistes oludes, kasutades struktuuri puuduva teabe järeldamiseks, aga ka selleks, et vajaduse korral ignoreerida stseeni ebaolulisi objekte, et vältida võltsseoseid. Visuaalsest stseenist aru saamise protsessis ei toimu ainult passiivne keskkonnast teabe vastuvõtmine, vaid see hõlmab ka aktiivset teabe kogumist. Selles väitekirjas uurisime inimeste ja masinnägemise sarnasusi ja erinevusi sellises aktiivses stseeni mõistmise protsessis. Selleks lõime esmalt tähtkujudest inspireeritud keerulise nägemisülesande, kus inimesed ja masinalgoritmid püüdsid leida pildil peituvat nõrga signaaliga objekti. Inimesed, kes seda ülesannet lahendasid, kirjeldasid lahendusprotsessi käigus mitme hüpoteesi moodustamist ja järkjärgulist täpsustamist (nt „see võib olla loom“, „see võib olla lennuk“). Teises peatükis uurisime, kuidas seda protsessi saab arvutimudelite abil korrata. Täpsemalt testisime meetodit, mis genereerib tähtkujupiltidel olevate objektide võimalikke tõlgendusi. Võrreldes mudeli ja inimeste sooritust, uurisime, kui hästi see peegeldab inimeste taju. Lõpuks testisime paljusid tehisaru mudeleid selle alusel, kuidas nad töötlevad mitut objekti loomulikes stseenides. See analüüs võimaldas meil tuvastada puudujääke viisis, kuidas need mudelid esitavad stseeni vähem olulisi taustaobjekte, ning teha ettepanekuid nende mudelite paremaks kasutamiseks tehisarusüsteemides. Kokkuvõttes pakuvad selle väitekirja tulemused teadmisi selle kohta, kuidas inimesed ebamäärasest visuaalsest sisendist aru saavad, ning viise, kuidas arvutimudeleid saaks testida ja paremini kujundada selle võime imiteerimiseks. Need tulemused aitavad mõista inimtaju ja luua tehisnägemise süsteeme, mis suudavad enamat kui pelgalt mustreid tuvastada.