Sirvi Kuupäev , alustades "2026-03-04" järgi
Nüüd näidatakse 1 - 1 1
- Tulemused lehekülje kohta
- Sorteerimisvalikud
listelement.badge.dso-type Kirje , Cross-lingual transfer learning and evaluation in low-resource settings(Tartu Ülikooli Kirjastus, 2026-03-04) Kuulmets, Hele-Andra; Fišel, Mark, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkondMeie igapäevaellu üha enam sekkuva tehisaru üks põhikomponente on keelemudel, tänu millele tehisaru üldse suudab inimkeele peeneid nüansse mõista. Selleks, et keelemudel inimkeelt väga hästi mõistaks, tuleb seda treenida tohutult suurte tekstikogumite peal. Koguni nii suurte, et enamik maailmas kõneldavaid keeli pole teksti kujul sellises mahus kättesaadavad. Seetõttu on tehisaru võimalused paljudes keeltes piiratud, süvendades tehnoloogilist ebavõrdsust ressursirikaste ja ressursivaeste keelte vahel. Õnneks on ka väiksemate tekstikogumitega keeltele lahendus olemas. Nimelt on täheldatud, et keelemudelite treenimisel korraga paljude keelte peal paraneb keelemudelite oskus treeningandmestikus vähem esindatud keeltest aru saada. Seda nähtust nimetatakse keeltevaheliseks teadmussiirdeks ja see tähendab, et mudel õpib teadmisi, mis ta on omandanud näiteks ingliskeelsetest tekstidest, kasutama eesti keeles vastamisel. Kui minna veel tehnilisemaks, siis juhtub mitmekeelsel treenimisel see, et eri keelte matemaatilised esitused mudeli sees muutuvad üksteisega sarnasemaks, mis põhjustabki keeltevahelist teadmiste siiret. Doktoritöös uuritakse, kuidas tugevdada keelemudelites keeltevahelist teadmussiiret, et parandada keelemudelite oskust mõista eesti keelt. Töö jaguneb kaheks osaks, millest esimeses osas uuritakse meetodeid väikeste keelemudelite kasutamiseks konkreetse ülesande lahendamisel ja teises seda, kuidas õpetada peamiselt ingliskeelsetel tekstidel treenitud suurele keelemudelile selgeks eesti keelt. Töö peamine järeldus on, et mitmekeelne treenimine, isegi kui kasutada ainult sünteetilisi andmeid, võib märgatavalt parandada keelemudeli oskust eesti keeles mitmesuguseid ülesandeid lahendada. See tulemus osutab keeltevahelise teadmussiirde oskusliku ärakasutamise tõhususele väiksematele keeltele tehisaru maailmas parema esindatuse tagamisel.