BERT mudeli kohandamine eesti keelele
Laen...
Kuupäev
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
Keelemudelite kiire areng on muutnud arvutid meie elus osavateks inimkeele kasutajateks,
mille abil on tänapäeval võimalik lihtsa vaevaga lahendada mitmeid erinevat
tüüpi keeleülesandeid, olgu selleks siis tekstide tõlkimine, klassifitseerimine või uue
teksti genereerimine. Aastal 2018 Google teadlaste poolt loodud keelemudel BERT on
tänaseni tänu oma võimsale arhitektuurile ja avatud lähtekoodile üks populaarsemaid
keelemudelid. Mudeli täiustamiseks on loodud ka konkreetse keele põhiseid BERT mudeleid
nagu aastal 2020 loodud ESTBERT, mis on kohandatud eestikeelsete ülesannete
jaoks. Magistritöö eesmärk on muuta BERT mudeli arhitektuuri nii, et see võimaldaks
mudelis kasutada täiendavat morfoloogilist infot sisendi kohta nagu sõnade lemmad ja
vormid. Töös treenitakse muudetud arhitektuuriga mudel välja ning analüüsitakse mudeli
suutlikkust neljal keeleülesandel.
Kirjeldus
Märksõnad
loomuliku keele töötlus, BERT, EstBERT