BERT mudeli kohandamine eesti keelele
Date
2023
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Tartu Ülikool
Abstract
Keelemudelite kiire areng on muutnud arvutid meie elus osavateks inimkeele kasutajateks,
mille abil on tänapäeval võimalik lihtsa vaevaga lahendada mitmeid erinevat
tüüpi keeleülesandeid, olgu selleks siis tekstide tõlkimine, klassifitseerimine või uue
teksti genereerimine. Aastal 2018 Google teadlaste poolt loodud keelemudel BERT on
tänaseni tänu oma võimsale arhitektuurile ja avatud lähtekoodile üks populaarsemaid
keelemudelid. Mudeli täiustamiseks on loodud ka konkreetse keele põhiseid BERT mudeleid
nagu aastal 2020 loodud ESTBERT, mis on kohandatud eestikeelsete ülesannete
jaoks. Magistritöö eesmärk on muuta BERT mudeli arhitektuuri nii, et see võimaldaks
mudelis kasutada täiendavat morfoloogilist infot sisendi kohta nagu sõnade lemmad ja
vormid. Töös treenitakse muudetud arhitektuuriga mudel välja ning analüüsitakse mudeli
suutlikkust neljal keeleülesandel.
Description
Keywords
loomuliku keele töötlus, BERT, EstBERT