Finantsteemaliste artiklite lihtsustamine

dc.contributor.advisorFišel, Mark, juhendaja
dc.contributor.advisorOha, Lehar, juhendaja
dc.contributor.authorPetersel, Kristin
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2023-08-25T08:22:10Z
dc.date.available2023-08-25T08:22:10Z
dc.date.issued2022
dc.description.abstractPaljud finantsteemalised artiklid sisaldavad valdkonnaspetsiifilist sõnavara, mistõttu võivad need tavalugejale olla keerulised mõista. Magistritöö raames uuritakse tihedalt tarbitavate allikate artiklite põhjal, kui palju keerulist sõnavara neis sisaldub ning kui edukalt on keeletehnoloogia vahendite abil võimalik teksti lugejale lihtsamaks teha. Artiklites märgendati väliste lugejate poolt nende silmis keerulised sõnad, mida lihtsustatakse kahe meetodiga: teksti tõlkimine Tartu Ülikooli Neurotõlke abil ning keeruliste sõnade sünonüümimine, kasutades EstNLTK Wordneti sünohulkasid ning eeltreenitud skip-gram mudelit. Analüüs näitas, et vaadeldavates artiklites moodustasid keerulised sõnad ligi 2% kõikidest sõnadest. Nende lihtsustamisel olid tõlkemeetodi tulemused üldiselt edukamad, kuna sünonüümimise puhul ei olnud keerulise sõna sünonüüm alati lihtsamini mõistetav või siis ei leidunud Wordnetis vaadeldavale sõnale ühtegi sünonüümi.et
dc.identifier.urihttps://hdl.handle.net/10062/91758
dc.language.isoestet
dc.publisherTartu Ülikoolet
dc.rightsopenAccesset
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectTeksti lihtsustamineet
dc.subjectsünonüümimineet
dc.subjecttõlkimineet
dc.subjectkeeleteaduset
dc.subject.othermagistritöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticset
dc.subject.otherinfotechnologyet
dc.titleFinantsteemaliste artiklite lihtsustamineet
dc.typeThesiset

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
Petersel_andmeteadus_2022.pdf
Suurus:
646.13 KB
Formaat:
Adobe Portable Document Format
Kirjeldus:

Litsentsi pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
license.txt
Suurus:
1.71 KB
Formaat:
Item-specific license agreed upon to submission
Kirjeldus: