Document-Level Text Simplification in Estonian Using Large Language Models

dc.contributor.advisorBarbu, Eduard, juhendaja
dc.contributor.authorMuru, Meeri-Ly
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2025-10-23T08:37:09Z
dc.date.available2025-10-23T08:37:09Z
dc.date.issued2025
dc.description.abstractThe goal of text simplification is to improve text comprehensibility. It can be beneficial for people with reading disabilities or language learners. This thesis investigates Estonian text simplification at the document level by utilizing large language models and different prompt design strategies. The aim is to evaluate how various approaches influence the effectiveness of text simplification. The outputs generated by the models were assessed using both automatic evaluation methods and qualitative analysis.
dc.description.abstract Teksti lihtsustamise eesmärk on tõsta teksti arusaadavust. See on abiks lugemisraskustega inimestele või keeleõppijatele. Lõputöö uurib eestikeelse teksti lihtsustamist dokumendi tasemel rakendades suuri keelemudeleid ning erinevaid viipe loomise strateegiaid. Eesmärk on hinnata, kuidas erinevad lähenemised mõjutavad teksti lihtsustamise tulemuslikkust. Mudelite väljundeid hinnati automaatsete meetodite ning kvalitatiivse analüüsi abil.
dc.identifier.urihttps://hdl.handle.net/10062/117028
dc.language.isoen
dc.publisherTartu Ülikoolet
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectnatural language processing
dc.subjectlarge language models
dc.subjectartifical intelligence
dc.subjecttehisintellekt
dc.subjectsuured keelemudelid
dc.subjectloomuliku keele töötlus
dc.subject.otherbakalaureusetöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticsen
dc.subject.otherinfotechnologyen
dc.titleDocument-Level Text Simplification in Estonian Using Large Language Models
dc.title.alternativeEestikeelse teksti lihtsustamine dokumendi tasemel rakendades suuri keelemudeleid
dc.typeThesis

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
muru_informaatika_2025.pdf
Suurus:
257.78 KB
Formaat:
Adobe Portable Document Format