Automaatmärgendatud süntaksi ja morfoloogia konfliktide lahendamine

dc.contributor.advisorLaur, Sven, juhendaja
dc.contributor.authorAruoja, Hendrik
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2025-10-23T11:38:41Z
dc.date.available2025-10-23T11:38:41Z
dc.date.issued2025
dc.description.abstractThe Bachelor's thesis focuses on finding cost-effective ways to resolve syntax-morphology conflicts for EstNLTK that utilizes instructing of Large Language Models (LLMs) as an alternative to manually labeling. The goal is to create a Python scripts that includes database query generation, execution of queries and processing of LLM prompts via API. The work is divided into a theoretical part, where the principles of syntax and morphology analysis are introduced, and a practical part, where the created python scripts and their capabilities are described.
dc.description.abstract Bakalaureusetöö keskendub kuluefektiivse süntaksi-morfoloogia konfliktide märgendamise viisi leidmiseks EstNLTK jaoks, kasutades suurte keelemudelite (LLM-idel) instrueerimisel põhinevat lähenemist käsitsi märgendamise alternatiivina. Eesmärgiks on luua Pythoni skriptid, mis sisaldavad andmebaasipäringute genereerimist, nende käivitamist ning instrueeritavatele keelemudelitele saadetavate päringute töötlemist API kaudu. Töö koosneb teoreetilisest osast, kus tutvustatakse süntaksi ja morfoloogia analüüsi põhimõtteid, ning praktilisest osast, kus kirjeldatakse loodud skriptide ülesehitust ja toimimist.
dc.identifier.urihttps://hdl.handle.net/10062/117056
dc.language.isoet
dc.publisherTartu Ülikoolet
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectProgrammeerimiskeel Python
dc.subjectloomuliku keele töötlus
dc.subjectsuured keelemudelid
dc.subjectsüntaks ja morfoloogia
dc.subject.otherbakalaureusetöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticsen
dc.subject.otherinfotechnologyen
dc.titleAutomaatmärgendatud süntaksi ja morfoloogia konfliktide lahendamine
dc.title.alternativeResolving Conflicts in Automatically Annotated Syntax and Morphology
dc.typeThesis

Failid

Originaal pakett

Nüüd näidatakse 1 - 2 2
Laen...
Pisipilt
Nimi:
Aruoja_informaatika_2025.pdf
Suurus:
705.4 KB
Formaat:
Adobe Portable Document Format
Laen...
Pisipilt
Nimi:
Loputoo_LLM_API_paringud.zip
Suurus:
14.59 KB
Formaat:
Compressed ZIP