Automaatmärgendatud süntaksi ja morfoloogia konfliktide lahendamine

Laen...
Pisipilt

Kuupäev

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

The Bachelor's thesis focuses on finding cost-effective ways to resolve syntax-morphology conflicts for EstNLTK that utilizes instructing of Large Language Models (LLMs) as an alternative to manually labeling. The goal is to create a Python scripts that includes database query generation, execution of queries and processing of LLM prompts via API. The work is divided into a theoretical part, where the principles of syntax and morphology analysis are introduced, and a practical part, where the created python scripts and their capabilities are described.
Bakalaureusetöö keskendub kuluefektiivse süntaksi-morfoloogia konfliktide märgendamise viisi leidmiseks EstNLTK jaoks, kasutades suurte keelemudelite (LLM-idel) instrueerimisel põhinevat lähenemist käsitsi märgendamise alternatiivina. Eesmärgiks on luua Pythoni skriptid, mis sisaldavad andmebaasipäringute genereerimist, nende käivitamist ning instrueeritavatele keelemudelitele saadetavate päringute töötlemist API kaudu. Töö koosneb teoreetilisest osast, kus tutvustatakse süntaksi ja morfoloogia analüüsi põhimõtteid, ning praktilisest osast, kus kirjeldatakse loodud skriptide ülesehitust ja toimimist.

Kirjeldus

Märksõnad

Programmeerimiskeel Python, loomuliku keele töötlus, suured keelemudelid, süntaks ja morfoloogia

Viide