Suurte keelemudelite võrdlev analüüs Eesti bioloogiaolümpiaadide küsimuste põhjal

Kiil, Ahto

Suurte keelemudelite võrdlev analüüs Eesti bioloogiaolümpiaadide küsimuste põhjal

dc.contributor.advisor	Purason, Taido, juhendaja
dc.contributor.advisor	Kuulmets, Hele-Andra, juhendaja
dc.contributor.author	Kiil, Ahto
dc.contributor.other	Tartu Ülikool. Loodus- ja täppisteaduste valdkond	et
dc.contributor.other	Tartu Ülikool. Arvutiteaduse instituut	et
dc.date.accessioned	2025-10-23T11:36:38Z
dc.date.available	2025-10-23T11:36:38Z
dc.date.issued	2025
dc.description.abstract	Several types of tests are used to evaluate large language models – translation, text comprehension, image recognition, answering questions etc. Typically, evaluation datasets are translated from English, and there is a lack of test sets that consider specific local context and are originally composed in Estonian. As part of this BA thesis, a multiple-choice dataset consisting of 1,031 questions was compiled using tasks from Estonian biology olympiads between 2005 and 2024. In the second phase, five OpenAI models, 13 Estonian-trained models from the Hugging Face platform and nine of the most recent closed commercial models accessed via websites were evaluated. The best model's accuracy (85.35%) is comparable to the average result (87.16%) of pupils who placed in the top three in Estonian olympiads.
dc.description.abstract	Suurte keelemudelite võrdlemiseks kasutatakse erinevaid teste – tõlkimine, tekstist arusaamine, küsimustele vastamine jpm. Reeglina on testandmestikud tõlgitud inglise keelest ja algusest peale eesti keeles koostatud ning Eesti eripära arvestavaid küsimustikke napib. Bakalaureusetöö käigus valmis 1031 küsimusest koosnev valikvastustega andmestik, mille koostamisel kasutati Eesti bioloogiaolümpiaadide ülesandeid ajavahemikust 2005–2024. Lõputöö teises faasis pandi proovile viis OpenAI mudelit, 13 eesti keelel treenitud mudelit platvormilt Hugging Face ning otse veebilehtedelt üheksa uusimat suletud kommertsmudelit. Mudelite parim täpsus (85,35%) on võrreldav Eesti olümpiaadidel esikolmikusse jõudnud õpilaste keskmise tulemusega teooriavoorus (87,16%).
dc.identifier.uri	https://hdl.handle.net/10062/117055
dc.language.iso	et
dc.publisher	Tartu Ülikool	et
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject	suured keelemudelid
dc.subject	valikvastustega küsimused
dc.subject	olümpiaad
dc.subject	eesti keel
dc.subject.other	bakalaureusetööd	et
dc.subject.other	informaatika	et
dc.subject.other	infotehnoloogia	et
dc.subject.other	informatics	en
dc.subject.other	infotechnology	en
dc.title	Suurte keelemudelite võrdlev analüüs Eesti bioloogiaolümpiaadide küsimuste põhjal
dc.title.alternative	Leveraging Estonian Biology Olympiad Problems for Evaluating Large Language Models
dc.type	Thesis

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1

Nimi:: kiil_informaatika_2025.pdf
Suurus:: 496.54 KB
Formaat:: Adobe Portable Document Format

Lae alla

Kollektsioonid

LTAT bakalaureusetööd – Bachelor's theses