Genereeritud vastuste kvaliteedi hindamine allikapõhistes generatiivsetes süsteemides

dc.contributor.advisorKolde, Anastassia, juhendaja
dc.contributor.advisorSügis, Elena, juhendaja
dc.contributor.authorPihl, Piret
dc.contributor.otherTartu Ülikool. Matemaatika ja statistika instituutet
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.date.accessioned2025-06-27T09:11:22Z
dc.date.available2025-06-27T09:11:22Z
dc.date.issued2025
dc.descriptionViimasetel aastatel on suured keelemudelid leidnud laialdast kasutust erinevates rakendustes - alates vestlusrobotitest klienditeeninduses kuni rakendusteni tervishoiu valdkonnas. Kuigi nende populaarsus ja kasutusvõimalused on kiiresti kasvanud, ei ole iseenesestmõistetav, kuidas hinnata keelemudelite genereeritud vastuste kvaliteeti ning tagada nende usaldusväärsus. See on kriitilise tähtsusega , eriti kui mudeleid kasutatakse otsuste tegemisel või teabe vahendamisel. Bakalaureusetöö eesmärk on tuvastada tegurid, mis on seotud suurte keelemudelite genereeritud vastuste kvaliteediga allikapõhistes generatiivsetes süsteemides ja kuidas nad seda mõjutavad. Töö raames valiti kolm vastuse kvaliteedi hindamise mõõdikut ning mõõdeti nende väärtused, et hinnata kolme suure keelemudeli genereeritud vastuseid. Nende analüüsimiseks kasutati logistilist ja beetaregressiooni. Regressioonimudelitest tuli välja, et peamiselt on seotud vastuse kvaliteet küsimuse esitusviisiga ja kõige paremad vastused saavad täispikad küsimused. Samuti leiti, et kolmest uuritavast suurest keelemudelist andis kõige paremad vastused GPT-4o. Tulemused on kasutavad praktikas vestlusrobotite loomisel, mis tuginevad allikapõhistele generatiivsetele rakendustele.et
dc.identifier.urihttps://hdl.handle.net/10062/111729
dc.language.isoet
dc.publisherTartu Ülikoolet
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Estoniaen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/ee/
dc.subjectSKMet
dc.subjectbeetaregressioonet
dc.subjectlogistiline regressioonet
dc.subjectLLMen
dc.subjectbeta regressionen
dc.subjectlogistic regressionen
dc.subject.otherbakalaureusetöödet
dc.subject.othervõrguväljaanded
dc.titleGenereeritud vastuste kvaliteedi hindamine allikapõhistes generatiivsetes süsteemideset
dc.typeThesisen

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
piret_pihl_bsc_2025.pdf
Suurus:
596.94 KB
Formaat:
Adobe Portable Document Format