Extracting Lexical Relations from Large Pre-trained Language Models
dc.contributor.advisor | Fišel, Mark, juhendaja | |
dc.contributor.advisor | Orav, Heili, juhendaja | |
dc.contributor.author | Rudi, Eduard | |
dc.contributor.other | Tartu Ülikool. Loodus- ja täppisteaduste valdkond | et |
dc.contributor.other | Tartu Ülikool. Arvutiteaduse instituut | et |
dc.date.accessioned | 2024-10-04T08:11:56Z | |
dc.date.available | 2024-10-04T08:11:56Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Alates OpenAI ChatGPT ilmumisest on suured keelemudelid muutunud äärmiselt populaarseks. ChatGPT põhineb generatiivsel eeltreenitud transformeril (GPT), mille uusim versioon on GPT-4. Selle lõputöö eesmärk on testida GPT-4 võimeid, mida praegu peetakse suurte keelemudelite tipptasemeks. Lähenemisviisiks on wordnet-tüüpi sõnastiku genereerimine, mis on sõnade ja nende suhete võrgustik. See on tõhus meetod GPT-4 testimiseks, sest võimaldab testida mudelit mitmes keeles, sealhulgas ressursirohketes keeltes nagu inglise keel ja ressursivaestes keeltes nagu eesti keel. Varasemad katsed wordneti genereerimisel tuginesid suuresti masintõlkele, mis tavaliselt ei ole ressursivaeste keelte puhul tõhus. Kahjuks ei osutunud GPT-4 sooritus siinses töös nii heaks, kui oodati. Enim esines raskusi sõna kõigi tähenduste genereerimise ja suhete üle genereerimisega. Need probleemid esinesid mõlemas keeles. Lõppkokkuvõttes töötavad generatiivsed suured keele mudelid kõige paremini, kui kontekst juba eksisteerib, näiteks kokkuvõtete loomisel või ühiktestide genereerimisel. | |
dc.identifier.uri | https://hdl.handle.net/10062/105114 | |
dc.language.iso | en | |
dc.publisher | Tartu Ülikool | et |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Estonia | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/ee/ | |
dc.subject | large language models | |
dc.subject | LLM | |
dc.subject | Wordnet | |
dc.subject | GPT-4 | |
dc.subject | generating Wordnet | |
dc.subject | suured keelemudelid | |
dc.subject.other | magistritööd | et |
dc.subject.other | informaatika | et |
dc.subject.other | infotehnoloogia | et |
dc.subject.other | informatics | en |
dc.subject.other | infotechnology | en |
dc.title | Extracting Lexical Relations from Large Pre-trained Language Models | |
dc.type | Thesis | en |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- rudi_computerscience_2024.pdf
- Size:
- 520.2 KB
- Format:
- Adobe Portable Document Format