Arvuti sõnastike seletuste automaatne genereeri-mine ja kontrollimine Eesti Wordneti näitel

dc.contributor.advisorOrav, Heili, juhendaja
dc.contributor.advisorJentson, Indrek, juhendaja
dc.contributor.authorMarkov, Kristo
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2023-08-15T10:58:24Z
dc.date.available2023-08-15T10:58:24Z
dc.date.issued2022
dc.description.abstractKäesoleva töö eesmärk oli automaatselt genereerida seletusi Eesti Wordneti neile mõiste-tele, millel seletused puuduvad. Töö teoreetilises osas kirjeldatakse arvuti leksikonide aja-lugu ning antakse ülevaade wordnet-tüüpi leksikonide põhimõtetest. Täpsemalt kirjelda-takse Eesti Wordneti loomist, sisu ja erinevaid probleeme. Lisaks seletatakse, kuidas koos-tada ja formaliseerida sõnaseletust. Töö praktilise osa tulemusena valmis programm, mis genereerib neljal erineval meetodil seletusi mõistetele, millel Eesti Wordnetis need puuduvad. Praktilise osa käigus jõuti järelduseni, et seletusi on võimalik genereerida, kuid kõik genereeritud seletused tuleb üle kontrollida, sest ükski meetod ei andnud 100% korrektset seletust. Kokku genereeriti 11 075 sõnaseletust 18 731 puuduvast seletusest. Kõige rohkem seletusi (5469 seletust ehk ligi 50% seletustest) genereeriti unikaalse sünohulga liikme põhjal. Kõige parema täpsusega töötasid sarnasuse (91% seletustest sobis) ning unikaalse sünohulga liikme meetodid (84% seletustest sobis).et
dc.identifier.urihttps://hdl.handle.net/10062/91606
dc.language.isoestet
dc.publisherTartu Ülikoolet
dc.rightsopenAccesset
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectarvuti sõnastiket
dc.subjectEesti Wordnetet
dc.subjectsõnaseletuste automaatne genereerimineet
dc.subject.otherbakalaureusetöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticset
dc.subject.otherinfotechnologyet
dc.titleArvuti sõnastike seletuste automaatne genereeri-mine ja kontrollimine Eesti Wordneti näitelet
dc.typeThesiset

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
markov_informaatika_2022.pdf
Suurus:
475.35 KB
Formaat:
Adobe Portable Document Format
Kirjeldus:

Litsentsi pakett

Nüüd näidatakse 1 - 1 1
Pisipilt ei ole saadaval
Nimi:
license.txt
Suurus:
1.71 KB
Formaat:
Item-specific license agreed upon to submission
Kirjeldus: