Arvuti sõnastike seletuste automaatne genereeri-mine ja kontrollimine Eesti Wordneti näitel
Date
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Tartu Ülikool
Abstract
Käesoleva töö eesmärk oli automaatselt genereerida seletusi Eesti Wordneti neile mõiste-tele, millel seletused puuduvad. Töö teoreetilises osas kirjeldatakse arvuti leksikonide aja-lugu ning antakse ülevaade wordnet-tüüpi leksikonide põhimõtetest. Täpsemalt kirjelda-takse Eesti Wordneti loomist, sisu ja erinevaid probleeme. Lisaks seletatakse, kuidas koos-tada ja formaliseerida sõnaseletust.
Töö praktilise osa tulemusena valmis programm, mis genereerib neljal erineval meetodil seletusi mõistetele, millel Eesti Wordnetis need puuduvad. Praktilise osa käigus jõuti järelduseni, et seletusi on võimalik genereerida, kuid kõik genereeritud seletused tuleb üle kontrollida, sest ükski meetod ei andnud 100% korrektset seletust. Kokku genereeriti 11 075 sõnaseletust 18 731 puuduvast seletusest. Kõige rohkem seletusi (5469 seletust ehk ligi 50% seletustest) genereeriti unikaalse sünohulga liikme põhjal. Kõige parema täpsusega töötasid sarnasuse (91% seletustest sobis) ning unikaalse sünohulga liikme meetodid (84% seletustest sobis).
Description
Keywords
arvuti sõnastik, Eesti Wordnet, sõnaseletuste automaatne genereerimine