Arvuti sõnastike seletuste automaatne genereeri-mine ja kontrollimine Eesti Wordneti näitel

Date

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Tartu Ülikool

Abstract

Käesoleva töö eesmärk oli automaatselt genereerida seletusi Eesti Wordneti neile mõiste-tele, millel seletused puuduvad. Töö teoreetilises osas kirjeldatakse arvuti leksikonide aja-lugu ning antakse ülevaade wordnet-tüüpi leksikonide põhimõtetest. Täpsemalt kirjelda-takse Eesti Wordneti loomist, sisu ja erinevaid probleeme. Lisaks seletatakse, kuidas koos-tada ja formaliseerida sõnaseletust. Töö praktilise osa tulemusena valmis programm, mis genereerib neljal erineval meetodil seletusi mõistetele, millel Eesti Wordnetis need puuduvad. Praktilise osa käigus jõuti järelduseni, et seletusi on võimalik genereerida, kuid kõik genereeritud seletused tuleb üle kontrollida, sest ükski meetod ei andnud 100% korrektset seletust. Kokku genereeriti 11 075 sõnaseletust 18 731 puuduvast seletusest. Kõige rohkem seletusi (5469 seletust ehk ligi 50% seletustest) genereeriti unikaalse sünohulga liikme põhjal. Kõige parema täpsusega töötasid sarnasuse (91% seletustest sobis) ning unikaalse sünohulga liikme meetodid (84% seletustest sobis).

Description

Keywords

arvuti sõnastik, Eesti Wordnet, sõnaseletuste automaatne genereerimine

Citation