Nimisõnade klasterdamine vastavalt neid kirjeldavatele omadussõnadele
Date
2021
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Tartu Ülikool
Abstract
Omadussõnade kasutus annab lisainformatsiooni nendega seotud nimisõnade kohta. See
võimaldab kokku grupeerida sarnaste omadustega nimisõnu. Antud töö eesmärgiks on
kasutada kolme erinevat meetodit, et klasterdada nimisõnu vastavalt nendele omadussõnadele,
millega neid tekstides kirjeldatakse. Klasterdamiseks on kasutatud Jaccardi
sarnasust koos spektraalklasterdusega, mittenegatiivset maatriksi faktorisatsiooni ning
Dirichlet’ peitlahutust. Klasterdamise tulemusena saadakse nimisõnade grupid ning analüüsitakse
klastritesse kuuluvate sõnade seotust ning seda, millised omadused milliste
sõnade jaoks on keelekasutuses olulised.
Description
Keywords
loomuliku keele töötlus, semantiline sarnasus, klasterdamine, Jaccardi sarnasus, teemade modelleerimine, Dirichlet’ peitlahutus, mittenegatiivne maatriksi faktorisatsioon