Nimisõnade klasterdamine vastavalt neid kirjeldavatele omadussõnadele

Date

2021

Journal Title

Journal ISSN

Volume Title

Publisher

Tartu Ülikool

Abstract

Omadussõnade kasutus annab lisainformatsiooni nendega seotud nimisõnade kohta. See võimaldab kokku grupeerida sarnaste omadustega nimisõnu. Antud töö eesmärgiks on kasutada kolme erinevat meetodit, et klasterdada nimisõnu vastavalt nendele omadussõnadele, millega neid tekstides kirjeldatakse. Klasterdamiseks on kasutatud Jaccardi sarnasust koos spektraalklasterdusega, mittenegatiivset maatriksi faktorisatsiooni ning Dirichlet’ peitlahutust. Klasterdamise tulemusena saadakse nimisõnade grupid ning analüüsitakse klastritesse kuuluvate sõnade seotust ning seda, millised omadused milliste sõnade jaoks on keelekasutuses olulised.

Description

Keywords

loomuliku keele töötlus, semantiline sarnasus, klasterdamine, Jaccardi sarnasus, teemade modelleerimine, Dirichlet’ peitlahutus, mittenegatiivne maatriksi faktorisatsioon

Citation