Nimisõnade klasterdamine vastavalt neid kirjeldavatele omadussõnadele

dc.contributor.advisorLaur, Sven, juhendaja
dc.contributor.authorSõrmus, Birgit
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2023-09-14T06:32:16Z
dc.date.available2023-09-14T06:32:16Z
dc.date.issued2021
dc.description.abstractOmadussõnade kasutus annab lisainformatsiooni nendega seotud nimisõnade kohta. See võimaldab kokku grupeerida sarnaste omadustega nimisõnu. Antud töö eesmärgiks on kasutada kolme erinevat meetodit, et klasterdada nimisõnu vastavalt nendele omadussõnadele, millega neid tekstides kirjeldatakse. Klasterdamiseks on kasutatud Jaccardi sarnasust koos spektraalklasterdusega, mittenegatiivset maatriksi faktorisatsiooni ning Dirichlet’ peitlahutust. Klasterdamise tulemusena saadakse nimisõnade grupid ning analüüsitakse klastritesse kuuluvate sõnade seotust ning seda, millised omadused milliste sõnade jaoks on keelekasutuses olulised.et
dc.identifier.urihttps://hdl.handle.net/10062/92162
dc.language.isoestet
dc.publisherTartu Ülikoolet
dc.rightsopenAccesset
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectloomuliku keele töötluset
dc.subjectsemantiline sarnasuset
dc.subjectklasterdamineet
dc.subjectJaccardi sarnasuset
dc.subjectteemade modelleerimineet
dc.subjectDirichlet’ peitlahutuset
dc.subjectmittenegatiivne maatriksi faktorisatsioonet
dc.subject.otherbakalaureusetöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticset
dc.subject.otherinfotechnologyet
dc.titleNimisõnade klasterdamine vastavalt neid kirjeldavatele omadussõnadeleet
dc.typeThesiset

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Sormus_Informaatika_2021.pdf
Size:
1.07 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: