Arvutuslikud mudelid eestikeelsete mõistetevaheliste sarnasuse leidmiseks

dc.contributor.advisorEduard Barbu
dc.contributor.authorKittask, Claudia
dc.date.accessioned2019-10-15T09:35:37Z
dc.date.available2019-10-15T09:35:37Z
dc.date.issued2019
dc.description.abstractKäesoleva bakalaureusetöö eesmärk on testida ja võrrelda erinevaid arvutuslikke mudeleid nende oskuse põhjal hinnata mõistete ja sõnade vahelist sarnasust. Mudelite hinnaguid võrreldakse inimeste hinnangutega. Selleks, et mudelite võimekust hinnata, luuakse uus eestikeelne andmekogu, mis sisaldab sõnapaare ja inimeste poolt annoteeritud sarnasuse hinnanguid. Töös hinnatakse kolme eri kategooriasse kuuluvaid arvutuslikke mudeleid: distributiivseid mudeleid, semantilisi võrke ja tehisnägemise mudeleid. Saadud tulemusi saab kasutada tulevaste mudelite hindamiseks.
dc.description.abstractThe purpose of this thesis is to test and compare different computational models of similarity for the Estonian language. Models' predictions for words and concepts similarity is usually compared against human predictions. To make such comparisons between models' similarity estimates and human scores, a proper human annotated data set had to be created for the Estonian language. The SimLex-999 data set was chosen for translation into Estonian. This resource is used to test three families of computational models of similarity: distributional models, semantic networks and computer vision models. The results of this thesis can be used to evaluate future similarity models.
dc.identifier.urihttp://hdl.handle.net/10062/66265
dc.language.isoen
dc.titleArvutuslikud mudelid eestikeelsete mõistetevaheliste sarnasuse leidmiseks
dc.title.alternativeComputational Models of Concept Similarity for the Estonian Language
dc.typeThesis

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
thesis.pdf
Size:
1.62 MB
Format:
Adobe Portable Document Format