Andmebaasi logo
Valdkonnad ja kollektsioonid
Kogu ADA
Eesti
English
Deutsch
  1. Esileht
  2. Sirvi autori järgi

Sirvi Autor "Milintsevich, Kirill" järgi

Tulemuste filtreerimiseks trükkige paar esimest tähte
Nüüd näidatakse 1 - 2 2
  • Tulemused lehekülje kohta
  • Sorteerimisvalikud
  • Laen...
    Pisipilt
    listelement.badge.dso-type Kirje ,
    Estimation of depression level from text: symptom-based approach, external knowledge, dataset validity
    (Tartu Ülikooli Kirjastus, 2024-11-26) Milintsevich, Kirill; Sirts, Kairit, juhendaja; Dias, Gaël, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Caen Normandia ülikool
    Depressioon on üks levinumaid vaimse tervise häireid kogu maailmas, mis võib põhjustada funktsioneerimise langust ja suurendada suitsiidiriski. Hiljutine COVID-19 pandeemia on tõstnud depressiooni sagedust kogu maailmas. Lisaks takistavad stigma ja piiratud juurdepääs ravile paljudel inimestel õige diagnoosi saamist ja ravi. Varasemad uuringud on leidnud, et depressioonis inimeste sõnavara erineb ilma depressioonita inimeste omast. Näiteks kalduvad depressioonis inimesed kasutama rohkem negatiivseid või emotsionaalseid sõnu. Viimasel ajal on välja töötatud tehisnärvivõrgumudeleid, mis suudavad teksti alusel depressiooni esinemist tuvastada. Siiski on enamik teadlasi käsitlenud depressiooni tuvastamist lihtsa klassifitseerimisülesandena, kus on ainult kaks võimalikku väljundit: kas on depressioon või mitte. Samas võivad kahel depressioonis inimesel ilmneda erinevad sümptomid. Näiteks ühel inimesel võib esineda unetus ja keskendumisraskused, samas kui teine võib kannatada isumuutuste ja madala enesehinnangu all. Need inimesed vajaksid erinevat ravi, mistõttu on info sümptomite kohta hädavajalik. Käesolevas töös arendati välja tehisnärvivõrgumudel, mis ennustab depressiooni sümptomeid teksti alusel. Tulemused näitasid, et sümptomite alusel depressiooni ennustamine andis paremaid tulemusi kui lihtne ainult diagnostilist staatust ennustav klassifitseerija, andes samal ajal ka üksikasjalikumat infot. Ennustustulemusi parandas veelgi meelsus- ja emotsioonileksikonidest pärit välise info mudelisse lisamine. Selleks kasutati lihtsat, kuid tõhusat lähenemist, mis märgib ära leksikonides esinevad sõnad tekstis. Lisaks, töötades sotsiaalmeedia päritolu andmestikuga selgusid probleemid sümptomite märgenduste kvaliteediga. Seetõttu märgendati osa sellest andmestikust uuesti vaimse tervise spetsialisti abiga, näidates sümptomite kliiniliste definitsioonide järgmise ja selgete märgendamisjuhiste rakendamise olulisust.
  • Laen...
    Pisipilt
    listelement.badge.dso-type Kirje ,
    Lexicon-Enhanced Neural Lemmatization for Estonian
    (Tartu Ülikool, 2020) Milintsevich, Kirill; Sirts, Kairit, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituut
    The problem of lemmatization, i.e. recovering the normal, or dictionary form of a word from the text, is one of the crucial parts of the natural language processing applications. It is important for the text preprocessing which is the step of cleaning and preparing the data for the use in NLP models and algorithms. This step can greatly improve the performance of a model if done correctly or, on the other hand, drastically reduce the quality of the output if neglected. Nowadays, neural networks dominate in the field of NLP as well as in the problem of lemmatization. Most of the recent papers boast to achieve 95-96% accuracy but there is still plenty of room for improvement. As with most of the neural network architectures, the lack of training data can be a huge drawback during the process of model creation. There exist many smaller languages that cannot afford to have large annotated datasets. The Estonian language, being somewhat in the middle in terms of its data size, can benefit from additional data. In this thesis, we propose a novel approach for lemmatization. In addition to the regular input, the lemmatization model takes the predictions either from another, weaker rule-based lemmatizer or uses the lexicon build from the training data to enhance the lemma prediction. With the combination of several attention layers, the model manages to choose the best from two inputs and produce more accurate lemmas.

DSpace tarkvara autoriõigus © 2002-2025 LYRASIS

  • Teavituste seaded
  • Saada tagasisidet