Sirvi Autor "Orasmaa, Siim, juhendaja" järgi
Nüüd näidatakse 1 - 12 12
- Tulemused lehekülje kohta
- Sorteerimisvalikud
listelement.badge.dso-type Kirje , Abistav veebileht Mnemo tekstide päheõppimiseks(Tartu Ülikool, 2023) Novoseltsev, Roland; Orasmaa, Siim, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutInimestel tuleb ette vajadus informatsiooni pähe õppida erinevates olukordades, rääkimata nendest, kelle amet nõuab seda. Uuringud näitavad, et päheõppimiseks on hea lugeda teksti valjult ette. Kuigi leiduvad rakendused, mis abistavad ja hindavad kasutajat teksti õppimisel, ei ole neil eestikeelset tuge. Antud bakalaureusetöö eesmärgiks oli luua abistav veebileht Mnemo eestikeelsete tekstide päheõppimiseks. Töös selgitati välja selleks sobivaim mnemooniline meetod ja analüüsiti sarnaseid rakendusi. Veebilehte testiti harrastusnäitlejate poolt ja selle tagasiside põhjal kirjeldati võimalikke edasiarendusi. Veebileht on leitav aadressilt https://rolandnovoseltsev.pythonanywhere.com vähemalt 2023. aasta juunini.listelement.badge.dso-type Kirje , Ajaseoste automaatne tuvastamine tekstis(Tartu Ülikool, 2021) Saarnik, Taaniel; Orasmaa, Siim, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutSelles lõputöös kirjeldatakse ajalehetekstidest sündmusi ja sündmustevahelisi ajaseoseid tuvastavate mudelite loomist. Ajalehetekstides esineb palju erinevaid sündmusi ja ajaväljendeid. Selleks, et arvuti suudaks neid erinevates keeletöötlus rakendustes kasutada, tuleb need tekstis mingil viisil märgendada. Manuaalselt suurte tekstide märgendamine on aga väga tülikas ja aeganõudev protsess ja seepärast oleks suur abi süsteemist, mis oskaks seda automaatselt teha. Käesoleva lõputöö käigus uuritakse selle probleemi varasemaid lahendusi ning luuakse ka mudeleid, mis automatiseerivad selle protsessi.listelement.badge.dso-type Kirje , Ajaväljendite korpusemärgenduse laiendamine sündmuste ja entiteetide ajalisteks omadusteks TimeML raamistikus(Tartu Ülikool, 2022) Liivas, Annely-Maria; Orasmaa, Siim, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutlistelement.badge.dso-type Kirje , Automaatne sisukokkuvõtete tegemine ajaseoste märgenduste põhjal(Tartu Ülikool, 2021) Rahulan, Risto; Orasmaa, Siim, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutSisukokkuvõtted on eriti olulised tänapäeval, kus informatsiooni on väga palju. See aitab inimestel kõige tähtsama osa tekstist kiiresti kätte saada. Hea lahendus oleks luua tekstidest automaatselt sisukokkuvõtted. Selles töös kasutatakse Eesti TimeML korpuse märgendatud artikleid, et sündmuste ajaseoste märgendite põhjal luua ajagraafid ja kasutada neid automaatselt artiklite kokkuvõtete tegemisel. Töö käigus hinnatakse kokkuvõtete kvaliteeti kasutades ROUGE-L meetodit.listelement.badge.dso-type Kirje , Eesti alamredditi korpuse loomine ning analüüs(Tartu Ülikool, 2024) Tamm, Tauno; Orasmaa, Siim, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutReddit is the world's largest forum, visited by about 1.2 billion users monthly. The largest Estonian subreddit is r/Eesti. This master's thesis involved creating a language corpus based on the data from r/Eesti and analyzing the data therein. The analysis addressed questions on how and when posts are made and what they discuss. For answering these research questions, various transformer-type models were fine-tuned for sentiment analysis, the Python language detection library Lingua was used for language detection, and BERTopic was employed for topic analysis. The results revealed that the r/Eesti subreddit can be considered bilingual, as a significant portion of posts and comments are also in English. The sentiment analysis exhibited that users posting and commenting in Estonian are mostly negative, while those who write in English tend to be neutral, with a slight lean towards positivity. In both languages, “Education” is the most common topic.listelement.badge.dso-type Kirje , EstNLTK morfoloogilise analüsaatori ja ühestaja kvaliteedi hindamine(Tartu Ülikool, 2022-06) Saul, Kertu; Orasmaa, Siim, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutlistelement.badge.dso-type Kirje , Loomuliku keele töötlusel põhineva dialoogsüsteemi rakendamine videomängus(Tartu Ülikool, 2024) Mihhailov, Mihhail; Orasmaa, Siim, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutThis thesis gives a summary of the typical structure of a dialogue system and its use in video games, mainly focusing on systems that use the principles of natural language processing. In addition to that, tools for processing the Estonian language are explored and their suitability for use in video games evaluated. They are then used to create a game prototype. Finally, a survey is conducted to assess the technical and creative aspects of the game.listelement.badge.dso-type Kirje , Morfoloogilise muuttüübi automaatne tuvastamine(Tartu Ülikool, 2024) Saska, Sander; Orasmaa, Siim, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutEstonian language is constantly evolving, as new words are created in different ways. Language users often know intuitively how to inflect new words, but in linguistics this intuition is formalized in the form of inflection types. This work researches how to automate the identification of inflection types. To this end, two LSTM-based models have been created to detect and predict inflection types. The initial data for the models are taken from Vabamorf’s morphology lexicon, which consists of almost 74 000 lemmas. All possible word forms are synthesized for the lemmas and the result is transformed into a suitable form for the LSTM-based models. One model is trained on only words, with an accuracy of 95.8%, and the other model is trained on words and parts of speech, with an accuracy of 97.8%.listelement.badge.dso-type Kirje , Nimeolemite tuvastamine 19. sajandi vallakohtu protokollides(Tartu Ülikool, 2021) Poska, Kristjan; Orasmaa, Siim, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutlistelement.badge.dso-type Kirje , Nimeüksuste tuvastaja loomine puudepanga korpuse põhjal(Tartu Ülikool, 2025) Kivisikk, Martin; Orasmaa, Siim, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutIn natural language processing, named entity recognition aims to tag information units in text, such as names of people, organizations and locations. Named entity tags have recently been added to the Estonian UD treebanks, but no named entity recognition models using the datasets have been made. In this thesis, models based on BERT were fine-tuned on both individual and combined training sets. The best model turned out to be Est-RoBERTa fine-tuned on the combined training set, which achieved an F-score of 0.828 on the test set. The study revealed that models perform worse on external datasets, as named entities are not necessarily defined and annotated consistently across different corpora.listelement.badge.dso-type Kirje , Nimeüksuste tuvastamine ajaloolistes Tartu Linnavolikogu protokollides(Tartu Ülikool, 2025) Tolmats, Norman; Orasmaa, Siim, juhendaja; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. Arvutiteaduse instituutThis thesis explores the use of machine learning for named entity recognition (NER) in the meeting protocols of the Tartu City Council from 1918 to 1940, which are in Estonian. Most existing named entity recognition models for Estonian have been developed using modern language data and perform poorly when applied to historical texts. To effectively annotate valuable historical documents, it is necessary either to train specialized models or to adapt existing ones — particularly when only a small amount of labeled data is available. This study analyzes current NER models and evaluates their suitability for older language. Given the limited availability of high-quality labeled data, the best-performing model is adapted using machine learning techniques to be more suitable for these historical meeting protocols. The results demonstrate that, by using a small amount of labeled data and a large corpus of unlabeled historical documents, it is possible to improve model performance through weakly supervised learning — achieving better results on older language than models trained on modern language data.listelement.badge.dso-type Kirje , Twitteri korpus ajas muutuva keelekasutuse uurimiseks(Tartu Ülikool, 2022-06) Vainikko, Martin; Kaalep, Heiki-Jaan, juhendaja; Orasmaa, Siim, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituut