Arvamuskaeve ja meelsusanalüüs kasutades Bayesi meetodit ja tehisnärvivõrke

Date

2017

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Infotehnoloogiad on muutunud suureks osaks meie elust ja praeguseks on raske kujutada ette elu ilma vidinate ja internetita. Sotsiaalmeedia ei ole tänapäeval ainult informatsiooniallikas, vaid lubab kasutajatel ka omavahel suhelda ning jagada üksteisega arvamusi ja kogemusi. Teatud osa sellest infost on subjektiivne ning sisaldab kasutaja seisukohtadega seostuvat informatsiooni. Säärast informatsiooni analüüsides saab sellest eraldada kõige olulisema ning hiljem kasutada saadud informatsiooni analüüsimiseks ja otsuste tegemistes. Esmalt, et informatsiooni sellisel kujul kasutada, on vaja seda mõista ja kategoriseerida. Käesolevas töös õpitakse seisukohtade analüüsimise tehnikaid, et siis säutsudest arvamusi eraldada. Efektiivseks klassifitseerimiseks on oluline rakendada ülesande lahendamiseks algoritme, mis saavad sellega edukalt hakkama. Magistritöö põhieesmärgiks on uurida algoritme, mida saaks kasutada seisukohtade hindamiseks. Teostatakse andmete eeltöötlust ja viiakse läbi mitmeid eksperimente. Klassifitseerijat treenitakse ja testitakse kahe erineva andmekogu peal kasutades kahte erinevat klassifitseerija implementatsiooni, milleks on naiivne Bayes ja konvolutsiooniline närvivõrk. Lisaks arutatakse klassifitseerija efektiivsuse üle ja mis mõju avaldavad sellele andmed, mille peal seda treenitakse.
Information technologies have firmly entered our life and it is impossible to imagine our life without gadgets or the Internet. Today, social media is not only a source that broadcasts information to the users, but it allows users to intercommunicate and share their views and experience with each other. Some portion of such data is subjective and contains opinionated information that can be further analyzed to retrieve essential data from it and later use for various purposes for analysis and decision support. In order to use this type of that the first step is to understand it and categorize opinions in the information. Hence, in this dissertation, sentiment analysis techniques are studied in order to retrieve opinions from the tweets. In order to ensure efficient classification, it is important to apply algorithms that perform well on this task. Therefore, the main goal of the thesis is to investigate algorithms that can be applied for the opinion estimation. To that extend, data preprocessing and several experiments are conducted, namely, the classifier is trained and tested on two different datasets with two different classifiers (Naive Bayes and convolutional neural network). In addition, the influence of the training data on the classifier efficiency is discussed.

Description

Keywords

Citation