Konvolutsioonilisel neurovõrgul põhineva teksti klassifitseerimismudeli interpreteerimine kliinilisel andmestikul

Date

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Bakalaureusetöös interpreteeritakse konvolutsioonilist teksti klassifitseerimise neurovõrku: miks just niimoodi neurovõrk klassifikatsiooniotsuseid teeb. Analüüsi teostati kliinilisel DementiaBanki andmestikul, kus on Alzheimeri tõvega inimeste kirjeldused Bostoni küpsisevarguse fotost. Binaarse klassifikatsiooni ülesanne seisnes etteantud teksti põhjal klassi tuvastamises: kas isikul on Alzheimeri tõbi või mitte. Programmeeriti valmis Jacovi et al. artiklis (2018) kirjeldatud interpretatsioonimeetodid. Samuti interpreteeritakse konkreetseid tekste. Interpretatsioonimeetoditest andsid hea tulemuse informatiivsete ja ebainformatiivsete n-grammide leidmine, sõnede aktivatsioonivektorite leidmine ning nende klasterdamine. Vastandlike n-grammide analüüs andis halvema tulemuse andmestiku eripärade tõttu.
In this Bachelor’s Thesis, a convolutional text classification neural network is interpreted to find out why the neural network makes such predictions. To perform the analysis, the clinical DementiaBank dataset was used in which people with Alzheimer’s disease describe the Boston cookie theft image. The task of the binary classification was to identify based on the given text whether a person has Alzheimer’s or not. Interpretation methods described in Jacovi et al. (2018) were implemented. In addition to that, concrete examples of texts are interpreted in this thesis. Out of all the analyses performed, informative and uninformative ngrams and slot activation vectors with their clustering yield good results. Negative ngrams analysis results were substandard because of the specificity of the dataset.

Description

Keywords

Citation