Cross-Lingual Misinformation Detection: Aligning English and Estonian Fake Health News

dc.contributor.advisorKangur, Uku, juhendaja
dc.contributor.advisorChakraborty, Roshni, juhendaja
dc.contributor.authorMerila, Li
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2024-10-02T08:26:29Z
dc.date.available2024-10-02T08:26:29Z
dc.date.issued2024
dc.description.abstractTervisealane väärinfo kujutab endast märkimisväärset ohtu, kuna see õõnestab usaldust teaduse vastu ja vähendab allumist riiklikele tervisemeetmetele, vähendades seeläbi ühiskonna vastupanuvõimet ennetatavatele haigustele. Käesolev magistritöö keskendub eesti keeles esinevate vale terviseuudiste tuvastamisele, kasutades selleks inglisekeelseid valeuudiste andmestikke. Põhieesmärk on välja töötada usaldusväärne süsteem eesti keeles terviseuudiste tõeväärtuse määramiseks, panustades seeläbi väheuuritud teadusvaldkonda. Loodud meetod, Cross-Lingual Alignment and Confident Prediction Sampling (CAPS), kasutab kahefaasilist hübriidmeetodit, mis hõlmab semantilise sarnasuse mõõtmist artiklite vahel, käsitsi märgendamist, klassifitseerimist masinõppe meetoditega ning usaldusväärsete ennustuste kogumist. Need tehnikad aitasid luua tavatu eestikeelse määratud tõeväärtusega terviseuudiste andmestiku.
dc.identifier.urihttps://hdl.handle.net/10062/105005
dc.language.isoen
dc.publisherTartu Ülikoolet
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Estoniaen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/ee/
dc.subjectEstonian Misinformation
dc.subjectFake Health News
dc.subjectConfidence Sampling
dc.subjectCross-Lingual Similarity Detection
dc.subjectEstonian Fake News Dataset
dc.subjectEesti väärinfo
dc.subjecttervise valeuudis
dc.subjectusaldusväärne ennustamine
dc.subjectkeeltevaheline sarnasuse joondamine
dc.subjectEesti valeuudiste andmestik
dc.subject.othermagistritöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticsen
dc.subject.otherinfotechnologyen
dc.titleCross-Lingual Misinformation Detection: Aligning English and Estonian Fake Health News
dc.typeThesisen

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
Merila_andmeteadus_2024.pdf
Suurus:
3.63 MB
Formaat:
Adobe Portable Document Format