Cross-Lingual Misinformation Detection: Aligning English and Estonian Fake Health News
| dc.contributor.advisor | Kangur, Uku, juhendaja | |
| dc.contributor.advisor | Chakraborty, Roshni, juhendaja | |
| dc.contributor.author | Merila, Li | |
| dc.contributor.other | Tartu Ülikool. Loodus- ja täppisteaduste valdkond | et |
| dc.contributor.other | Tartu Ülikool. Arvutiteaduse instituut | et |
| dc.date.accessioned | 2024-10-02T08:26:29Z | |
| dc.date.available | 2024-10-02T08:26:29Z | |
| dc.date.issued | 2024 | |
| dc.description.abstract | Tervisealane väärinfo kujutab endast märkimisväärset ohtu, kuna see õõnestab usaldust teaduse vastu ja vähendab allumist riiklikele tervisemeetmetele, vähendades seeläbi ühiskonna vastupanuvõimet ennetatavatele haigustele. Käesolev magistritöö keskendub eesti keeles esinevate vale terviseuudiste tuvastamisele, kasutades selleks inglisekeelseid valeuudiste andmestikke. Põhieesmärk on välja töötada usaldusväärne süsteem eesti keeles terviseuudiste tõeväärtuse määramiseks, panustades seeläbi väheuuritud teadusvaldkonda. Loodud meetod, Cross-Lingual Alignment and Confident Prediction Sampling (CAPS), kasutab kahefaasilist hübriidmeetodit, mis hõlmab semantilise sarnasuse mõõtmist artiklite vahel, käsitsi märgendamist, klassifitseerimist masinõppe meetoditega ning usaldusväärsete ennustuste kogumist. Need tehnikad aitasid luua tavatu eestikeelse määratud tõeväärtusega terviseuudiste andmestiku. | |
| dc.identifier.uri | https://hdl.handle.net/10062/105005 | |
| dc.language.iso | en | |
| dc.publisher | Tartu Ülikool | et |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Estonia | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/ee/ | |
| dc.subject | Estonian Misinformation | |
| dc.subject | Fake Health News | |
| dc.subject | Confidence Sampling | |
| dc.subject | Cross-Lingual Similarity Detection | |
| dc.subject | Estonian Fake News Dataset | |
| dc.subject | Eesti väärinfo | |
| dc.subject | tervise valeuudis | |
| dc.subject | usaldusväärne ennustamine | |
| dc.subject | keeltevaheline sarnasuse joondamine | |
| dc.subject | Eesti valeuudiste andmestik | |
| dc.subject.other | magistritööd | et |
| dc.subject.other | informaatika | et |
| dc.subject.other | infotehnoloogia | et |
| dc.subject.other | informatics | en |
| dc.subject.other | infotechnology | en |
| dc.title | Cross-Lingual Misinformation Detection: Aligning English and Estonian Fake Health News | |
| dc.type | Thesis | en |
Failid
Originaal pakett
1 - 1 1
Laen...
- Nimi:
- Merila_andmeteadus_2024.pdf
- Suurus:
- 3.63 MB
- Formaat:
- Adobe Portable Document Format