Sirvi Autor "Fišel, Mark" järgi

Nüüd näidatakse 1 - 5 5

listelement.badge.access-status Avatud juurdepääs ,
Extremely low-resource machine translation for closely related languages
(Reykjavik, Iceland (Online), Linköping University Electronic Press, Sweden, pp. 41--52, 2021) Tars, Maali; Tättar, Andre; Fišel, Mark; Dobnik, Simon; Øvrelid, Lilja
listelement.badge.access-status Avatud juurdepääs ,
Keelemudelipõhised parandused statistilises masintõlkes
(Tartu Ülikool, 2010) Kirik, Harri; Fišel, Mark; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituut
Käesolevas töös uuritakse ühte masintõlke valdkonna võimalust, kus lisades tõlkimisel sihtkeele korpusesse lisainformatsiooni sõnaliikide näol, püütakse seda lisainformatsiooni ära kasutada loomaks paremaid keelemudelite konfiguratsioone ja tõstmaks masintõlke väljundi kvaliteeti. Põhiideeks on lisaks tavalisele sõnavormidel loodavale primaarsele keelemudelile lisada veel sekundaarne, sõnaliikidel loodud mudel.
listelement.badge.access-status Avatud juurdepääs ,
Optimizing Statistical Machine Translation via Input Modification
(2011-02-02) Fišel, Mark
Väitekiri kuulub statistilise masintõlke valdkonda ja käsitleb selle ühte komponenti - tõlkemudelite masinõpet. Esmalt uuritakse osaliselt kattuvaid joondatud paralleelkorpusi. Esitatakse meetod, mis võimaldab analüüsida korpuste kattuvaid osi, leida valesid lausete joondusi ning produtseerida olemasolevatest korpustest suuremaid ja kvaliteetsemaid. Seejärel analüüsitakse, kuidas flekteerivates keeltes (s.h. eesti keeles) segmenteerida sõnu enne tõlkemudeli treenimist väiksemateks osadeks, selleks et pehmendada andmete hõreduse mõju. Esitatakse meetod, mis rakendab juhendamata segmenteerimisel lingvistikapõhise segmenteerimise printsiipe, eesmärgiga saavutada tõlkekvaliteedi samasugust paranemist nagu keelest sõltuvate lingvistiliste vahendite kasutamisega. Lõpuks analüüsitakse sõnade joondamise meetodeid, eesmärgiga asendada neid lihtsamatega, ilma tõlkekvaliteedi kahanemiseta. Kõik pakutud meetodid on saanud eksperimentaalse hinnangu, kasutades erinevaid keelekorpusi ja erinevaid keeltepaare, k.a. eesti-inglise.
listelement.badge.access-status Avatud juurdepääs ,
Praktiline andmeteadus. Kõrgkooliõpik
(Tartu Ülikooli arvutiteaduse instituut, 2024) Sügis, Elena; Tampuu, Ardi; Aljanaki, Anna; Fišel, Mark; Kull, Meelis; Saul, Eva, toimetaja; Liiv, Innar, retsensent; Aan, Janika, retsensent; Vilo, Jaak, retsensent; Laur, Sven, retsensent
listelement.badge.access-status Avatud juurdepääs ,
Tõlkekvaliteedi hindamine
(Tartu Ülikool, 2011) Toompalu, Karol; Fišel, Mark; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituut
Enamus kvaliteedi meetrikaid annab ainult mingi numbrilise väärtuse ette määratud vahemikust, andes masintõlkesüsteemide arendajate ainult üldise hinnangu süsteemi kvaliteedi suhtes, täpsustamata milliseid vigu analüüsi jooksul kohati. Käesoleva töö käigus prooviti lahendada seda mureküsimust - millist tüüpi vigu teeb süsteem tõlkimisel. Probleemi lahendamisel püüti säilitada keelest sõltumatust, mis omakorda seadis piiranguid programmi võimekusele teatud veatüüpe tuvastada. Näiteks ei saa keelespetsiifilisi andmeid omamata seada vastavusse inimtõlke ja masintõlke sõnu, mis ei ole sarnased. Töö lahenduse käigus prooviti läbi erinevaid lähenemisviise. Lõpuks jäi peale täielik keelest sõltumatuse nõue ehk loobuti morfoloogilise info kasutamisest ning arvutati keelest sõltumatult hinnangud erinevate vigade esinemise sagedustest. Programm suutis talle pandud eesmärke täita ning annab üpris adekvaatset statistikat süsteemi vigade kohta. Masintõlge on väga oluline paljudele inimestele, selle abil saab kasutaja ligikaudese tõlke abil teksti sisust, mille jaoks oleks vaja muidu lingvisti. Kuna masintõlge on oluline, on ka selle arendamine oluline. Selleks on vaja süsteemi väljundit hinnata mingite kriteeriumite alusel. Alati on seda võimalik käsitsi teha, kuid see on aega ja ressurssi nõudev. Selleks on välja arendatud palju automaatsed hindamise meetrikad. Levinum neist on BLEU, mis hindab süsteemi tõlke ja näidistõlke korreleerumist. Veaanalüüs on siiski veel üsna uurimata ala ning loodetavasi sai töö autor anda oma panuse selle hüvanguks