Sirvi Autor "Muischnek, Kadri, juhendaja" järgi
Nüüd näidatakse 1 - 17 17
- Tulemused lehekülje kohta
- Sorteerimisvalikud
Kirje Beyond genres: a dimensional text model for text classification(2024-11-28) Vaik, Kristiina; Muischnek, Kadri, juhendaja; Sirts, Kairit, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkondInterneti võidukäik on suurendanud elektrooniliste tekstide hulka, mis on olnud murranguline mitmete teadusvaldkondade jaoks. Suured veebitekstide korpused on justkui ajakapslid, mis on jäädvustanud meie pidevalt muutuvad keelt. Veebikorpused pakuvad rikkalikku keelematerjali, kuid meil pole selget ülevaadet nende sisust. Kas tegemist on juhusliku sõpradevahelise vestluse või ametliku dokumendiga või hoopis millegi muuga? Veebikorpuste liigitamine on justkui püüd kategoriseerida kõiki raamatuid hiiglaslikus raamatukogus, teadmata, milline on raamatute sisu. Osa keeleuurijaid kasutavad liigitusalusena laiasid kategooriad, nagu ajakirjandus või ilukirjandus; samas on ka neid, kes teevad kitsamat eristamist, näiteks jagavad ajakirjanduse kategooria eraldi arvamusteks ja spordiuudisteks. Aastate jooksul on loodud palju erinevaid liigitusi, kuid neil kõigil on üks ühine joon: annoteerijate vähene üksmeel. See tekitab küsimuse, kuidas me saame oodata häid tulemusi masinatelt, kui isegi inimesed ei suuda kokku leppida, mis liiki kirjutisega on tegu? Selleks, et veebikorpuseid maksimaalselt ära kasutada, vajame etemat liigitusalust. Minu doktoritöö eesmärk on esitada alternatiivne viis veebitekstide kategoriseerimiseks. Selmet suruda tekste kindlatesse kategooriatesse (nagu aja- või ilukirjandus), vaatlen hoopis tekstides peituvaid omadusi, mida nimetan dimensioonideks. Näiteks vaatlen, kas tekst on ametlik või spontaanne, faktiline või arvamuslik, keeruline või lihtne, või kas see räägib abstraktsetest või konkreetsetest nähtustest? Eesmärk on uurida, kas minu pakutud dimensioonid ja raamistik on inimeste jaoks äratuntavad. Kui jah, siis tuvastada, kas ja kuidas pakutud dimensioonid üksteisest erinevad. Leidsin, et annoteerijad saavutasid väljapakutud dimensioonide seas enamjaolt üksmeele, mis viitab dimensioonide selgetele kommunikatiivsetele funktsioonidele, ja et igal dimensioonil on ainulaadne koosesinevate keeleliste tunnuste muster. Tulemused joonduvad suuremas jaos ka juba varasemate uurimustega, kus peamise eristusena saab välja tuua vastanduse kirjaliku kõnekeele (spontaanne, isiklik, subjektiivne) ja standardsema kirjakeele (rohkem planeeritud, formaalne, informatiivne) vahel. Ülejäänud dimensionid langevad kuhugi vahepeale või sisaldavad vaid neile ainulaadseid eripärasid. Mõistmine, kuidas need dimensioonid ja nende keelelised mustrid omavahel on seotud, loob tugevad eeldused tulevastele uurimustöödele, mille eesmärk on aidata kaasa veebikorpustes peituvate struktuuride uurimisele ja liigitamisele.Kirje Detecting compositionality of Estonian particle verbs with statistical and linguistic methods(2019-08-30) Aedmaa, Eleri; Muischnek, Kadri, juhendaja; Uiboaed, Kristel, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkondTänapäeval on inimkeeli (kaasa arvatud eesti keelt) töötlevad tehnoloogiaseadmed igapäevaelu osa, kuid arvutite „keeleoskus“ pole kaugeltki täiuslik. Keele automaattöötluse kõige rohkem kasutust leidev rakendus on ilmselt masintõlge. Ikka ja jälle jagatakse sotsiaalmeedias, kuidas tuntud süsteemid (näiteks Google Translate) midagi valesti tõlgivad. Enamasti tekitavad absurdse olukorra mitmest sõnast koosnevad fraasid või laused. Näiteks ei suuda tõlkesüsteemid tabada lauses „Ta läks lepinguga alt“ ühendi alt minema tähendust petta saama, sest õige tähenduse edastamiseks ei saa selle ühendi komponente sõna-sõnalt tõlkida ja seetõttu satubki arvuti hätta. Selleks et nii masintõlkesüsteemide kui ka teiste kasulike rakenduste nagu libauudiste tuvastuse või küsimus-vastus süsteemide kvaliteet paraneks, on oluline, et arvuti oskaks tuvastada mitmesõnalisi üksuseid ja nende eri tähendusi, mida inimesed konteksti põhjal üpriski lihtalt teha suudavad. Püsiühendite (tähenduse) automaattuvastus on oluline kõikides keeltes ja on seetõttu pälvinud arvutilingvistikas rohkelt tähelepanu. Seega on eriti inglise keele põhjal välja pakutud terve hulk meetodeid, mida pole siiamaani eesti keele püsiühendite tuvastamiseks rakendatud. Doktoritöös kasutataksegi masinõppe meetodeid, mis on teiste keelte püsiühendite tuvastamisel edukad olnud, üht liiki eesti keele püsiühendi – ühendverbi – automaatseks tuvastamiseks. Töös demonstreeritakse suurte tekstiandmete põhjal, et seni eesti keele traditsioonilises käsitluses esitatud eesti keele ühendverbide jaotus ainukordseteks (ühendi komponentide koosesinemisel tekib uus tähendus) ja korrapärasteks (ühendi tähendus on tema komponentide summa) ei ole piisavalt põhjalik. Nimelt kinnitab töö arvutilingvistilistes uurimustes laialt levinud arusaama, et püsiühendid (k.a ühendverbid) jaotuvad skaalale, mille ühes otsas on ühendid, mille tähendus on selgelt komponentide tähenduste summa. ja teises need ühendid, mis saavad uue tähenduse. Uurimus näitab, et lisaks kontekstile aitavad arvutil tuvastada ühendverbi õiget tähendust mitmed teised tunnuseid, näiteks subjekti ja objekti elusus ja käänded. Doktoritöö raames valminud andmestikud ja vektoresitused on vajalikud uued ressursid, mis on avalikud edaspidisteks uurimusteks.Kirje Eesti keele lausemallide automaatne tuvastamine liigutamisverbide näitel(Tartu Ülikool, 2024) Saul, Kertu; Muischnek, Kadri, juhendaja; Kallas, Jelena, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Eesti keele niitkorpuse allkorpuste automaatne morfoloogiline analüüs ja ühestamine(Tartu Ülikool, 2019) Grant, Laura; Muischnek, Kadri, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Elliptiliste lausete tuvastamine ja märgendamine eesti keele UD puudepangas(Tartu Ülikool, 2018) Torga, Liisi; Muischnek, Kadri, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Internetikeele süntaktiline analüüs kitsenduste grammatikaga(Tartu Ülikool, 2015) Särg, Dage; Muischnek, Kadri, juhendaja; Tartu Ülikool. Filosoofiateaduskond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Korpuse analüüsi programmide testimine eestikeelse korpuse põhjal(Tartu Ülikool, 2016) Kaljumäe, Helen; Muischnek, Kadri, juhendaja; Uiboaed, Kristel, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Leksikonide ja kaalude lisamine veebitekstide formaalsuse ja spontaansuse dimensioonide hindamise mudeli arendamiseks(Tartu Ülikool, 2023-07) Gailit, Karl Gustav; Muischnek, Kadri, juhendaja; Vaik, Kristiina, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Mitte-projektiivsed laused eesti keele sõltuvuspuude pangas(Tartu Ülikool, 2016) Torga, Liisi; Muischnek, Kadri, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Pronominaalsete viitesuhete analüüs asendussõnade suhtes käsitsi märgendatud korpuses(Tartu Ülikool, 2018) Freienthal, Linda; Muischnek, Kadri, juhendaja; Vaik, Kristiina, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Pronominaalsete viitesuhete automaatne lahendamine eesti keeles närvivõrkude abil(Tartu Ülikool, 2020-06) Freienthal, Linda; Muischnek, Kadri, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Sõnadevahelise seose tugevuse mõõtmise statistilised meetodid ühendverbide tuvastamisel(Tartu Ülikool, 2014) Aedmaa, Eleri; Muischnek, Kadri, juhendaja; Uiboaed, Kristel, juhendaja; Tartu Ülikool. Filosoofiateaduskond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Spontaansuse ja formaalsuse kui dimensionaalse tekstimudeli dimensioonide automaatne hindamine veebitekstides(Tartu Ülikool, 2021) Gailit, Karl Gustav; Muischnek, Kadri, juhendaja; Vaik, Kristiina, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Tasakaalus korpusel põhinevad sagedusloendid ja korpuse sõnavara ning „Eesti keele seletava sõnaraamatu“ märksõnaloendi võrdlus(Tartu Ülikool, 2013) Kirt, Riina; Muischnek, Kadri, juhendaja; Tartu Ülikool. Filosoofiateaduskond. Eesti ja üldkeeleteaduse Instituut.; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Uue meedia tekstide sagedussõnastik ja selle võrdlus kirjakeele sagedussõnastikuga(Tartu Ülikool, 2014) Link, Kristjan; Muischnek, Kadri, juhendaja; Tartu Ülikool. Filosoofiateaduskond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Verbi grammatiliste kategooriate esinemine eri tekstiliikides(Tartu Ülikool, 2021) Jaagu, Kärt-Kristiin; Muischnek, Kadri, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituutKirje Verbide ja afiksaaladverbide kombineerumine ühendverbide moodustamiseks(Tartu Ülikool, 2016) Visnap, Tanel; Muischnek, Kadri, juhendaja; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond; Tartu Ülikool. Eesti ja üldkeeleteaduse instituut