Kohanemisvõimelise dialoogsüsteemi prototüüp
Failid
Kuupäev
2012
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
Lõputöö käsitleb dialoogsüsteeme. Dialoogsüsteem on arvutiprogramm, mis saab sisendiks kasutaja lause (antud juhul) eesti keeles ning vastab kasutajale samuti eesti keeles. Selle tulemusel moodustub sidus vestlus, mille käigus antakse inimesele üldjuhul infot teatud kitsa ainevaldkonna kohta.
Lõputöös on võetud aluseks ühe olemasoleva dialoogsüsteemi raamistik, mille autor on Margus Treumuth. Seeläbi tekkis võimalus keskenduda seniste tulemuste edasiarendustele ja kasutada praeguseks juba põhjalikult läbitöötatud komponente (sh morfoloogiline analüüs, õigekirjakontroll, sõnajärjekorra lahendamine, korduste vältimine, inim-abi liides), mille realisatsioon oleks suures osas juba olemasoleva kordus.
Muudeti olemasoleva raamistiku pealiskihti, et ta oleks paremini ühilduv lisamoodulitega. Senine raamistik on veebipõhine, mis kasutab vastuse leidmiseks serveripoolset andmebaasikihti. Pealiskihi all ongi mõeldud veebikihti ning veebikihi täienduste tulemusel muutus aluskihi (ehk peamiste keeletöötlusmoodulite) kasutamine arendajaile lihtsamini kättesaadavaks.
Olemasolevale raamistikule loodi moodulite süsteem, mis võimaldab lihtsalt ning kiirelt lisada ja eemaldada veebiliidese mooduleid. Lisaks loodi mõned moodulid, mida saab antud süsteemiga kasutada. Realiseeriti moodul, mis kohaneb kasutaja vastamise kiirusega ja muudab vastavalt sellele agendi vastamise kiirust. Peale selle loodi komponent, mis jälgib kasutaja algustähe kasutamist ning paneb agendi sarnast stiili kasutama. Viimasena koostati moodul, mis mängib agendi teksti lisamisel heli signaali ning selle mooduli valmistamise protsess on lisatud moodulite valmistamise õppematerjalina töö lõppu lisana.
Lisaks moodulitele, täiendati ka dialoogsüsteemi sõnastikku slängisõnastikuga. Släng tuvastatakse kasutaja sisendis, võrreldes seda slängisõnastikuga. Esmalt on täienduseks asjaolu, et kasutaja sisendis leiduv võimalik slängisõna teisendatakse teadmusbaasi jaoks arusaadavasse vormi ja arvuti suudab anda vastuse. Peamiseks probleemiks on slängi tuvastamine sisendis, sest slängisõnastik ei pruugi sisalda kõiki vorme.
Veel said 15 inimest dialoogsüsteemi kasutada ja vastata küsimustikule ning tulemuseks oli see, et üldiselt kasutajatele meeldisid moodulid, kuid nad andsid väärtuslikku tagasisidet, mille põhjal saab ideid moodulite edasiarendamiseks. Küsitlusest ja vestluslogidest tuli välja, et 60% kasutajatest kasutab järjepidevalt lause alguses väikest algustähte.