Lausete arv: 48 - Sõnade arv: 754
Analüüsiks kulunud aeg: 22.876 sekundit
Uus analüüsOn oluline, et kõik välja toodud faktid ning väited oleksid põhjendatud kas näidete või allikaviidetega, kõik mõisted ja terminid selgitatakse esimesel kasutusel lahti, välditakse liigset sõnakasutust ja on pööratud tähelepanu teksti liigendusele ja struktuurile [5].
Poolt-tarind on võõrapärane vorm, mis jätab lauses tegija tagaplaanile.
Öeldistäiteks olev v- või tav- kesksõna võib mõjuda bürokraatlikult.
Üks levinumaid ekslikke arusaamasid on see, et teadustekst peab olema keeruline, ent tegelikkuses peaks see olema selgesti arusaadav ja sujuvalt loetav ilma, et see muutuks liiga primitiivseks [5].
Märgib omaduste või seisundite juhuslikkust, ajutist iseloomu.
Parem on
kasutada kindlamat kõneviisi.
Olgugi, et pole olemas ametlikku tekstiliikide jaotust, saab sellegipoolest tänapäeval jaotada keelekasutust argikeeleks, ilukirjanduslikuks keeleks ja tarbekeeleks, millest viimast on võimalik omakorda jaotada ajakirjanduslikuks keeleks, ametikeeleks ja teaduskeeleks [3].
Alternatiivid Eesti- ning ingliskeelsete tekstide puhul pole olemas programmi, mille põhieesmärgiks on lõputööde ehk akadeemilise teksti automaatne analüüs ja tagasisidestamine.
Eesmärgiks on ühendada ja parandada olemasolevaid keeletöötluse võimalusi selleks, et need oleksid kõikidele soovijatele kergesti kättesaadavad [9].
Selle autoriks on Armin Ronacher ning see sai populaarseks seetõttu, et inimesed soovisid alternatiivi keerukaks peetud Django-le [6].
Mine-vormi kasutus koos tühiverbiga.
Versioon 1.6 tekstianalüüs ja -töötlemine toimub kihilise süsteemi põhjal.
|
lõputöö 10x |
Igal aastal lõpetab Tartu Ülikooli üle 2000 tudengi, kellest igaüks peab lõpetamise tingimusena kirjutama lõputöö [1]. Lõputöö on demonstratsioon teadmistest ja oskustest, mida tudeng on oma õpingute vältel omandanud. Käesolevas töös loodi analüsaatorist programm, mis toetab tudengit ja juhendajat töö kirjutamisel ning aitab järgida head lõputööle omast keelekasutust, -stiili ja -nõudeid. Alternatiivid Eesti- ning ingliskeelsete tekstide puhul pole olemas programmi, mille põhieesmärgiks on lõputööde ehk akadeemilise teksti automaatne analüüs ja tagasisidestamine. Lõputöö analüsaatori jaoks loodi lahtise API-ga mikroteenus, millele esitab päringu CgLearni lõputöö veebiteenus. Antud lõputöös olid suurima tähtsusega osalausestamise, sõnestamise, morfoloogilise analüüsi ja lausestamise funktsionaalsused. Lõputöös otsustati kasutada EstNLTK versiooni 1.6. Näiteks on kihi „morph_analysis“ kaudu võimalik saada kätte sõna algvorm ja sõnaliik, mis oli lõputöös korduvalt kasutatud sõnade analüüsi puhul võtmetähtsusega. |
|||||||
|
funktsionaalsus 7x |
Keeleks valiti Python seetõttu, et selles on kättesaadav EstNLTK moodul, millega kaasnevad sisseehitatud keeletöötluse ja -analüüsi funktsionaalsused . 3.1 EstNLTK EstNLTK on Pythonis kirjutatud teekide kogumik, mis võimaldab kasutada erinevaid eesti keele töötlemise funktsionaalsusi . Antud lõputöös olid suurima tähtsusega osalausestamise, sõnestamise, morfoloogilise analüüsi ja lausestamise funktsionaalsused . Kõikide funktsionaalsuste kohta on olemas põhjalikud kasutusjuhendid ja dokumentatsioon Jupyter Notebooki töölehtede vormis. Seda peetakse kergekaaluliseks, kuna põhiversioonil puuduvad andmebaasi abstraktsioonikiht, andmeväljade kontroll, autentimine ja muud funktsionaalsused , mida veebirakenduste loomises tihtipeale kasutatakse [7]. See-eest on võimalik lisada erinevaid kolmanda osapoole liideseid, mis võimaldavad neid funktsionaalsusi rakendada [7]. |
|||||||
|
looma 9x |
Käesolevas töös loodi analüsaatorist programm, mis toetab tudengit ja juhendajat töö kirjutamisel ning aitab järgida head lõputööle omast keelekasutust, -stiili ja -nõudeid. Lõputöö analüsaatori jaoks loodi lahtise API-ga mikroteenus, millele esitab päringu CgLearni lõputöö veebiteenus. Originaalset sisendteksti saab anda argumendina Text objektile, mis võimaldab tekstist erinevaid analüüsikihte luua . Näiteks saab luua analüüsikihi „sentences“, mis loob järjendi „Span“ objektidest, kus iga „Span“ objekt vastab ühele lausele. Analoogselt saab luua Text objektile ka „words“ ja „morph_analysis“ analüüsikihid. Esimene neist loob analüüsikihi sõnade eraldamiseks ja analüüsimiseks, teine võimaldab uurida sõnade morfoloogilisi atribuute. 3.2 Flask Flask on vabavaraline Pythoni raamistik, millega saab lihtsasti luua veebirakendusi. |
|||||||
|
Originaalset sisendteksti saab anda argumendina Text objektile, mis võimaldab tekstist erinevaid analüüsikihte luua . Näiteks saab luua analüüsikihi „sentences“, mis loob järjendi „Span“ objektidest, kus iga „Span“ objekt vastab ühele lausele. [...] Analoogselt saab luua Text objektile ka „words“ ja „morph_analysis“ analüüsikihid. Esimene neist loob analüüsikihi sõnade eraldamiseks ja analüüsimiseks, teine võimaldab uurida sõnade morfoloogilisi atribuute | |||||||
|
kasutama 12x |
Seda kirjutades on oluline kasutada korrektset ja akadeemilist keelekasutust ning -stiili, mis on omane teadustekstile. Programm kasutab keeletehnoloogilisi lahendusi ja loomuliku keele töötlust, et tuvastada problemaatilised tekstilõigud, laused või sõnad ja seejärel annab nende parandamiseks soovitusi. Erinevates valdkondades on see-eest erinevad reeglid, näiteks on kohati lubatud kasutada ümberütlevaid väljendeid („Töö autor leiab...“) või mina-vormi [5]. Mikroteenus on kirjutatud programmeerimiskeeles Python ja kasutab Flask veebiraamistikku, mis on võrdlemisi kergekaaluline ja sellise projekti jaoks sobiv. 3.1 EstNLTK EstNLTK on Pythonis kirjutatud teekide kogumik, mis võimaldab kasutada erinevaid eesti keele töötlemise funktsionaalsusi. Teek võimaldab kasutada peamisi keeletehnoloogilisi operatsioone. Lõputöös otsustati kasutada EstNLTK versiooni 1.6. Kuigi võimalik oli kasutada ka 2017. aastal lõplikult valmis saanud EstNLTK versiooni 1.4.1, siis otsustati siiski hilisema versiooni kasuks, kuna see saab regulaarselt uuendusi. Näiteks on kihi „morph_analysis“ kaudu võimalik saada kätte sõna algvorm ja sõnaliik, mis oli lõputöös korduvalt kasutatud sõnade analüüsi puhul võtmetähtsusega. Tänapäeval on Flask üks enim kasutatud Pythoni raamistikke. Seda peetakse kergekaaluliseks, kuna põhiversioonil puuduvad andmebaasi abstraktsioonikiht, andmeväljade kontroll, autentimine ja muud funktsionaalsused, mida veebirakenduste loomises tihtipeale kasutatakse [7]. |
|||||||