Meetodid murdekeele kirjakeelestamiseks

Tekstide tõlkimiseks on mõeldud programmid „murdekoprus_meetod.py“, „teisendus_meetod.py“ ja „statistiline_meetod_ibm1.py“
Korpuse ja mudeli töötlemiseks on failid "korpus_faili_koostaja.py", "tekst_jsonfiy.py", "treenija.py" ja "table_distances.py"

„murdekoprus_meetod.py“ ja „teisendus_meetod.py“ käivitamine käsurealt:
Hoiatus – programm vajab võrguühendust, ülikooli võrgus (eduraom) on päringute kiirus piiratud, seetõttu on soovitatav testimisperioodiks ühenduda ut-public võrku.

1. Käivitada ilma argumentideta. Sel juhul on võimalik otse käsuviipa tõlgitavat teksti sisestada. (N: python murdekorpus_meetod.py)
2. Käsurea argumentidega. Sel juhul on võimalik tekstifaile (.txt ja .docx) sisendiks anda. Argumendid anda kujul "faili_asukoht murde_nimetus" (N: python murdekorpus_meetod.py tekstid/voru_tekst.txt võru)
3. Käsurea argumendina spetsiaalne muinasjuttude kogumik (faili nimi peab lõppema \"mjp.docx\"). Sel juhul piisab vaid ühest argumendist, milleks on faili asukoht (N: python murdekorpus_meetod.py tekstid/mjp.docx)

„statistiline_meetod_ibm1.py“ käivitamine käsurealt:

1. Käivitada mudelifaili ja tõlgitava lausega, kujul "mudelifaili_asukoht "tõlgitav_lause" (jutumärkides ehk ühtse sõnena)". (N: python statistiline_meetod_ibm1.py data/mudel.txt "Imä om sääl")
2. Käivitada mudelifaili ja sisendfailiga. Sel juhul on võimalik tekstifaile (.txt ja .docx) sisendiks anda. Argumendid anda kujul "mudelfaili_asukoht sisendfaili_asukoht". (N: python statistiline_meetod_ibm1.py data/mudel.txt tekstid/voru_tekst.txt)
3. Käivitada mudelifaili ja spetsiaalse muinasjuttude kogumikuga (faili nimi peab lõppema "mjp.docx"). Argumendid anda kujul "mudelfaili_asukoht sisendfaili_asukoht“ (N: python statistiline_meetod_ibm1.py data/mudel.txt tekstid/mjp.docx)
Iga meetodi käivitamisel kuvatakse samuti vastavad instruktsioonid, kuidas antud meetodeit kasutada.

Testitavad tekstmaterjalid asuvad kaustas "tekstid"
Kaustas "data" asuvad korpuse ja mudeli failid
Kasustas "osakorpused" asuvad eesti-võru paralleelkorpuse osafailid
Kasutas "sonastikud_lemmad" asuvad seletava sõnastiku lemmafailid

Miinimum nõuded programmide jooksutamiseks:
1.	Python 3.5.*
2.	EstNLTK 1.4.1 teek
installeerimis juhend: https://estnltk.github.io/estnltk/1.4.1/tutorials/installation.html
3.	Python-docx teek 0.8.6
installeerimis juhend: https://python-docx.readthedocs.io/en/latest/user/install.html
4.	Clize teek 4.0.1
Installeerimis juhend: http://clize.readthedocs.io/en/stable/basics.html

