Development of the text archivers using linguistic features of the language

Bocharova, Irina, juhendajaŠiškov, ArtjomTartu Ülikool. Loodus- ja täppisteaduste valdkondTartu Ülikool. Arvutiteaduse instituut2025-10-202025-10-202025https://hdl.handle.net/10062/116900See lõputöö keskendub tekstiarhiveerija arendamise protsessile, mis kasutab keele keelelisi iseärasusi, nagu sõnalõpud, digraafid, eessõnad jne. Põhiidee on arendada arhiveerijat eelnevalt valmistatud sõnastiku abil, mis sisaldab antud keelest kõige sagedamini kasutatavaid sõnu või sõnaosi. Lõputöö koosneb neljast osast. Esimene osa tutvustab lugejale põhiideed. Teine osa annab teavet erinevate tihendusalgoritmide ja vajalike ettevalmistavate teadmiste kohta. Kolmas osa käsitleb väljatöötatud arhiveerijat ennast ja testimistulemusi, kus eelnevalt valmistatud sõnastiku idee osutus tõhusaks. Neljas osa võtab lõputöö üldiselt kokku ja kirjeldab arhiveerija arendamise ja täiustamise tulevikuplaane.enhttps://creativecommons.org/licenses/by-nc-nd/4.0/Algorithmscompressionlossless compressionarchiverarchivinglinguisticstext archivingLZW algorithmLZ77 algorithmLZ78 algorithmHuffman algorithmarithmetic codingShannon algorithmShannon-Fano-Elias algorithmdevelopmentrussian languageenglish languageestonian languageentropyinformation contentcodewordtihendaminekadudeta tihendaminearhiveerijaarhiveeriminekeeleteadusteksti arhiveeriminevene keelinglise keeleesti keelentroopiainfosisalduskoodsõnabakalaureusetöödinformaatikainfotehnoloogiainformaticsinfotechnologyDevelopment of the text archivers using linguistic features of the languageThesis