Ajaväljendid Vikipeedia biograafilistes artiklites

Date

2017

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Käesoleva bakalaureusetöö eesmärk oli uurida ajaväljendite kasutust Vikipeedia biograafilistes artiklites ja välja selgitada sünniaastate jagunemine, ajaväljendite liikide jagunemine, aastaarvuliste ajaväljendite jagunemine, ajaväljendite granulaarsus, ajaväljendite rikkalikkus ja sellele toetudes selgitada välja ajaväljendite sobivus Vikipeedia biograafiliste artiklite ajasemantiliseks võrdlemiseks. Töös anti ülevaade autori poolt rakendatud Vikipeedia biograafiliste artiklite andmekaeve ja töötlemise protsessidest, ajaväljendite märgendamise ja statistika koostamise protsessidest, toodi välja ajaväljendite statistika Vikipeedia biograafilistes artiklites ja pakuti välja meetod artiklite võrdlemiseks ajaväljendite alusel ja anti meetodile esialgne hinnang.
The purpose of this Bachelor’s thesis is to research the usage of temporal expressions in Wikipedia biographical articles and find out the distribution of birth years, distribution of temporal expression types, distribution of years in temporal expressions, granularity of temporal expressions, temporal richness and analyse the compability for comparison of the temporal expressions in Wikipedia biographical articles. This work gives an overview of data mining and processing of Wikipedia biographical articles, temporal expression tagging and statistics creation processes, statistics of temporal expressions in Wikipedia biographical articles is given and a method for comparing articles on the basis of temporal expressions and initial valuation for the method is proposed.Keywords:Temporal expression, Wikipedia, biography, data miningCERCS: P175 Informatics, systems theory

Description

Keywords

Citation