Repository logo
Communities & Collections
All of ADA
Eesti
English
Deutsch
  1. Home
  2. Browse by Author

Browsing by Author "Undo, Aare"

Filter results by typing the first few letters
Now showing 1 - 1 of 1
  • Results Per Page
  • Sort Options
  • Loading...
    Thumbnail Image
    listelement.badge.dso-type Item , listelement.badge.access-status Open Access ,
    Calculating the error percentage of an automated part-of-speech tagger when analyzing Estonian learner English: an empirical analysis
    (Tartu Ülikool, 2018) Undo, Aare; Klavan, Jane, juhendaja; Tartu Ülikool. Inglise filoloogia osakond; Tartu Ülikool. Humanitaarteaduste ja kunstide valdkond
    Teksti sõnaliikideks jaotamine sündis koos lingvistikaga, kuid selle protsessi automatiseerimine on muutunud võimalikuks alles viimastel kümnenditel ning seda tänu arvutite võimsuse kasvule. Tekstitöötluse algoritmid on alates sellest ajast iga aastaga üha paranenud. Selle magistritöö raames pannakse üks selle valdkonna lipulaevadest proovile korpuse peal, mis hõlmab eesti keelt emakeelena kõnelevate inglise keele õppijate tekste (TCELE korpus). Korpuse suurus on antud hetkel ca. 25 000 sõna (127 kirjalikku esseed) ning 11 transkribeeritud intervjuud (~100 minutit). Eesmärk on hinnata TCELE ja muude sarnaste korpuste veaprotsenti. Töö esimeses osas tutvustatakse lugejale korpuse kokkupanemist, annoteerimist ja väljavõtet (ingl. ​retrieval​ ) ning antakse ülevaade sõnaliikide määramisest ja veaprotsendist. Pärast seda antakse ülevaade varasematest uuringutest ning vastatakse muuhulgas, järgnevatele küsimustele: mida on eelnevalt tehtud? Mis olid uuringute leiud? Millised automaatsed märgendajad (ingl. ​taggers) ja sõnaliikide loendeid (ingl. ​tagset​ ) kasutati?

DSpace software copyright © 2002-2026 LYRASIS

  • Accessibility settings
  • Send Feedback