Eestikeele sisukokkuvõtja edasiarendamine

Laen...
Pisipilt

Kuupäev

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

In an information-rich environment, automatic summarization helps save time by highlighting key content and enabling faster text navigation. EstSum was enhanced with semantic analysis: two linguistic modules were added, and transfer learning was tested using a few-shot approach to evaluate performance with limited training data. The wordnet-based module slightly improved accuracy but significantly slowed the system, while the language model–based module achieved a negligible increase in accuracy without affecting speed. Although few-shot performance matched the baseline, further improvements are possible by supplying more training examples and refining prompts. To improve accessibility, a web-based user interface was also developed for non-technical users.
Infoküllases keskkonnas aitab automaatne sisukokkuvõtja säästa aega, tõstes esile olulisemad tekstiosad ja toetades kiiret orienteerumist sisus. EstSumi täiustati semantilise analüüsi võimalustega: lisati kaks lingvistilist moodulit ning katsetati siirdeõpet few-shot meetodil, et hinnata selle sobivust väikese andmestikuga töötamiseks. Üks moodulitest põhines wordnetil, parandades küll veidi täpsust, kuid vähendades süsteemi jõudlust märgatavalt. Keelemudelil põhinev moodul parandas täpsust ja säilitas töökiiruse. Siirdeõppe tulemuslikkus jäi samale tasemele EstSumi baasversiooniga. Keelemudelitel põhinevat lähenemisviisi saab edasi arendada, andes mudelile siirdeõppe käigus rohkem treeningandmeid ning täpsustades viipa. Lisaks loodi veebipõhine kasutajaliides, mis võimaldab süsteemi kasutada ka mittetehnilistel kasutajatel.

Kirjeldus

Märksõnad

EstSum, summarization, artificial intelligence, WordNet

Viide