Raamistik ülikooli õppeainete teemade analüüsimiseks

Date

2017

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Erinevates teaduskondades õpetatavate ainete maht võib olla väga suur ning tihtipeale on raske saada ülevaadet ülikooli kursustel õpetatavatest teemadest ja nende kattuvusest. Käesoleva töö eesmärk on luua automaatne ja progressiivne viis, kuidas avastada kursusel õpetatavaid teemasid, tuginedes eelkõige avalikult saadaval olevatele kursuse materjalidele. Seda tüüpi analüüs pakub palju eeliseid, alustades üldisest ülevaatest kursusel õpetatavatest teemadest või näiteks avastamaks aineid, mis toetavad ühe projekti tegemist mitme kursuse raames. Selle jaoks peaksime leidma samal semestril õpetatavaid ained, mis katavad samu teemasid ja nõuavad projekti tegemist.Pakutud raamistik on vastutav erinevate kursustega seotud tekstiliste materjalide kogumises ja failidest eraldamises. Seejärel puhastatakse kogutud andmed ja teisendatakse sobivasse formaati, mille peal teostatakse tekstianalüüsi, täpsemalt teemamodelleerimist. Teemade ja kursusevaheliste seoste leidmiseks rakendatakse LDA modelleerimismeetodit. Viimase sammuna kasutatakse käesoleva raamistiku jaoks loodud visualiseerimiskomponenti, et presenteerida teemamodelleerimise tulemusi.
The vast amount of courses being taught throughout different faculties of a university makes it difficult to get a general overview of the topics being taught and their overlaps from a singular point of view. The goal of this work is to provide an automated and progressive means to discover such topics, based on the publicly available course materials. The benefits for this kind of analysis range from simply gaining an insight and an overview of the topics covered by different courses, to more specific and goal-oriented purposes. For example, we can discover which courses can support cross-course projects by finding courses that cover the same topic, are taught in the same semester and require the completion of a course project.The proposed framework is responsible for gathering and extracting course related raw textual content from various heterogeneous sources. The collected data is then cleansed and transformed to a suitable format for further textual analysis, more specifically topic modelling. LDA modelling method is used as a main tool for resolving topics and discovering relations between courses and individual course materials. As a final step of the established mechanism, the analysis results are passed to a predefined visualization component, specifically designed for the framework at hand.

Description

Keywords

Citation