Andmenihke tuvastamine ja leevendamine kõnekeskuse andmete näitel

Laen...
Pisipilt

Kuupäev

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

The aim of this master thesis is to analyse how call center worktime change affects the performance of created machine learning models, see if this change creates a data drift and how to mitigate its effect. First, literature, existing solutions on how to predict service level and data drift algorithms are analysed. Secondly, the call center dataset is described and analysed. Thirdly is given an overview of used models and their features, which is followed by practical work which includes describing the effects of the change on the data, testing two data drift algorithms on the dataset, trying to alleviate the effects of the change on prediction accuracy and finally comparing the results. In the final part, conclusions on the effect of the change are made based on the results of the algorithms and the usability of deploying these models in other call centers is discussed.
Käesoleva magistritöö eesmärk on analüüsida enda loodud mudelitel, kuidas mõjutab kõnekeskuse tööaja muutus mudeli teenustaseme ennustustäpsust, kas see toob endaga kaasa andmenihke ning kuidas vähendada selle mõju. Esmalt antakse ülevaade kirjandusest, senistest lähenemistest kõnekeskuse teenustaseme ennustamiseks ja andmenihke algoritmidest. Seejärel seletatakse lahti ja analüüsitakse kõnekeskuse andmestiku üldiselt. Kolmandana, antakse ülevaade kasutatud mudelitest ja nende tunnustest, millele järgneb praktiline osa, kus kirjeldatakse muutuse mõju tunnustele, katsetatakse andmetel kahte andmenihke algoritmi, proovitakse leevendada muutuste mõju mudeli ennustustäpsusele ja võrreldakse tulemusi. Viimaks, tehakse järeldused muutuse mõjust kõnekeskuse tööle algoritmide tulemuste põhjal ja arutletakse mudeli kasutavatuse üle teistes kõnekeskustes.

Kirjeldus

Märksõnad

masinõpe, service level, ADWIN, ML, PCA-CD, machine learning, data drift, andmenihe, kõnekeskus, andmenihke algoritm, call center, data drift algorithm, teenustase, SLA

Viide