Machine Learning Methods in Anti-Money Laundering
Laen...
Kuupäev
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
Anti-Money Laundering (AML) is a critical operation in the financial sector, and with the constant growth in transaction volume, traditional AML methods are no longer sufficient for effectively detecting and preventing money laundering activities. Machine learning (ML) has the potential to discover complex patterns within the vast amounts of transactional data and reduce the false positives (FP) in the AML alerts. This thesis analyzes the applicability of machine learning in AML and proposes a full training pipeline that covers model training, hyperparameter optimization, and synthetic data generation. The work focuses on training a machine learning model with focus on reducing FP noise while being able to classify true positive (TP) alerts by augmenting the highly imbalance training dataset with synthetically generated minority class samples using a Variational autoencoder (VAE) and applying Optuna hyperparameter optimization to tune the model. The results of the experiments demonstrate that this method improves the model’s performance while maintaining its ability to generalize to unseen data, finally achieving noise reduction of FP alerts by 40%.
Rahapesu tõkestamine (AML) on finantssektoris kriitilise tähtsusega tegevus ning tehingute mahu pideva kasvuga ei ole traditsioonilised AML meetodid enam piisavad rahapesu efektiivseks tõkestamiseks. Masinõppel (ML) on potentsiaal avastada keerukaid mustreid tohututes tehinguandmete kogustes ning vähendada valepositiivseid (FP) tulemusi AML andmetes. Käesolev lõputöö analüüsib masinõppe rakendatavust rahapesu tõkestamisel ning pakub välja treening protsessi, mis hõlmab mudeli treenimist, hüperparameetrite optimeerimist ja sünteetiliste andmete genereerimist. Töö keskendub masinõppe mudeli treenimisele eesmärgiga vähendada valepositiivset müra, säilitades samal ajal võimet klassifitseerida päriselt olulisi tehinguid potentsiaalselt ohtlikeks, täiendades äärmiselt tasakaalustamata treeningandmestikku sünteetiliselt genereeritud vähemusklassi näidistega, kasutades VAE-d ning rakendades Optuna hüperparameetrite optimeerimist mudeli häälestamiseks. Katsete tulemused näitavad, et see meetod parandab mudeli efektiivsust, saavutades lõpuks valepositiivsete hoiatuste müra vähenemise 40% võrra.
Rahapesu tõkestamine (AML) on finantssektoris kriitilise tähtsusega tegevus ning tehingute mahu pideva kasvuga ei ole traditsioonilised AML meetodid enam piisavad rahapesu efektiivseks tõkestamiseks. Masinõppel (ML) on potentsiaal avastada keerukaid mustreid tohututes tehinguandmete kogustes ning vähendada valepositiivseid (FP) tulemusi AML andmetes. Käesolev lõputöö analüüsib masinõppe rakendatavust rahapesu tõkestamisel ning pakub välja treening protsessi, mis hõlmab mudeli treenimist, hüperparameetrite optimeerimist ja sünteetiliste andmete genereerimist. Töö keskendub masinõppe mudeli treenimisele eesmärgiga vähendada valepositiivset müra, säilitades samal ajal võimet klassifitseerida päriselt olulisi tehinguid potentsiaalselt ohtlikeks, täiendades äärmiselt tasakaalustamata treeningandmestikku sünteetiliselt genereeritud vähemusklassi näidistega, kasutades VAE-d ning rakendades Optuna hüperparameetrite optimeerimist mudeli häälestamiseks. Katsete tulemused näitavad, et see meetod parandab mudeli efektiivsust, saavutades lõpuks valepositiivsete hoiatuste müra vähenemise 40% võrra.
Kirjeldus
Märksõnad
Banking as a service, Deep learning, Artificial Intelligence, Variational Autoencoders, Fin-Crime, Anti Money Laundering, Machine Learning, Explainable AI