Chemical Structure Elucidation from Nuclear Magnetic Resonance Spectra Using CAM Methods with Neural Networks.

Laen...
Pisipilt

Kuupäev

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

The given thesis investigates the application of visual explainability methods, specifically Grad-CAM and Grad-CAM++, for the identification of chemical substructures in two-dimensional NMR spectra using convolutional neural networks. A desktop application was developed to integrate these algorithms and analyse spectra from HMBC and HSQC experiments. The analysis revealed that chemical mixtures containing additional spectral components led to inconsistent and unreliable heatmaps. The study concludes that Grad-CAM and Grad-CAM++ combined with simple neural network architectures can highlight the pure compound spectra in most cases with varying accuracy, but are insufficient for reliably identifying fatty acid, indole, or steroid substructures in complex spectral mixtures.
Käesolevas lõputöös uuriti visuaalsete närvivõrkude seletatavusmeetodite, eelkõige Grad-CAM ja Grad-CAM++ algoritmide, rakendatavust keemiliste alamstruktuuride tuvastamisel kahedimensionaalsetes tuumamagnetresonantsspektrites, kasutades konvolutsioonilisi närvivõrke. Töö käigus arendati rakendus, mis võimaldab neid algoritme kasutada HMBC ja HSQC spektrite analüüsimiseks eelnevalt treenitud närvivõrkudel. Analüüsi tulemused näitasid, et puhaste keemiliste elementide spektrite puhul on enamik juhtudel võimalik välja tuua alamstruktuuri asukoht spektripildil varieeruva täpsusega. Spektrite puhul, mis sisaldasid täiendavaid komponente lisaks närvivõrgu poolt klassifitseeritavatele elementidele, oli tulemuste usaldusväärsus ja täpsus varieeruv. Töös järeldati, et Grad-CAM ja Grad-CAM++ algoritmid koos lihtsakoeliste närvivõrguarhitektuuridega ei ole piisavad rasvhapete, indoolide ega steroidide alamstruktuuride usaldusväärseks tuvastamiseks keerulistes spektrisegudes.

Kirjeldus

Märksõnad

Chemoinformatics, Explainable AI, 2D NMR spectra, Grad-CAM, Grad-CAM++

Viide