Chemical Structure Elucidation from Nuclear Magnetic Resonance Spectra Using CAM Methods with Neural Networks.

dc.contributor.advisorKuhn, Stefan, juhendaja
dc.contributor.authorKroon, Enriko
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Arvutiteaduse instituutet
dc.date.accessioned2025-10-23T09:29:24Z
dc.date.available2025-10-23T09:29:24Z
dc.date.issued2025
dc.description.abstractThe given thesis investigates the application of visual explainability methods, specifically Grad-CAM and Grad-CAM++, for the identification of chemical substructures in two-dimensional NMR spectra using convolutional neural networks. A desktop application was developed to integrate these algorithms and analyse spectra from HMBC and HSQC experiments. The analysis revealed that chemical mixtures containing additional spectral components led to inconsistent and unreliable heatmaps. The study concludes that Grad-CAM and Grad-CAM++ combined with simple neural network architectures can highlight the pure compound spectra in most cases with varying accuracy, but are insufficient for reliably identifying fatty acid, indole, or steroid substructures in complex spectral mixtures.
dc.description.abstract Käesolevas lõputöös uuriti visuaalsete närvivõrkude seletatavusmeetodite, eelkõige Grad-CAM ja Grad-CAM++ algoritmide, rakendatavust keemiliste alamstruktuuride tuvastamisel kahedimensionaalsetes tuumamagnetresonantsspektrites, kasutades konvolutsioonilisi närvivõrke. Töö käigus arendati rakendus, mis võimaldab neid algoritme kasutada HMBC ja HSQC spektrite analüüsimiseks eelnevalt treenitud närvivõrkudel. Analüüsi tulemused näitasid, et puhaste keemiliste elementide spektrite puhul on enamik juhtudel võimalik välja tuua alamstruktuuri asukoht spektripildil varieeruva täpsusega. Spektrite puhul, mis sisaldasid täiendavaid komponente lisaks närvivõrgu poolt klassifitseeritavatele elementidele, oli tulemuste usaldusväärsus ja täpsus varieeruv. Töös järeldati, et Grad-CAM ja Grad-CAM++ algoritmid koos lihtsakoeliste närvivõrguarhitektuuridega ei ole piisavad rasvhapete, indoolide ega steroidide alamstruktuuride usaldusväärseks tuvastamiseks keerulistes spektrisegudes.
dc.identifier.urihttps://hdl.handle.net/10062/117039
dc.language.isoen
dc.publisherTartu Ülikoolet
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectChemoinformatics
dc.subjectExplainable AI
dc.subject2D NMR spectra
dc.subjectGrad-CAM
dc.subjectGrad-CAM++
dc.subject.otherbakalaureusetöödet
dc.subject.otherinformaatikaet
dc.subject.otherinfotehnoloogiaet
dc.subject.otherinformaticsen
dc.subject.otherinfotechnologyen
dc.titleChemical Structure Elucidation from Nuclear Magnetic Resonance Spectra Using CAM Methods with Neural Networks.
dc.title.alternativeKeemiliste struktuuride selgitamine tuumamagnetresonantsspektrites närvivõrkude ja CAM meetoditega.
dc.typeThesis

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
Kroon_informaatika_2025.pdf
Suurus:
4.74 MB
Formaat:
Adobe Portable Document Format