Quantitative convergence of convolutional neural networks with correlated weights

dc.contributor.advisorMosig García, Eloy, juhendajaet
dc.contributor.advisorAgazzi, Andrea, juhendajaet
dc.contributor.advisorLember, Jüri, juhendajaet
dc.contributor.authorAlesma, Karl-Joan
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Matemaatika ja statistika instituutet
dc.date.accessioned2026-06-11T14:42:46Z
dc.date.available2026-06-11T14:42:46Z
dc.date.issued2026
dc.description.abstractMe üldistame Basteri ja Trevisani, 2024 tulemust, mis mõõdab juhusliku täisühendusega närvivõrgu ja Gaussi protsessi vahelist kaugust, juhuslikule korreleeritud kaaludega konvolutsioonilisele närvivõrgule. Selleks leiame ülemise tõkke ruut Wassersteini kaugusele juhusliku konvolutsioonilise närvivõrgu ja talle vastava Gaussi protsessi vahel. Saadud tõke näitab, kuidas arhitektuurilised parameetrid mõjutavad koondumiskiirust, kui kanalite arv kasvab. Erijuhul kui konvolutsioonilise närvivõrgu struktuur taandub tavaliseks närvivõrguks, saame tagasi tulemuse Basteri ja Trevisani, 2024 tööst. We extend the quantitative Gaussian approximation of randomly initialized fully connected neural networks established in Basteri and Trevisan (2024) to convolutional neural networks with patch-wise correlated weights. Specifically, we derive an upper bound on the quadratic Wasserstein distance between the output distribution of a randomly initialized convolutional neural network and its associated neural network Gaussian process. The obtained bound reveals how the architectural parameters affect convergence in the wide limit. As a corollary, we recover the fully connected network bound of Basteri and Trevisan (2024) when the convolutional structure degenerates to a dense layer.
dc.identifier.urihttps://hdl.handle.net/10062/121896
dc.language.isoen
dc.publisherTartu Ülikoolet
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Estoniaen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/ee/
dc.subjectjuhuslik konvolutsiooniline närvivõrket
dc.subjectnärvivõrgu Gaussi protsesset
dc.subjectGaussi lähendamineet
dc.subjectWassersteini kauguset
dc.subjectlai piirjuhtet
dc.subjectrandom convolutional neural networken
dc.subjectneural network Gaussian processen
dc.subjectGaussian approximationen
dc.subjectWasserstein distanceen
dc.subjectwide limiten
dc.subject.othermagistritöödet
dc.subject.othervõrguväljaandedet
dc.titleQuantitative convergence of convolutional neural networks with correlated weightsen
dc.title.alternativeKorreleeritud kaaludega konvolutsioonilise närvivõrgu kvantitatiivne koondumineet
dc.typeThesis

Failid

Originaal pakett

Nüüd näidatakse 1 - 2 2
Laen...
Pisipilt
Nimi:
karl-joan_alesma_msc_2026.pdf
Suurus:
574.94 KB
Formaat:
Adobe Portable Document Format
Laen...
Pisipilt
Nimi:
autori_parandustega_ karl-joan_alesma_msc_2026.pdf
Suurus:
635.29 KB
Formaat:
Adobe Portable Document Format