Clustering analysis for astrophysical structures

Date

2020-12-21

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Antud doktoritöös uurime klasteranalüüsi meetodite abil kahte tüüpi astrofüüsikalisi andmeid – suureskaalalisi galaktikate punanihke vaatluseid ja suuri superarvuti simulatsioone turbulentsest kineetilisest plasmast. Töö esimeses pooles uurime Universumi struktuuri kõige domineerivamat elementi – galaktilisi filamente. Enamus Universumi galaktikaid asuvad nendes pikkades sildades, mis ühendavad sfäärilisi galaktikate parvi ja peaaegu tühjasid hoomamatuid tühikuid. Filamentvõrgustiku kaardistamine on väga olulise tähtsusega, sest see aitab meil mõista selles leiduvate galaktikate evolutsiooni ja galaktikatevahelist ainet. Antud töös leiame senini varjatud mustri galaktikate paiknemises piki filamente, mis viitab galaktikate evolutsiooni mõjutavatele keskkonna teguritele. Seejärel kinnitame uue galaktikateandmestiku ja filamentvõrgustiku ruumilise klasterdumise, mis kinnitab antud võrgustiku õigsust ja motiveerib neid uusi galaktikaid tuleviku modelleerimisel kasutama. Töö teises pooles uurime pilte, mis on saadud magneetiliselt domineeritud astrofüüsikalise plasma simulatsioonist. Antud mudel simuleerib füüsikalist fenomeni, mis leidub galaktikate klastrites, mustade aukude akretsiooniketastes, Päikese koroonas ja isegi tuumasünteesi reaktorites. Kõrgelt laetud osakesed väljuvad antud plasmast teatud füüsikaliste protsesside käigus, mida pole veel täielikult mõistetud. Selle mõistmiseks tuleb detekteerida erinevad füüsikalised struktuurid, mis plasmas leiduvad. Antud töös rakendame juhendamata masinõppe meetodit ning kaardistame plasmas olevad struktuurid piksli täpsusega. Sealhulgas need objektid, mis kiirendavad osakesi plasmast lahkuma. Töös arendatakse ka ansambelõppe raamistik, mis tõstab oluliselt struktuuride kaardistamise täpsust. Antud töö demonstreerib klasteranalüüsi algoritmide võimekust füüsikaliste fenomenide uurimisel.
In this PhD thesis, two classes of astrophysical datasets – large scale galaxy redshift surveys and large supercomputer simulations of fully-kinetic turbulent plasma – are studied with clustering algorithms. In the first part we investigate the most dominant structure element of the Universe: the galaxy filaments. Majority of galaxies in the Universe reside in these galaxy filaments, which are long bridges connecting spherical high-density regions of galaxies and border immense voids almost without galaxies. Mapping the structure from observational galaxy datasets is of utmost importance for understanding the objects residing inside them, that is, galaxies and the intergalactic medium. In this work, we reveal a hidden pattern in the locations of galaxies residing inside these structures, which sheds light on environmental effects governing the evolution of galaxies. Then, we trace the detected galaxy filaments with a new observational dataset of galaxies, and prove the detected network. This motivates the use of these new datasets in the future modeling of the Universe. In the second part of this thesis we study images originating from simulations of turbulent magnetically dominated plasma, which models the physical phenomena observed in galaxy clusters, black hole accretion disks, solar corona, and even in fusion reactors. Physical phenomena responsible for the excitation of particles inside the plasma are not yet fully understood. In order to understand the underlying physics, the physical structures inside the plasma need to be detected. We apply an unsupervised machine learning algorithm on these images; and detect the physical structures pixel-by-pixel, including those responsible for the ejection of particles. We also develop an ensemble framework to improve the accuracy of the results. This thesis demonstrates the great potential and value of clustering analysis tools, from a wide spectrum of concepts, for revealing and understanding physical phenomena.

Description

Väitekirja elektrooniline versioon ei sisalda publikatsioone

Keywords

astrophysics, big data, automatic learning, cluster analysis

Citation