Masinõppe algoritmide rakendamine füüsikast lähtuvate fotomeetriliste punanihete täpsustamisel

Laen...
Pisipilt

Kuupäev

Ajakirja pealkiri

Ajakirja ISSN

Köite pealkiri

Kirjastaja

Tartu Ülikool

Abstrakt

This thesis explores the application of machine learning methods to improve the accuracy of photometric redshift (photo-z) estimates by refining the outputs of the physics-based model TOPz. Using data from the WAVES survey, several regression based machine learning models were trained to reproduce and enhance TOPz outputs. The best-performing model was XGBoost, which with an optimal configuration significantly reduced prediction errors and the proportion of outliers compared to the original TOPz estimates. Two enhancement models were developed: one directly predicted the logarithmic redshift transformation ζ = ln(1 + z), while the other estimated the full ζ probability distribution. Both models were combined with the original TOPz outputs, with the direct ζ prediction model achieving the lowest error (MAE = 0,0265), and the probability distribution model providing better interpretability and the ability to handle ambiguous solutions. The best results were achieved by linearly or geometrically combining model outputs, optimizing the weight between TOPz and XGBoost contributions. The study demonstrates that a hybrid approach combining physical modeling and machine learning enables significantly more accurate and robust photometric redshift estimates, which are essential for large-scale astronomical surveys such as J-PAS and WAVES.
Töös käsitlen masinõppemeetodite rakendamist fotomeetriliste punanihete (photo-z) täpsustamiseks, keskendudes füüsikalise mudeli TOPz väljundite parandamisele. Kasutades WAVES uuringu andmestikku, treenin erinevaid regressioonipõhiseid masinõppemudeleid TOPz väljundite reprodutseerimiseks ja täpsustamiseks. Parimaks osutus XGBoost algoritm, mille optimaalne konfiguratsioon suutis oluliselt vähendada ennustus vigu ja erindite osakaalu võrreldes TOPz mudeliga. Seejärel loodi kaks täiendusmudelit: esimene ennustas otseselt punanihke logaritmilist teisendust ζ = ln(1 + z), teine aga kogu ζ tõenäosusjaotust. Kombineerisin mõlemad mudelid TOPz väljunditega, kusjuures otse ζ väärtust ennustav mudel saavutas väiksemad vead (MAE = 0,0265) ning tõenäosusjaotuste mudel pakkus suuremat interpreteeritavust ja suutlikkust käsitleda mitmemõttelisi lahendusi. Parimad tulemused saavutati mudelite lineaarse või geomeetrilise kombineerimisega, optimeerides TOPz ja XGBoosti kaalutegurit. Töö näitab, et füüsikalise modelleerimise ja masinõppe sümbioos võimaldab oluliselt täpsemaid ning usaldusväärsemaid fotomeetrilisi punanihke hinnanguid, mis on kriitilise tähtsusega suurte astronoomiliste uuringute jaoks, nagu J-PAS ja WAVES.

Kirjeldus

Märksõnad

masinõpe, TOPz, fotomeetriline punanihe, WAVES andmestik, XGBoost, photometric redshift, machine learning

Viide