Tehisintellektil põhinev valgu kolmemõõtmelise struktuuri ennustamise tarkvara AlphaFold2
Laen...
Kuupäev
Autorid
Ajakirja pealkiri
Ajakirja ISSN
Köite pealkiri
Kirjastaja
Tartu Ülikool
Abstrakt
The aim of this thesis is to investigate which algorithmic innovations have enabled the artificial intelligence–based protein structure prediction model AlphaFold2 to achieve significantly higher accuracy compared to earlier approaches. First, an overview is given of the hierarchical levels of protein structure and the experimental methods used for structure determination. The following section focuses on the algorithmic architecture of AlphaFold2 and its deep learning–based working principles. The practical part aims to demonstrate a potential use case in research: the three-dimensional structure of a hypothetical bacteriophage protein is predicted using the ColabFold (Mirdita et al., 2022) environment, and structurally similar proteins are searched with FoldSeek (van Kempen et al., 2023) to infer the protein’s potential function.
Töö eesmärk on uurida, millised algoritmilised uuendused on võimaldanud tehisintellektil põhineval valgu struktuuri ennustusmudelil AlphaFold2 saavutada märkimisväärse täpsuse võrreldes varasemate lähenemistega. Esmalt antakse ülevaade valgustruktuuri tasemetest ning eksperimentaalsetest meetoditest nende määramiseks. Seejärel käsitletakse AlphaFold2 algoritmilist ülesehitust ja süvaõppepõhist tööloogikat. Praktilise osa eesmärk on kirjeldada mudeli võimalikku rakendust teadustöös – ennustatakse ühe bakteriofaagi hüpoteetilise valgu kolmemõõtmeline struktuur ColabFoldi (Mirdita jt., 2022) keskkonnas ning otsitakse sarnaseid struktuure FoldSeeki (van Kempen jt., 2023) abil, et teha järeldusi valgu potentsiaalse funktsiooni kohta.
Töö eesmärk on uurida, millised algoritmilised uuendused on võimaldanud tehisintellektil põhineval valgu struktuuri ennustusmudelil AlphaFold2 saavutada märkimisväärse täpsuse võrreldes varasemate lähenemistega. Esmalt antakse ülevaade valgustruktuuri tasemetest ning eksperimentaalsetest meetoditest nende määramiseks. Seejärel käsitletakse AlphaFold2 algoritmilist ülesehitust ja süvaõppepõhist tööloogikat. Praktilise osa eesmärk on kirjeldada mudeli võimalikku rakendust teadustöös – ennustatakse ühe bakteriofaagi hüpoteetilise valgu kolmemõõtmeline struktuur ColabFoldi (Mirdita jt., 2022) keskkonnas ning otsitakse sarnaseid struktuure FoldSeeki (van Kempen jt., 2023) abil, et teha järeldusi valgu potentsiaalse funktsiooni kohta.
Kirjeldus
Märksõnad
Tehisintellekt, AlphaFold2, struktuuri ennustamine, Artificial intelligence, structure prediction