Classification and identification of conopeptides using profile hidden Markov models and position-specific scoring matrices

dc.contributor.authorLaht, Silja
dc.date.accessioned2015-07-06T11:08:44Z
dc.date.available2015-07-06T11:08:44Z
dc.date.issued2015-07-06
dc.descriptionVäitekirja elektrooniline versioon ei sisalda publikatsioone.et
dc.description.abstractKonopeptiidid on soojades meredes elavate koonustigude (Conus sp.) mürgis leiduvad lühikesed valgud. Koonusteod on kiskjad ja toituvad ussikestest, teistest molluskitest või kaladest. Nad tulistavad saaki mürgiga täidetud harpuuniga, mürk muudab saaklooma liikumatuks ja tigu saab ta rahulikult tervelt alla neelata. Mürgi kiirelt uimastav ja halvav toime tuleb paljude erinevate konopeptiidide segust. Konopeptiidid sünteesitakse eellasvalkudena, millel on signaaljärjestus mürgitorusse transportimiseks ja propeptiid, mis aitab mürgipeptiidi õigesti pakkida ja mürgipeptiid. Konopeptiidid jagatakse sarnaste signaaljärjestuste alusel perekondadesse. Teadlased uurivad konopeptiide lootusega leida nende hulgast uusi ravimikandidaate. Konopeptiidid on väga spetsiifilised närvirakkudes leiduvate ioonkanalite modulaatorid ja omavad suurt potentsiaali valuvaigistite või lihastelõdvestajatena. Antud uurimistöö esimeseks eesmärgiks oli välja töötada meetod, mille abil saaks suurtest järjestuste hulkadest välja otsida ja klassifitseerida konopeptiidid. Klassifitseerimine on oluline, sest uuele valgule sarnaste valkude teadasaamine annab palju informatsiooni tema omaduste kohta. Meie valisime sarnasuse võrdlemiseks kahte tüüpi mudelid - profiil-HMM’id ja PSSM’id. Kuna signaalpeptiidid on ühe perekonna piires väga konserveerunud, siis on nende olemasolul järjestuste klassifitseerimine meie mudelitega 100% tundlik ja ka 100% spetsiifiline. pHMM’ide ja PSSM’ide kombineerimisega saavutasime 91% tundlikkuse ka mürgipeptiidide klassifitseerimisel. Töö teiseks eesmärgiks oli otsida konopeptiide koonusteo Conus consors’i genoomist ja mürgitoru transkriptoomist. Konopeptiidide otsimiseks järjestatud transkriptoomist ja genoomist kasutasime teiste meetodite hulgas ka pHMM’e. Me leidsime C. consors’i genoomist 214 konopeptiidi, millest 187 olid uued järjestused. Meil õnnestus teada saada 13-sse erinevasse perekonda kuuluva 15 konopeptiidi geenide ekson-intron struktuur. See on oluline, sest geenistruktuur võib mõjutada konopeptiidide mitmekesisuse teket.et
dc.description.abstractConopeptides are small proteins found in the venom of cone snails (Conus sp.). Cone snails feed on worms, molluscs and fish. They paralyze their prey with venom and swallow it whole. The fast immobilization appears as a result of the mixture of conopeptides in the venom. Conopeptides are synthesized as prepropeptides with a signal sequence for transport into the venom duct, pro-peptide that facilitates proper folding and mature peptide. Conopeptides are grouped into superfamilies according to the signal sequences. Scientists are studying the conopeptides hoping to find new drug candidates. Conopeptides are specific modulators of ion channels in nerve and muscle cells and therefore can be potentially used as painkillers or muscle relaxants. Aim of this study was to develop a method for finding and classifying conopeptides from large amounts of sequences. Classification is important since finding the proteins similar to a newly discovered protein we get a lot of information about it. We used two types of models for classification and identification – profile hidden Markov Models (pHMMs) and position specific scoring matrices (PSSMs). With the signal peptide present the classification is 100% specific and sensitive. By combining the pHMMs and PSSMs we were able to obtain 91% sensitivity also for classification of mature peptides, which is better than with other methods. The second aim of this study was to find conopeptides from the genome and venom duct transcriptome of Conus consors. We used multiple methods, including the pHMMs, to locate the conopeptides. We discovered 214 conopeptides from the genome, 187 of which were novel. We also described the exon-intron structure for 15 conopeptide genes from 13 different superfamilies. Gene structure may influence the propagation of conopeptide diversity.en
dc.identifier.isbn978-9949-32-887-1
dc.identifier.isbn978-9949-32-888-8 (pdf)
dc.identifier.issn1024–6479
dc.identifier.urihttp://hdl.handle.net/10062/47497
dc.language.isoenet
dc.relation.ispartofseriesDissertationes biologicae Universitatis Tartuensis;279
dc.subjectkonopeptiididet
dc.subjectklassifitseerimineet
dc.subjectMarkovi aheladet
dc.subjectstatistilised mudelidet
dc.subjectconopeptidesen
dc.subjectclassificationen
dc.subjectMarkov chainsen
dc.subjectstatistical modelsen
dc.subject.otherdissertatsioonidet
dc.subject.otherETDen
dc.subject.otherdissertationsen
dc.subject.otherväitekirjadet
dc.titleClassification and identification of conopeptides using profile hidden Markov models and position-specific scoring matricesen
dc.title.alternativeKonopeptiidide klassifitseermine ja kindlakstegemine varjatud Markovi mudelite ja positsioonispetsiifiliste skoorimaatriksite abilet
dc.typeThesisen

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
laht_silja.pdf
Size:
2.65 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
506 B
Format:
Item-specific license agreed upon to submission
Description: