論文作者:施國邦,指導(dǎo)教師:鄭珩
所屬學(xué)院:生命科學(xué)與技術(shù)學(xué)院,二級學(xué)科:微生物與生化藥學(xué)
01 導(dǎo)師說
施國邦同學(xué)的碩士畢業(yè)論文獲得省級優(yōu)秀論文,和他的努力以及創(chuàng)新思維是分不開的。當(dāng)前多肽序列記錄格式無法直接體現(xiàn)序列上的修飾信息,難點在于當(dāng)前的序列比對軟件無法辨認(rèn)20種天然氨基酸的單字母縮寫外的其它字符。該同學(xué)創(chuàng)造性地引入了封閉式字母標(biāo)記法,并保留對應(yīng)母肽序列用于搜索比較,使得訂書肽修飾位點可直觀顯示,且不影響序列的檢索和分析,對于修飾多肽的記錄提供了新的模式。論文不僅更新了DRAMP數(shù)據(jù)庫,還進(jìn)行了多肽結(jié)構(gòu)預(yù)測,構(gòu)建了抗菌肽活性預(yù)測模型等,促進(jìn)了新型抗菌肽的設(shè)計,對機(jī)器學(xué)習(xí)與人工智能在藥物設(shè)計領(lǐng)域應(yīng)用作出了積極探索。這項研究也體現(xiàn)了跨學(xué)科交叉的重要性,多個領(lǐng)域的融合使得這項研究得以順利推進(jìn)并取得顯著成效,希望同學(xué)們能注重跨學(xué)科知識的學(xué)習(xí),獲得更多的創(chuàng)新成果。
02 作者說
評審對我們課題組工作成果的肯定是我能獲獎的直接原因,根本原因是我們課題組多位成員近十年的積累與沉淀。課題組從零開始收集數(shù)據(jù)、搭建抗菌肽數(shù)據(jù)庫及網(wǎng)站,到后來一步步完善數(shù)據(jù)庫,并利用豐富的數(shù)據(jù)來指導(dǎo)抗菌肽的設(shè)計,之后課題組的成員又進(jìn)行濕實驗的驗證,一切都是連貫有邏輯的。數(shù)據(jù)的收集和利用橫亙了我的整篇論文,而有可能是之后生物學(xué)領(lǐng)域發(fā)展的某條脈絡(luò),人工智能在其中成為了重要的抓手工具。不管是藥物研究與發(fā)現(xiàn)、精準(zhǔn)醫(yī)療、基因組學(xué)研究、細(xì)胞生物學(xué),以豐富的海量數(shù)據(jù)為基礎(chǔ),佐以實驗的驗證,有大量可供挖掘探索的科研課題,請師弟師妹們抓住機(jī)會大展宏圖吧!
03 碩士論文簡介
該論文主要涉及抗菌肽數(shù)據(jù)庫更新和訂書肽活性預(yù)測模型構(gòu)建兩大部分。由于抗生素耐藥性問題日益嚴(yán)重,亟需新的抗菌藥物,抗菌肽因其獨特的作用機(jī)制和不易誘導(dǎo)耐藥性被廣泛關(guān)注。為促進(jìn)新型抗菌肽設(shè)計,本論文主要完成的工作包括:首先,對DRAMP抗菌肽數(shù)據(jù)庫進(jìn)行了更新和維護(hù),新增了2360條抗菌肽條目,其中包括181條訂書肽。創(chuàng)新性地提出使用封閉式字母來標(biāo)記修飾位點,使訂書肽的環(huán)化位點可以直觀展示。其次,利用AlphaFold2和RoseTTAFold預(yù)測了948個訂書肽和含二硫鍵環(huán)化多肽的結(jié)構(gòu),并從中提取分子描述符特征。最后,構(gòu)建了針對革蘭氏陰性菌的抗菌活性預(yù)測模型,其中AutoGluon和GBDT模型表現(xiàn)最佳,準(zhǔn)確率達(dá)到77.9%。基于這些模型,設(shè)計并篩選出5個潛在的Magainin II衍生訂書抗菌肽。
本研究創(chuàng)新點主要在于:1.首次收集訂書肽信息并構(gòu)建其活性預(yù)測模型,為新型訂書肽設(shè)計奠定了基礎(chǔ);2.率先提出使用封閉式字母表示訂書氨基酸位點的新方法,為解決數(shù)據(jù)庫記錄修飾氨基酸殘基難題提供了新的思路。這些工作為不僅可為新型抗菌肽的設(shè)計提供參考,還可為機(jī)器學(xué)習(xí)和人工智能在多肽藥物設(shè)計中的應(yīng)用提供幫助。

學(xué)術(shù)成果
課題組成功開發(fā)并更新了抗菌肽數(shù)據(jù)庫DRAMP的3.0版本,相關(guān)論文發(fā)表在數(shù)據(jù)庫領(lǐng)域的頂尖期刊Nucleic Acids Research上。作為一個手動注釋的開放獲取數(shù)據(jù)庫,DRAMP 3.0新增了2360條記錄,使總條目達(dá)到了22259條。這些條目包括5891條普通條目、16110條專利條目、77條臨床條目以及181條新型環(huán)化抗菌肽條目。首次系統(tǒng)性地收集和組織了環(huán)化抗菌肽(stapled AMPs)的信息。這類肽通過化學(xué)修飾形成環(huán)狀結(jié)構(gòu),具有良好的抗菌活性和結(jié)構(gòu)穩(wěn)定性。為了幫助設(shè)計低毒性的抗菌肽,我們還新增了細(xì)胞毒性數(shù)據(jù)。此外,數(shù)據(jù)庫還包含263個預(yù)測結(jié)構(gòu)和300多個鏈接到蛋白質(zhì)數(shù)據(jù)庫(PDB)的實驗結(jié)構(gòu)。對于數(shù)據(jù)庫的更新還包括提供了新的分類系統(tǒng),增加了細(xì)胞毒性、化學(xué)修飾、鏈間鍵、手性等新的注釋字段等。促使DRAMP成為國內(nèi)外最重要的抗菌肽數(shù)據(jù)庫之一,在全球生物學(xué)數(shù)據(jù)庫中位列前5%。
論文另一個重要成果是基于數(shù)據(jù)庫中訂書肽數(shù)據(jù)和信息,基于機(jī)器學(xué)習(xí)方法構(gòu)建了抗革蘭氏陰性菌的活性預(yù)測模型,其中AutoGluon和GBDT模型表現(xiàn)最佳,準(zhǔn)確率達(dá)到77.9%。基于這些模型,設(shè)計并篩選出5個潛在的Magainin II衍生訂書抗菌肽,為新型訂書肽的研發(fā)奠定了基礎(chǔ),并可促進(jìn)機(jī)器學(xué)習(xí)及人工智能技術(shù)在多肽藥物設(shè)計領(lǐng)域的應(yīng)用。
