常州網(wǎng)站制作企業(yè)百度平臺(tái)我的訂單
一.蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
1.什么是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)?
蛋白質(zhì)是生命活動(dòng)的基本單位,其結(jié)構(gòu)決定了功能,對(duì)蛋白質(zhì)結(jié)構(gòu)的研究有助于對(duì)其功能的研究。上世紀(jì)50年代初,Anfinsen等人提出蛋白質(zhì)的空間結(jié)構(gòu)是由其一級(jí)結(jié)構(gòu)決定。
蛋白質(zhì)都是由20種不同的L型α氨基酸連接形成的多聚體,在形成蛋白質(zhì)后,這些氨基酸又被稱為殘基。
蛋白質(zhì)的分子結(jié)構(gòu)可劃分為四級(jí),以描述其不同的方面:
? 蛋白質(zhì)一級(jí)結(jié)構(gòu):組成蛋白質(zhì)多肽鏈的線性氨基酸序列。
? 蛋白質(zhì)二級(jí)結(jié)構(gòu):依靠不同氨基酸之間的C=O和N-H基團(tuán)間的氫鍵形成的穩(wěn)定結(jié)構(gòu),主要為α螺旋和β折疊。
? 蛋白質(zhì)三級(jí)結(jié)構(gòu):通過多個(gè)二級(jí)結(jié)構(gòu)元素在三維空間的排列所形成的一個(gè)蛋白質(zhì)分子的三維結(jié)構(gòu)。
? 蛋白質(zhì)四級(jí)結(jié)構(gòu):用于描述由不同多肽鏈(亞基)間相互作用形成具有功能的蛋白質(zhì)復(fù)合物分子。
測(cè)定蛋白質(zhì)序列比測(cè)定蛋白質(zhì)結(jié)構(gòu)容易得多,而蛋白質(zhì)結(jié)構(gòu)可以給出比序列多得多的關(guān)于其功能機(jī)制的信息。
蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)指的是:已知氨基酸序列,通過計(jì)算的手段預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)和空間三維結(jié)構(gòu)。
獲得蛋白質(zhì) 序列數(shù)據(jù)要比獲得結(jié)構(gòu)數(shù)據(jù)簡(jiǎn)單得多, DNA測(cè)序 技術(shù)的突飛猛進(jìn)更使得可直接通過翻譯、推導(dǎo)得 到大量的蛋白質(zhì)序列. 而目前蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù) PDB中所存儲(chǔ)的蛋白質(zhì)三維結(jié)構(gòu)主要通過X 射線晶體衍射和核磁共振成像技術(shù)得到, 兩種實(shí)驗(yàn)方法 均成本不菲, 且有各自的應(yīng)用局限.
截止2016年 5 月, PDB 數(shù)據(jù)庫(kù)中存儲(chǔ)了11萬余條蛋白質(zhì)結(jié)構(gòu) 數(shù)據(jù), 而這只占UniProt中所有蛋白質(zhì)序列數(shù)據(jù)的 1/600, 也就是說只有不到0.2%的蛋白質(zhì)序列擁有 實(shí)驗(yàn)測(cè)定的三維結(jié)構(gòu)。(來自2016年的物理學(xué)報(bào)文章)
2.蛋白質(zhì)結(jié)果預(yù)測(cè)如何實(shí)現(xiàn)?
(1)基于模板的結(jié)構(gòu)預(yù)測(cè)方法:同源建模+穿線方法
由于相似的蛋白質(zhì)序列往往擁有相似的三維結(jié)構(gòu), 這就有了以PDB數(shù)據(jù)庫(kù)中的已知結(jié)構(gòu)為模板的同源建模方法, 它是迄今為止精度最高的一類結(jié)構(gòu)預(yù)測(cè)方法.(來自2016年的物理學(xué)報(bào)文章)
而當(dāng)PDB數(shù)據(jù)庫(kù)中找不到與待預(yù)測(cè)蛋白質(zhì)序列(下文中稱為“目標(biāo) 蛋白”或“目標(biāo)序列”)具有顯著序列相似性的蛋白質(zhì)結(jié)構(gòu)時(shí), 此時(shí)通過穿線方法仍有可能找出與目標(biāo)蛋白具有結(jié)構(gòu)相似性的已知結(jié)構(gòu).
穿線方法——穿線方法實(shí)際上是通過某種策略將序列與結(jié)構(gòu)進(jìn)行比對(duì), 評(píng)估將序列以各種匹配方式“安放”到各個(gè)三維結(jié)構(gòu)上的“舒適”程度, 因此也被稱為折疊辨識(shí)。
注:由于蛋白質(zhì)結(jié)構(gòu) 遠(yuǎn)比序列具有更高的保守性,毫無序列相似性的兩個(gè)蛋白質(zhì)也可能擁有相似的結(jié)構(gòu), 這是穿線法發(fā)揮作用的領(lǐng)域.
(2)無模板的結(jié)構(gòu)預(yù)測(cè)方法——從頭預(yù)測(cè)方法
從頭預(yù)測(cè)方法不依賴于任何已知結(jié)構(gòu), 而是以第一性原理構(gòu)建蛋白質(zhì)折疊力場(chǎng), 再通過相應(yīng)的構(gòu)象搜索方法搜尋目標(biāo)蛋白的天然結(jié)構(gòu).
第一性原理是從頭計(jì)算,不需要任何參數(shù),只需要一些基本的物理常量,就可以得到體系基態(tài)的基本性質(zhì)的原理。
無模板的結(jié)構(gòu)預(yù)測(cè)方法與基于模板的預(yù)測(cè)方法的關(guān)鍵區(qū)別在于: 它們并不依賴于任何一個(gè)完整的結(jié)構(gòu)模 板, 不要求片段所在模板與目標(biāo)蛋白有任何同源性 或結(jié)構(gòu)相似性, 這讓它們具有更大的隨機(jī)性和自由 度, 便于模擬已知結(jié)構(gòu)中不存在的全新結(jié)構(gòu).
1. 構(gòu)象初始化
“基于模板” 和“無模板” 兩類結(jié)構(gòu)預(yù)測(cè)方法的關(guān)鍵區(qū)別——就在于所采取的構(gòu)象初始化方法不同:
基于模板的預(yù)測(cè)方法通過搜索識(shí)別與目標(biāo)蛋白具有同源性或結(jié)構(gòu)相似性的已知結(jié)構(gòu)作為模板而獲得初始化構(gòu)象;(提高序列比對(duì)方法的效率、精度是促進(jìn)同源建模方法發(fā)展的關(guān)鍵.)
無模板的預(yù)測(cè)方法則通常以小的結(jié)構(gòu)片段為起點(diǎn)從頭構(gòu)建初始構(gòu)象. 許多無模板的結(jié)構(gòu)預(yù)測(cè)方法所采用的結(jié)構(gòu)片段裝配就是以預(yù)測(cè)得到的二級(jí)結(jié)構(gòu)、主鏈二面角以及溶劑可及性為依