你知道嗎?我們?nèi)梭w中有十幾萬種蛋白質(zhì),而所有的蛋白質(zhì)都僅由20種氨基酸構(gòu)成。那這些氨基酸是怎么構(gòu)成一個(gè)個(gè)復(fù)雜的蛋白質(zhì)的呢?科學(xué)家們又是怎么去探索不同蛋白質(zhì)的功能的?聽說最近科學(xué)家把最先進(jìn)的人工智能技術(shù)應(yīng)用在蛋白預(yù)測上,這到底是怎么一回事?
今天我們來聊聊,與我們?nèi)梭w所有功能息息相關(guān)的蛋白質(zhì),以及蛋白質(zhì)結(jié)構(gòu)的預(yù)測之路。
蛋白質(zhì)是結(jié)構(gòu)和功能都非常多樣化的分子,而它的功能之所以能那么多種多樣,是由于氨基酸在分子中的排列和組合不同。氨基酸呢,是蛋白質(zhì)中最小的分子單位,兩個(gè)氨基酸手牽手可以脫水縮合成一個(gè)二肽,以此類推多個(gè)氨基酸就能縮合成一個(gè)肽鏈了,按照一定順序縮合成的肽鏈就叫蛋白質(zhì)的一級結(jié)構(gòu)。
那么問題來了,一條肽鏈上不同的氨基酸是怎么排列的呢?這就取決于基因啦!基因是DNA中有功能的片段,它們通過轉(zhuǎn)錄、翻譯和表達(dá),產(chǎn)生出有功能的蛋白質(zhì),從而控制細(xì)胞的生命活動(dòng),進(jìn)而控制整個(gè)生命體。
那這些復(fù)雜的蛋白質(zhì)是如何形成的?當(dāng)不同的氨基酸依據(jù)基因的指示排列成肽鏈以后,就會發(fā)生卷曲或折疊,形成二級結(jié)構(gòu),這時(shí)候氨基酸的排列要么就像一個(gè)螺旋的曲面,或者會形成一個(gè)折疊片。
當(dāng)二級結(jié)構(gòu)再次發(fā)生多樣化的折疊,形成球狀或者纖維狀的三維立體結(jié)構(gòu)時(shí),就形成了三級結(jié)構(gòu),這種特定的折疊方式使得不同的肽鏈具有不同的形狀,來執(zhí)行不同的功能。
你以為這就結(jié)束了嗎?其實(shí)如果一個(gè)蛋白質(zhì)的肽鏈不止一條,那么多條肽鏈就還會進(jìn)一步卷曲折疊形成四級結(jié)構(gòu)。
因此啊,蛋白質(zhì)的折疊方式——也就是它的結(jié)構(gòu),決定了它特定的功能,也決定了我們生物體的功能,所以預(yù)測未知的蛋白質(zhì)結(jié)構(gòu)非常重要,能幫助我們解鎖生命體功能的未解之謎。
這也就是為什么科學(xué)家一直在不斷探索蛋白質(zhì)的結(jié)構(gòu)的原因了。在過去的幾十年時(shí)間里,我們先從X-射線晶體衍射圖譜中看到了DNA的雙螺旋結(jié)構(gòu),在之后的40年間,科學(xué)家們依靠這種方法解析出了絕大部分的蛋白質(zhì)結(jié)構(gòu)。
然而,有些蛋白的結(jié)晶是很困難的,為此20世紀(jì)70年代,英國劍橋的科學(xué)家們開發(fā)出了冷凍電鏡解析蛋白質(zhì)結(jié)構(gòu)的方法,從此,我們揭開了一些大分子與難以結(jié)晶的膜蛋白結(jié)構(gòu)的神秘面紗,一些基礎(chǔ)的受體蛋白與轉(zhuǎn)錄復(fù)合物等這些生命活動(dòng)中最基礎(chǔ)的分子結(jié)構(gòu)被解析了出來。這個(gè)領(lǐng)域也產(chǎn)生了好幾個(gè)諾貝爾獎(jiǎng),重要性就可想而知啦。
之后呢,伴隨著互聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展,計(jì)算機(jī)算法的能力突飛猛進(jìn),前兩年大紅大紫的deepmind公司,在人機(jī)大戰(zhàn)中一戰(zhàn)成名,如今又轉(zhuǎn)戰(zhàn)到另一個(gè)更為復(fù)雜的領(lǐng)域——預(yù)測生命大分子結(jié)構(gòu),deepmind開發(fā)出了AlphaFold,能直接實(shí)現(xiàn)序列到結(jié)構(gòu)的神奇預(yù)測,甚至是極具挑戰(zhàn)性的蛋白質(zhì)相互作用的預(yù)測,也可以用AlphaFold和其他算法相結(jié)合來巧妙地解決了。
除了Deepmind,美國人也不甘示弱,華盛頓大學(xué)西雅圖分校的大衛(wèi)·貝克(David·Baker)團(tuán)隊(duì)利用RoseTTAFold[r?u?zet?] 軟件打造了一個(gè)強(qiáng)有力的蛋白質(zhì)結(jié)構(gòu)解析工具,能夠在基因序列不明確的情況下補(bǔ)全蛋白質(zhì)結(jié)構(gòu)缺失的部分。
對于這一當(dāng)紅熱門科技賽道,咱們國內(nèi)自然也不甘示弱,取得了一定的可喜進(jìn)展,但只是在DeepMind的開源數(shù)據(jù)上進(jìn)行二次開發(fā),沒有真正的原創(chuàng)技術(shù),實(shí)現(xiàn)從0到1的突破仍需要一段時(shí)間。
相信在未來,更先進(jìn)、更創(chuàng)新的技術(shù)與方法也一定會讓蛋白質(zhì)預(yù)測的技術(shù)更加強(qiáng)大。
本文為科普中國·星空計(jì)劃扶持作品
團(tuán)隊(duì)名稱:深究科學(xué)
審核:陶寧
出品:中國科協(xié)科普部
監(jiān)制:中國科學(xué)技術(shù)出版社有限公司、北京中科星河文化傳媒有限公司