版權歸原作者所有,如有侵權,請聯(lián)系我們

2024年諾貝爾化學獎:如何用AI破解蛋白質之謎?

星空計劃
原創(chuàng)
星空計劃運營團隊賬號:活動信息發(fā)布、創(chuàng)作者培育計劃作品發(fā)布等
收藏

圖蟲創(chuàng)意

對于生命而言,蛋白質的重要性,怎么強調都不過分。2024年的諾貝爾化學獎就頒發(fā)給了三位在蛋白質領域做出杰出貢獻的的科學家,他們是David Baker,Demis Hassabis和John M. Jumper。想要理解為什么蛋白質如此重要,以及三位獲獎人的工作,我們就需要先從生命開始說起。

那么,什么是生命呢?如果我們想要將某個東西歸類為生命,那么它就必須符合以下標準:

生命必須維持一個相對穩(wěn)定的內部環(huán)境,比如我們人類需要保持恒定的體溫和鹽平衡。

生命需要對周圍環(huán)境做出反應。比如當我們感覺冷的時候,就會顫抖,這樣會增加摩擦,從而產(chǎn)生熱量。

生命的基本結構和功能單位是細胞。

生命會吸收和轉化營養(yǎng)物質以滿足需求。這就是我們所說的新陳代謝。

生命可以繁殖,它可以無性繁殖和有性繁殖。

但是,假如沒有蛋白質,那么剛才提到的這些標準就都無法滿足!那么什么是蛋白質呢?

蛋白質主要是由20種不同的氨基酸組成的。這些氨基酸可以以無數(shù)種不同的組合,像珍珠一樣串連在一起。蛋白質之所以如此神通廣大,是因為這些珍珠串或者說氨基酸鏈,會扭曲并折疊成特定的三維結構。正是蛋白質的三維結構決定了每一種蛋白質的特定功能。例如,有的蛋白質會形成皮膚、骨骼和肌肉;有的會形成酶,以確保體內化學反應有效進行;有的則會在血液的幫助下,將各種物質輸送到全身。

在過去的50多年里,科學家一直夢想著能夠在只知道氨基酸序列的情況下,預測蛋白質的三維結構。但是這個領域的進展一直非常緩慢,直到2020年。

在那一年,Demis Hassabis和John Jumper開發(fā)了一種人工智能模型,叫AlphaFold2。如果我們知道了氨基酸的序列,那么它就可以預測蛋白質的結構。

為了訓練AlphaFold2,他們給它輸入了大量的數(shù)據(jù)。具體來說,通過向AlphaFold2輸入已知的氨基酸序列,以及它們形成的蛋白質的三維結構,AlphaFold2學會了理解序列及其結構之間的模式和關系。我們可以把這類比于教一個小孩識別和搭建各種樂高模型。一開始,你會給他很多完整的樂高玩具,比如宇宙飛船、汽車和房子。通過看到這么多的例子,他學會了識別哪些部件應該放在哪里,以及如何自己組裝類似的組件。他從他見過的所有不同的模型中學習模式和技術。

經(jīng)過訓練后,AlphaFold2就可以通過新獲取的氨基酸序列,來預測蛋白質的結構。具體來說,當它接收到一個它以前沒有見過的新氨基酸序列時,它會開始將這個新序列與它從訓練數(shù)據(jù)中學到的大量序列和結構進行比較。通過識別新序列和記憶中的序列之間的模式和相似性,AlphaFold2會嘗試將新的序列組裝成一個合理的三維結構,它會測試不同的組裝方式,并利用它的知識來估計哪種方式最有可能是正確的。結果表明,AlphaFold2是極其強大的,它成功地解決了化學家苦苦思索了50年的問題。

如今,在AlphaFold2的幫助下,研究人員可以預測發(fā)現(xiàn)的幾乎所有2億個蛋白質的結構。全世界已經(jīng)有200多萬人使用它,并取得了重大的科研進展。

現(xiàn)在,我們已經(jīng)知道Demis Hassabis和John Jumper采用的方法是從氨基酸序列開始預測蛋白質的結構,但David Baker則采用了相反的方法:他從一個蛋白質的三維結構開始,然后使用一個名為Rosetta的計算機程序,來找出構建這個結構所需要的氨基酸。

David Baker的團隊會使用Rosetta來設計一個具有特定結構和功能的蛋白質的三維模型。然后,Rosetta會計算出哪些氨基酸會自然地聚集在一起形成設計的蛋白質結構。根據(jù)它確定的氨基酸序列,他們在實驗室合成了這種蛋白質,然后使用了一種叫做X射線晶體學的精確方法來確定蛋白質的實際三維結構,看看它是否符合他們的設計。

結果表明實際結構與設計的假想蛋白質結構是相匹配的。這證實了Rosetta可以準確地預測產(chǎn)生特定三維蛋白質結構所需的氨基酸序列。

現(xiàn)在,科學家不僅可以從氨基酸序列開始,創(chuàng)造一個完整的蛋白質;也可以從一個想要的蛋白質結構開始,找出相應的氨基酸序列來創(chuàng)造它。這種雙重能力就像既能按照指示用積木制作玩具,又能通過先決定玩具的結構,然后找出使用哪些積木來發(fā)明新玩具。

總而言之,更好地了解蛋白質的三維結構不僅可以增加我們對疾病的了解,也為未來開發(fā)新的藥物鋪平了道路。同樣重要的是,我們現(xiàn)在有能力創(chuàng)造出具有新功能的蛋白質,這對于設計新的納米材料、開發(fā)靶向藥物,以及制造疫苗都具有重大意義。

因此,三位獲獎人所開發(fā)的工具不僅讓我們能夠更加深入地了解生命,也使我們能夠創(chuàng)造一個更加健康和創(chuàng)新的未來。

本文為科普中國·創(chuàng)作培育計劃扶持作品
作者:李兆瀅

審核:梁前進 北京師范大學生命科學學院 教授

出品:中國科協(xié)科普部

監(jiān)制:中國科學技術出版社有限公司、北京中科星河文化傳媒有限公司

內容資源由項目單位提供

評論
科普ZSL
學士級
已閱讀
2024-10-22