版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

2021年度十大科學(xué)突破,AI這項前所未有的突破上榜

學(xué)術(shù)頭條
一起見證人類探索征途上的每一個重大突破。
收藏

2021 年 11 月 17 日,Science 雜志公布了 2021 年的年度科學(xué)突破榜單,AlphaFold 和 RoseTTA-fold 兩種基于人工智能預(yù)測蛋白質(zhì)結(jié)構(gòu)的技術(shù)位列榜首。

除此之外,年度科學(xué)突破還包括:開發(fā)針對 COVID-19 的抗病毒藥、μ 子的新測量、火星地震觀測、從土壤恢復(fù)古代人類 DNA、CRISPR 體內(nèi)應(yīng)用、對早期人類發(fā)展的新見解、使用迷幻類藥物治療 PTSD、開發(fā)用于治療傳染病的單克隆抗體以及聚變能生成的進步。

此外,Science 雜志還評選了三個年度科學(xué)故障(breakdowns),包括實現(xiàn)氣候目標(biāo)的希望渺茫、阿爾茨海默病藥物引發(fā)憤怒,以及科學(xué)家們因新冠疫情受到排斥和攻擊。

本文主要介紹本年度最重要的科學(xué)突破——基于人工智能的蛋白質(zhì)結(jié)構(gòu)預(yù)測。

結(jié)構(gòu)生物學(xué)持續(xù) 50 多年的困惑

我們都知道,蛋白質(zhì)是生命活動的主要承擔(dān)者,甚至毫不夸張的說,沒有蛋白質(zhì)就沒有生命。因此,長期以來蛋白質(zhì)都是生命科學(xué)工作者研究的重點。而其中,蛋白質(zhì)的結(jié)構(gòu)更是眾多生命科學(xué)工作者研究的熱點,畢竟其主要功能是由結(jié)構(gòu)決定的。

1957 年,John C. Kendrew 和 Max F. Perutz 通過 X 射線晶體學(xué)確定了第一個蛋白質(zhì)結(jié)構(gòu)。不久之后,Christian B. Anfinsen Jr. 提出蛋白質(zhì)的結(jié)構(gòu)在熱力學(xué)上是穩(wěn)定的,似乎可以根據(jù)蛋白質(zhì)的氨基酸序列來預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)。

然而,蛋白質(zhì)的結(jié)構(gòu)復(fù)雜性遠(yuǎn)超人們的想象。依據(jù)中心法則,蛋白質(zhì)主要是由 DNA 轉(zhuǎn)錄成 RNA,再翻譯成肽鏈后組裝而來,一個蛋白質(zhì)分子是由一條或幾條多肽鏈組成,多肽鏈則折疊成特有的形狀。同時,蛋白質(zhì)分子的專一形狀是由4個層次的結(jié)構(gòu)決定的,包括一級、二級、三級和四級結(jié)構(gòu),前一級結(jié)構(gòu)決定后一級結(jié)構(gòu)。

其中多肽鏈的氨基酸序列是一級結(jié)構(gòu),一級結(jié)構(gòu)中的部分肽鏈卷曲或折疊產(chǎn)生二級結(jié)構(gòu)。二級結(jié)構(gòu)經(jīng)過一系列的構(gòu)象改變形成三維結(jié)構(gòu)即三級結(jié)構(gòu),一般為球狀或纖維狀。三級結(jié)構(gòu)有特定的結(jié)構(gòu)域,形成結(jié)合位點或調(diào)節(jié)位點,可以結(jié)合特定結(jié)構(gòu)的物質(zhì),行使特定的功能。兩條或兩條以上的多肽鏈組成的蛋白質(zhì),可以形成四級結(jié)構(gòu)。

圖 | 蛋白質(zhì) 3D 結(jié)構(gòu)(來源:Nat Commun)

因此,從 Christian B. Anfinsen Jr. 理論提出至今 50 多年的時間里,科學(xué)家始終無法解決蛋白質(zhì)折疊的問題,對于蛋白質(zhì)結(jié)構(gòu)的了解依舊十分有限。

而近年來,隨著冷凍電子顯微鏡技術(shù)的發(fā)展,可以在沒有結(jié)晶樣本的條件下觀察蛋白質(zhì)結(jié)構(gòu),使得蛋白質(zhì)結(jié)構(gòu)研究有所進展。不過,冷凍電鏡是非常昂貴的設(shè)備,只有極少數(shù)的實驗室才有條件配備,對于廣大科研工作者非常不友好。因此,生命科學(xué)界亟需新的方法解決蛋白質(zhì)折疊問題。

AI 助力解決蛋白質(zhì)結(jié)構(gòu)預(yù)測難題

隨著計算機科學(xué)的發(fā)展,此前曾有學(xué)者提出利用計算機模型解決蛋白質(zhì)折疊問題。雖然這一想法是可行的,但是在隨后數(shù)十年的時間里,人們開發(fā)的各種計算機模型預(yù)測蛋白結(jié)構(gòu)的準(zhǔn)確性始終有限。

在過去 25 年中,國際蛋白質(zhì)結(jié)構(gòu)預(yù)測大賽(CASP)一直關(guān)注這個領(lǐng)域的進展,試圖尋找能夠完美解決蛋白質(zhì)折疊問題的計算機模型。直到第 14 屆大賽 CASP14 大賽成功舉辦,DeepMind 旗下的 AlphaFold 系統(tǒng)在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面表現(xiàn)出了無與倫比的準(zhǔn)確性。

該比賽的評價方式是將參賽者提供的解決方案與“黃金試驗標(biāo)準(zhǔn)”進行對比,用 GDT 評分衡量準(zhǔn)確性,范圍為 0-100,GDT 分?jǐn)?shù)在 90 分左右,即可視為對人類實驗方法具備競爭力。而 DeepMind 旗下的 AlphaFold 系統(tǒng)總分竟然達到了 92.4,和實驗的誤差在 1.6,即使是在最難的沒有同源模板的蛋白質(zhì)上面,這個分?jǐn)?shù)也達到了了恐怖的 87.0 。

同時,AlphaFold 的神經(jīng)網(wǎng)絡(luò)能在幾分鐘內(nèi)預(yù)測出一個典型蛋白質(zhì)的結(jié)構(gòu),還能預(yù)測較大蛋白質(zhì)(比如一個含有 2180 個氨基酸、無同源結(jié)構(gòu)的蛋白質(zhì))的結(jié)構(gòu)。該模型能根據(jù)每個氨基酸對其預(yù)測可靠性進行精確預(yù)估,方便研究人員使用其預(yù)測結(jié)果。

圖 |研究人員使用 RoseTTAFold 預(yù)測的人類白細(xì)胞介素 12 與其受體結(jié)合的 3D 視圖(來源:UW Medicine Institute for Protein Design)

隨后,在今年 7 月份,華盛頓大學(xué)醫(yī)學(xué)院生物化學(xué)系教授、蛋白質(zhì)設(shè)計研究所所長 David Baker 領(lǐng)導(dǎo)一支計算生物學(xué)家團隊,成功開發(fā)一款名為 RoseTTAFold 的工具,基于深度學(xué)習(xí),能夠根據(jù)有限的信息快速準(zhǔn)確地預(yù)測出目標(biāo)蛋白質(zhì)的結(jié)構(gòu),達到與 AlphaFold2 不相上下的準(zhǔn)確度。

不僅如此,RoseTTAFold 所需的計算耗能與計算時間均比 AlphaFold2 還要低:僅用一臺游戲計算機,在短短十分鐘內(nèi)就可以可靠地計算出蛋白質(zhì)結(jié)構(gòu)。更值得注意的是,RoseTTAFold 的代碼和服務(wù)器完全免費提供給科學(xué)界!

圖 | David Baker(來源:華盛頓大學(xué)官網(wǎng))

自 7 月以來,相關(guān)程序已被 140 多個獨立科研團隊從 GitHub 免費下載,來自世界各地的科學(xué)家現(xiàn)在正在使用 RoseTTAFold 來構(gòu)建蛋白質(zhì)模型,以加速相關(guān)領(lǐng)域的研究。

同樣在今年 7 月份,DeepMind 創(chuàng)始人兼首席執(zhí)行官 Demis Hassabis 也在 Nature 雜志上分享了AlphaFold的開源代碼,并發(fā)表了系統(tǒng)的完整方法論,詳盡細(xì)致說明 AlphaFold 是如何做到精確預(yù)測蛋白質(zhì)3D結(jié)構(gòu)的。也就是說,這款強大蛋白質(zhì)結(jié)構(gòu)預(yù)測模型已經(jīng)是完全免費的。

至此,兩種強大的基于人工智能的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型全部免費開放,科研工作者可以隨時利用這兩款模型獲取蛋白質(zhì)的空間結(jié)構(gòu),而無需對蛋白質(zhì)進行結(jié)晶或使用昂貴的冷凍電鏡進行研究。

在同步配發(fā)的評論文章里,Science 雜志的主編 Holden Thorp 對此表示,“首先,它解決了困擾生命科學(xué)近 50 年的蛋白質(zhì)折疊問題,好比物理學(xué)中的引力波,科學(xué)家們數(shù)十年如一日,堅持不懈最終才攻克這一難題;其次,這一技術(shù)改變了未來結(jié)構(gòu)生物學(xué)的規(guī)則,就像冷凍電鏡那樣,加速生命科學(xué)的發(fā)展;此外,完全免費意味著它是真正適合所有人的蛋白質(zhì)預(yù)測模型?!?/p>

參考資料:

https://www.eurekalert.org/news-releases/937705?

www.science.org/doi/10.1126/science.abn5795

撰文:朱哼哼

編審:王哈哈

排版:李雪薇

來源:學(xué)術(shù)頭條

評論
下河社區(qū)e站
少師級
創(chuàng)新過去有的,探究未曾有的,時光是輪回的。
2022-01-19
飛馬騰空
太師級
2022-01-15
科普有我,張莊初中。
太師級
人工智能這項生命科學(xué)領(lǐng)域的革命性突破,為探索人體與生命的本質(zhì)鋪平了道路。
2022-01-07