版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

今年的諾獎(jiǎng)不簡(jiǎn)單,能救命!

李雷
原創(chuàng)
中科院生物學(xué)博士。擅長(zhǎng)生物、醫(yī)學(xué)、健康。年更新近300圖文
收藏

瑞典皇家科學(xué)院10月9日宣布,David Baker、Demis Hassabis和John M. Jumper獲得2024年諾貝爾化學(xué)獎(jiǎng)。你別說今年這個(gè)諾獎(jiǎng),我在現(xiàn)實(shí)中用過,所以先給個(gè)好評(píng)。

如果說生理醫(yī)學(xué)獎(jiǎng)的microRNA是我自己前兩年水了一篇論文有所接觸,那么這個(gè)AI結(jié)構(gòu)預(yù)測(cè)是我用它幫助過現(xiàn)實(shí)中的人。

01,蛋白結(jié)構(gòu)預(yù)測(cè)幫了大忙

一個(gè)很熟悉的朋友懷孕了,做了個(gè)基因檢測(cè),結(jié)果出問題了,孩子身上出現(xiàn)了一個(gè)罕見變異,這個(gè)變異甚至不在常見的數(shù)據(jù)庫里,但是根據(jù)預(yù)測(cè),這個(gè)變異是負(fù)面的。

那么問題來了,這個(gè)孩子該不該要?所以朋友很擔(dān)心,她也問了遺傳醫(yī)生,但是遺傳醫(yī)生給出的結(jié)論屬于模棱兩可的,所以就找到了我。當(dāng)時(shí)我的壓力也很大,所以就用盡全身的技能來做解讀這個(gè)變異。

1,遺傳家系分析。這是我做的第一步,就是用家系分析,因?yàn)槿祟悓?duì)于遺傳學(xué)乃至生命科學(xué)的認(rèn)知非常淺顯,所以家系分析反而是現(xiàn)實(shí)發(fā)生的相對(duì)可靠的證據(jù),或者直白的說,如果家系里有這個(gè)變異且無癥狀,其實(shí)就是很扎實(shí)的證據(jù)。

結(jié)果家系分析顯示,這個(gè)變異是來自于父本,但是父本并沒有表現(xiàn)癥狀。而這個(gè)朋友的第一個(gè)女兒也是雜合體,同樣沒表現(xiàn)癥狀(性別不一致)。

按理說差不多了,不過這個(gè)時(shí)候還有一點(diǎn)擔(dān)心,那就是,這個(gè)疾病發(fā)病年齡可能在青春期,所以目前還不完全根據(jù)父本以及第一個(gè)女兒來確定第二個(gè)孩子的狀況。

2,DNA相關(guān)預(yù)測(cè)。這個(gè)就是做了一系列分析,包括變異可能的遺傳影響,用各種數(shù)據(jù)來預(yù)測(cè),但是基于DNA的預(yù)測(cè)畢竟還是有限,因?yàn)檫€是要落到發(fā)揮功能的蛋白質(zhì)上。

3,蛋白質(zhì)預(yù)測(cè)。于是,就要找蛋白質(zhì),但是,蛋白質(zhì)是需要高級(jí)結(jié)構(gòu)的,而這個(gè)傳統(tǒng)是只能找結(jié)構(gòu)生物學(xué)來做。那么,必須有人做過這個(gè)蛋白質(zhì)才會(huì)看到結(jié)構(gòu),從而進(jìn)一步分析結(jié)構(gòu)。這時(shí)候發(fā)現(xiàn),這個(gè)蛋白,并沒有被測(cè)過結(jié)構(gòu),怎么辦?

擱在過去,這就麻煩了,但是現(xiàn)在有AI蛋白結(jié)構(gòu)預(yù)測(cè)以及相關(guān)數(shù)據(jù)庫。于是我就去做這個(gè),并且對(duì)照數(shù)據(jù)庫里的AI 蛋白結(jié)構(gòu)。

結(jié)果發(fā)現(xiàn),這個(gè)點(diǎn)發(fā)生變異的位置,并不是該蛋白發(fā)揮作用的核心結(jié)構(gòu)域位點(diǎn),而是一個(gè)較為邊緣的位置,而根據(jù)一系列計(jì)算,發(fā)現(xiàn)這個(gè)位置似乎也并不是特別重要。

把這些結(jié)論綜合起來后,我把相應(yīng)的結(jié)論給了朋友,最后朋友思考后決定按照概率還是選擇生下了這個(gè)寶寶。到目前,寶寶一切正常。

當(dāng)然,這也只能到這里了,因?yàn)檫@是目前生物學(xué)的極限了,往后誰也沒法去保證。所以,我很感激蛋白質(zhì)AI結(jié)構(gòu)預(yù)測(cè),因?yàn)槭澜绲鞍浊f,如果一個(gè)個(gè)測(cè)過去,得猴年馬月才能搞定,但是有了AI預(yù)測(cè)蛋白質(zhì),速度快多了,而且對(duì)現(xiàn)實(shí)有很大的幫助。

下面聊聊為什么要解決蛋白質(zhì)結(jié)構(gòu)的問題。

02,為什么要解決蛋白質(zhì)結(jié)構(gòu)的問題

蛋白質(zhì)是生命的核心執(zhí)行者,這是一個(gè)很重要的點(diǎn)。為什么呢?提到生物,大家很多最熟悉的是DNA,當(dāng)然,如果深入一些,會(huì)熟悉叫做中心法則的東西。

DNA,你有我有大家都有,如果DNA發(fā)生了變化,那么就會(huì)導(dǎo)致差異,而你我每個(gè)人都攜帶著上千萬個(gè)DNA變異,這也是每個(gè)人差別的緣故。但是,這個(gè)差別,只在DNA上是意義不大的。

因?yàn)椋珼NA這東西,是攜帶信息為主的,就比如,我們每個(gè)細(xì)胞基本上都有一套DNA(紅細(xì)胞、生殖細(xì)胞略例外),所以我們提DNA的時(shí)候用各種組織都方便。

而DNA要想發(fā)揮作用,那首先就要經(jīng)過轉(zhuǎn)錄,變成RNA。

RNA當(dāng)然復(fù)雜,比如除了編碼蛋白質(zhì)的mRNA,還有一堆其他RNA,就是非編碼RNA,當(dāng)然,非編碼RNA也是有很多作用,比如今年拿到諾獎(jiǎng)的microRNA就是屬于這一系列,此外還有l(wèi)ncRNA(長(zhǎng)鏈非編碼RNA)等也是熱點(diǎn),這些RNA對(duì)于基因有調(diào)節(jié)作用。

但是,RNA的意義,也就到這里了,由于RNA易降解且結(jié)構(gòu)相對(duì)簡(jiǎn)單,所以,它還是撐不起生命執(zhí)行者這個(gè)步驟。

因此必須到了另外一個(gè)更加實(shí)體的結(jié)構(gòu),那就是蛋白質(zhì)。所以,蛋白質(zhì)是生命的核心承擔(dān)者,蛋白質(zhì)是構(gòu)成細(xì)胞的基本物質(zhì),是結(jié)構(gòu)物質(zhì),是催化的酶,是運(yùn)輸?shù)妮d體,是免疫的抗體,是調(diào)節(jié)的激素,可以說,蛋白質(zhì)是生命的物質(zhì)基礎(chǔ),是生命活動(dòng)的主要承擔(dān)者。

但是,蛋白質(zhì)和DNA不一樣,盡管DNA、RNA也有空間結(jié)構(gòu),但是遠(yuǎn)不像蛋白質(zhì)那樣,必須要復(fù)雜的空間結(jié)構(gòu)才能完成功能。

所以,必須要有空間結(jié)構(gòu),蛋白質(zhì)才能發(fā)揮作用,舉個(gè)例子,酶

必須有那個(gè)結(jié)構(gòu)才能發(fā)揮作用,如果這個(gè)結(jié)構(gòu)發(fā)生了變化,那么結(jié)合就會(huì)受影響。所以,要想研究蛋白質(zhì), 必須解析蛋白質(zhì)結(jié)構(gòu)。

03,如何解析蛋白質(zhì)結(jié)構(gòu)?

如何解析蛋白質(zhì)結(jié)構(gòu)?傳統(tǒng)辦法就是用結(jié)構(gòu)解析,這東西,耗時(shí)耗力,難度很大。舉個(gè)例子,新聞報(bào)道的一個(gè)做結(jié)構(gòu)生物學(xué)的女博士,連續(xù)4年幾乎每天工作17小時(shí)!

做啥呢?就是努力讓蛋白以天然狀態(tài)結(jié)晶,這也是被認(rèn)為是天然的蛋白質(zhì)結(jié)構(gòu)。

可以想象,做這個(gè)東西,工作量之大難以想象。正因?yàn)槿绱耍龀鰜磉@東西,也往往能發(fā)頂刊,因?yàn)楹芑A(chǔ)嘛。


04,AI蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)


理論上,蛋白質(zhì)是一個(gè)個(gè)氨基酸構(gòu)成的,這些氨基酸本身有各種理化性質(zhì),比如兩性解離、等電點(diǎn)等。但當(dāng)很多氨基酸出現(xiàn)的時(shí)候,那么這些性質(zhì)疊加起來就不容易去分析了。

不過我們還是應(yīng)該相信,哪怕是復(fù)雜的生命現(xiàn)象,背后也是有基本的理化性質(zhì),這也是為什么很多諾獎(jiǎng)物理和化學(xué)竟然和生物有關(guān)。于是,我們需要努力的找規(guī)律,而這個(gè)規(guī)律的依據(jù)之一就是已有的蛋白質(zhì)結(jié)構(gòu),這些分析過結(jié)構(gòu)的蛋白質(zhì)是序列明確、結(jié)構(gòu)清晰的,對(duì)他們進(jìn)行足夠的分析,那么就可以尋找到一些規(guī)律,進(jìn)而因此來預(yù)測(cè)出蛋白質(zhì)的結(jié)構(gòu)。

比如我電腦里現(xiàn)在還存著以前學(xué)習(xí)的文件,就是關(guān)于蛋白質(zhì)結(jié)構(gòu)分析預(yù)測(cè)的。

當(dāng)然,這些預(yù)測(cè)還是相對(duì)原始的。而有了機(jī)器學(xué)習(xí),尤其是AI 之后,這個(gè)學(xué)習(xí)速度要快多了,計(jì)算機(jī)的強(qiáng)大遠(yuǎn)超過我們的認(rèn)知,能夠發(fā)現(xiàn)一些我們不曾注意到的細(xì)節(jié),而這些細(xì)節(jié)也會(huì)進(jìn)一步加強(qiáng)對(duì)蛋白質(zhì)的預(yù)測(cè),使得蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)越來越精準(zhǔn)。

舉個(gè)例子,今年nature上的蛋白質(zhì)預(yù)測(cè)文章,

可以將蛋白質(zhì)的預(yù)測(cè)性能提升到最大值的97%。這個(gè)預(yù)測(cè)效率已經(jīng)非常高了。

事實(shí)上很多時(shí)候,我們不一定需要100%精準(zhǔn)的蛋白質(zhì)結(jié)構(gòu),只需要相對(duì)精準(zhǔn)的知道就可以了,那么接下來后續(xù)開發(fā)就容易多了。所以,AI幫了大忙。

05,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)大有可為

其實(shí)蛋白質(zhì)結(jié)構(gòu)意義很大,比如研究藥物就是很典型的,尤其是生物藥物,精準(zhǔn)的結(jié)構(gòu)可以更好的尋找到有效藥物,比傳統(tǒng)化學(xué)小分子選擇更多,且效果更好。而且,在其他方面,比如疫苗預(yù)測(cè)上也很有意義。比如nature十大人物曹云龍,被稱為新冠預(yù)測(cè)者。

他的技術(shù)之一就是依據(jù)蛋白質(zhì)結(jié)構(gòu)來。比如,他發(fā)現(xiàn)新冠蛋白的某個(gè)位點(diǎn)可以降低病毒的免疫原性,幫助病毒逃避免疫反應(yīng),那么就可以猜測(cè),未來的新出現(xiàn)毒株有可能從這個(gè)點(diǎn)上被篩選出來,于是我們就可以提前針對(duì)這個(gè)點(diǎn)做疫苗,到時(shí)候出現(xiàn)了就可以提前免疫。

類似的有很多,甚至我們目前面臨的很多難解的疾病,未來都可能從蛋白質(zhì)結(jié)構(gòu)的角度來尋找解決辦法,而傳統(tǒng)蛋白質(zhì)結(jié)構(gòu)研究速度是跟不上的,AI 可以。

所以,AI預(yù)測(cè)結(jié)構(gòu),還真的大有可為。

評(píng)論
科普科普知識(shí)的搖籃!
太師級(jí)
AI蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)不僅革新了生命科學(xué)研究,更在疾病預(yù)防與治療上展現(xiàn)巨大潛力,是未來生命科學(xué)領(lǐng)域的重要突破方向。此次諾獎(jiǎng)的授予,是對(duì)其在現(xiàn)實(shí)世界中挽救生命能力的肯定。
2024-10-11
沖沖
大學(xué)士級(jí)
這些諾貝爾獎(jiǎng)的頒發(fā),不僅是對(duì)科學(xué)家個(gè)人成就的認(rèn)可,更是對(duì)他們工作對(duì)人類健康和福祉所做貢獻(xiàn)的肯定。通過這些發(fā)現(xiàn)和發(fā)明,我們能夠更好地理解生命科學(xué)的基本機(jī)制,并開發(fā)出新的治療手段,從而挽救生命!
2024-10-11
科普lyjzgf
庶吉士級(jí)
蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)的發(fā)展,尤其是AI技術(shù)的應(yīng)用,極大地加速了我們對(duì)生命科學(xué)的理解,并為醫(yī)學(xué)和生物技術(shù)的進(jìn)步開辟了新的道路。
2024-10-11