為了利用人工智能(AI)實(shí)現(xiàn)科學(xué)發(fā)現(xiàn)的自動(dòng)化,研究人員創(chuàng)建了一個(gè)虛擬實(shí)驗(yàn)室。該實(shí)驗(yàn)室通過(guò)幾個(gè)“AI科學(xué)家”——具有明確科學(xué)角色的大型語(yǔ)言模型(LLMs),合作實(shí)現(xiàn)人類科學(xué)家設(shè)定的目標(biāo)。
虛擬實(shí)驗(yàn)室使用幾個(gè)LLMs來(lái)設(shè)計(jì)可以與新型冠狀病毒結(jié)合的抗體片段。圖片來(lái)源:KTSDESIGN/Science Photo Library via Getty
近日在bioRxiv公布的預(yù)印本中,研究人員對(duì)虛擬實(shí)驗(yàn)室進(jìn)行了描述。該實(shí)驗(yàn)室能夠設(shè)計(jì)出一種名為納米體的抗體片段——可以與導(dǎo)致新冠肺炎的病毒結(jié)合,并在短時(shí)間內(nèi)提出近100種這樣的納米結(jié)構(gòu)。
“這些虛擬實(shí)驗(yàn)室的AI科學(xué)家已被證明能夠完成很多任務(wù)?!泵绹?guó)斯坦福大學(xué)的計(jì)算生物學(xué)家James Zou說(shuō),“我們對(duì)探索虛擬實(shí)驗(yàn)室在不同科學(xué)領(lǐng)域的潛力感到非常興奮?!?/p>
美國(guó)科羅拉多大學(xué)安舒茨醫(yī)學(xué)院研究AI醫(yī)療應(yīng)用的高彥君(音)表示,虛擬實(shí)驗(yàn)室“代表了一種將AI視為合作者,而不僅僅是工具的新范式”。但她補(bǔ)充說(shuō),人力投入和監(jiān)督仍然至關(guān)重要?!艾F(xiàn)階段還不能完全信任AI做出的決定?!?/p>
目前,世界各地的科學(xué)家已經(jīng)開始探索LLMs在加快研究方面的潛力,包括培養(yǎng)一名“AI科學(xué)家”執(zhí)行部分任務(wù)——從提出假設(shè)、設(shè)計(jì)實(shí)驗(yàn)到起草論文。但Zou說(shuō),LLMs的大多數(shù)研究都集中在狹窄范圍內(nèi)的實(shí)驗(yàn)應(yīng)用上,而不是探索它們?cè)诳鐚W(xué)科研究中的潛力。
于是,他和同事建立了虛擬實(shí)驗(yàn)室,將不同領(lǐng)域的專業(yè)知識(shí)結(jié)合起來(lái)。
他們首先為虛擬實(shí)驗(yàn)室訓(xùn)練了兩個(gè)AI科學(xué)家:一個(gè)是團(tuán)隊(duì)的首席研究員(PI),擁有AI研究方面的專業(yè)知識(shí);另一個(gè)是“科學(xué)評(píng)論家”,負(fù)責(zé)在整個(gè)過(guò)程中發(fā)現(xiàn)LLMs的錯(cuò)誤和疏忽。他們還為這些AI科學(xué)家設(shè)定了一個(gè)目標(biāo)——設(shè)計(jì)新的納米體靶向新型冠狀病毒,并開發(fā)其他可以實(shí)現(xiàn)這一目標(biāo)的LLMs。
然后,PI進(jìn)一步創(chuàng)建并培訓(xùn)了另外3名AI科學(xué)家,以支持其研究工作。這些“科學(xué)家”中的每一位都接受過(guò)特定學(xué)科的培訓(xùn)——免疫學(xué)、計(jì)算生物學(xué)或機(jī)器學(xué)習(xí)。Zou說(shuō):“這些不同的AI科學(xué)家會(huì)有不同的專業(yè)知識(shí),它們會(huì)一起解決不同類型的科學(xué)問(wèn)題?!?/p>
AI科學(xué)家獨(dú)立處理虛擬PI分配的任務(wù),例如計(jì)算參數(shù)或?yàn)樾碌臋C(jī)器學(xué)習(xí)模型編寫代碼。它們還會(huì)利用其他AI研究工具,如蛋白質(zhì)設(shè)計(jì)工具AlphaFold和Rosetta。一位人類科學(xué)家會(huì)定期通過(guò)“團(tuán)隊(duì)會(huì)議”指導(dǎo)LLMs,并評(píng)估它們的進(jìn)展。
“虛擬實(shí)驗(yàn)室的設(shè)計(jì)是自主的,因此AI科學(xué)家可以相互討論。它們決定要解決什么問(wèn)題,采取什么方法,以及如何實(shí)施這些方法?!盳ou說(shuō),“人類科學(xué)家則專注于提供更高層次的反饋,以指導(dǎo)AI科學(xué)家的研究方向。”
這些AI科學(xué)家最終設(shè)計(jì)出92個(gè)納米體,其中90%以上在驗(yàn)證研究中被證明可以與新型冠狀病毒的原始變體結(jié)合。其中兩個(gè)納米體還顯示出靶向病毒新變種的希望。
研究人員樂(lè)觀地認(rèn)為,虛擬實(shí)驗(yàn)室可以助力多個(gè)領(lǐng)域的科學(xué)研究?!拔覀儼阉O(shè)計(jì)成一個(gè)非常通用的平臺(tái),并利用這些虛擬實(shí)驗(yàn)室的AI科學(xué)家解決不同的科學(xué)問(wèn)題?!盳ou說(shuō)。
但他強(qiáng)調(diào),人工干預(yù)和反饋是虛擬實(shí)驗(yàn)室成功的關(guān)鍵?!拔覀?nèi)匀恍枰?yàn)證和確認(rèn)AI科學(xué)家提出的這些假設(shè),這是進(jìn)行現(xiàn)實(shí)世界實(shí)驗(yàn)的重要之處?!?/p>