我們?nèi)粘=佑|到的計算機大多是由硅和晶體管構(gòu)成。隨著科技的發(fā)展,科學(xué)家已在嘗試超越電子計算機,利用生物分子來實現(xiàn)計算機的功能。
作為一個全新領(lǐng)域,DNA計算機就是一種生物形式的計算機。一支1.5毫升的試管中可容納1萬億臺DNA計算機,運算速度可達(dá)每秒10億次,而計算能耗僅有傳統(tǒng)電腦的10億分之一。發(fā)展至今,DNA計算機已能夠?qū)κ謱懙募坠俏摹?shù)字、希臘文字和英文進(jìn)行識別和分類。
待到DNA計算技術(shù)成熟的那一天,它與人體的結(jié)合,或許會像貼上一片創(chuàng)可貼一樣簡單。那時,它或可隨人意念而動,利用人體本身的能量,來完成電子計算機難以實現(xiàn)的醫(yī)療診斷和治療任務(wù),或?qū)⒔o人類文明帶來質(zhì)的飛躍。
▲DNA計算機已能對手寫的甲骨文、數(shù)字、希臘文字和英文進(jìn)行識別和分類。
不同于常見的電子計算機,DNA計算機是一種生物形式的計算機,以DNA分子作為“硬件”,以分子之間的化學(xué)反應(yīng)作為“算法”。在DNA計算機中,一系列生物分子以溶液形態(tài)組合,因此也有人稱之為“液態(tài)電腦”。
相較于傳統(tǒng)電子計算機,DNA計算機具有體積小、運算速度快、能耗極低等優(yōu)勢。自1994年“DNA計算機”的概念誕生以來,其優(yōu)點被越來越多的科學(xué)家所認(rèn)識,紛紛投入到該領(lǐng)域的研究中。
作為所有現(xiàn)存計算設(shè)備中最有望與人體良好融合、同時不對人體產(chǎn)生副作用的智能設(shè)備,DNA人工智能的發(fā)展?jié)摿χ蟛豢上蘖?。最近,利用DNA分子的超強“學(xué)習(xí)”和“記憶”能力,科學(xué)家用DNA人工智能實現(xiàn)了對手寫字跡的識別。
試管里的“智慧混合物”
DNA計算機設(shè)計和構(gòu)建的基石是DNA分子特殊的結(jié)構(gòu)。
眾所周知,DNA是由四種基本核苷酸組成:腺嘌呤(A)、胞嘧啶(C)、鳥嘌呤(G)和胸腺嘧啶(T)。其中,A、T和G、C之間彼此配對,兩條具有特定核苷酸組合的DNA單鏈可以構(gòu)成類似于拉鏈的雙螺旋結(jié)構(gòu)。
在科學(xué)家看來,正是這些特定的配對模式使得DNA分子具備了構(gòu)建計算設(shè)備的巨大潛力。人們可以將運算對象編碼到DNA的核苷酸序列中,再通過不同DNA分子之間的化學(xué)反應(yīng)來完成計算。
以DNA分子為“硬件”的DNA計算機,相較于傳統(tǒng)的電子計算機有著多重優(yōu)勢:
第一,DNA計算機的體積更小,一支1.5毫升的小試管就能容納1萬億個DNA計算機。
第二,DNA計算機的運算速度更快,可達(dá)每秒10億次。所有電腦問世以來的總運算量只相當(dāng)于DNA計算機十幾小時的計算量,科學(xué)家已在嘗試多種方法,以進(jìn)一步加快DNA計算機的運行速度。
第三,DNA計算機的能耗更低,僅相當(dāng)于普通電腦的10億分之一。
第四,DNA計算機具有并行性。電子計算機的運算是按照指令順序進(jìn)行的,而DNA獨特的分子間作用形式,使得數(shù)以億計的DNA計算機可在同一試管中處理不同問題,大大提高了計算效率。
1994年,DNA電腦與生物電腦之父、圖靈獎得主、美國南加州大學(xué)教授雷納德·阿德勒曼建立了世界上第一臺DNA計算機,并用它解決了一個經(jīng)典數(shù)學(xué)問題——“哈密頓路徑問題”。
▲DNA電腦與生物電腦之父雷納德·阿德勒曼
這是一個開創(chuàng)性的大事件。美國貝爾實驗室的物理學(xué)家艾倫·米爾斯說:“我們所做的不再是連線路,而是將大量的DNA裝進(jìn)罐子,加入鹽和酶,然后加以培養(yǎng),于是不同的DNA分子就開始互相尋找配對。”但是這個階段的計算機并不具備通用性,距離實際計算還差得很遠(yuǎn)很遠(yuǎn)。
2004年,日本學(xué)者岡本秋光、田中一雄和齋藤勛正式提出了“通用性DNA計算機”這一概念。基于簡單的兩條單鏈DNA以堿基互補配對原則形成雙鏈DNA的過程,研究人員構(gòu)建了一系列簡單的DNA計算機。
2006年,美國加州理工學(xué)院教授埃里克·溫弗里提出了一種全新的反應(yīng)體系,開創(chuàng)了一種新的邏輯電路構(gòu)建途徑。在這一反應(yīng)體系中,不存在各種非DNA物質(zhì)輔助的DNA計算。溫弗里和他的研究在科學(xué)史上留下了濃墨重彩的一筆。
2011年,美國加州理工學(xué)院生物工程系錢璐璐博士使用DNA構(gòu)建了人工神經(jīng)網(wǎng)絡(luò),解決了經(jīng)典的機器學(xué)習(xí)問題——識別潦草的數(shù)字字跡。DNA神經(jīng)網(wǎng)絡(luò)可將輸入的分子字跡分為九個類別,每個類別代表從1到9的九個手寫數(shù)字中的一個。這項工作成為人工智能與合成生物分子電路成功“合體”的重要里程碑。
優(yōu)勢獨到的DNA計算機應(yīng)用前景十分樂觀,它的“輸入”可以是細(xì)胞質(zhì)中的RNA、蛋白質(zhì)或其他化學(xué)物質(zhì),而“輸出”則是很容易被識別的信號,例如顏色變化等。
顛覆性機遇與挑戰(zhàn)并存
雷納德·阿德勒曼的偉大發(fā)現(xiàn),證明了生命細(xì)胞和計算是有聯(lián)系的。在這個化學(xué)、生物學(xué)和計算機科學(xué)的交叉領(lǐng)域里,還有著巨大的謎團等待人們?nèi)ヌ剿骱徒沂尽?/p>
近年來,隨著技術(shù)的逐步發(fā)展和成熟,DNA測序與合成的成本不斷下降,DNA計算機在醫(yī)學(xué)領(lǐng)域顯現(xiàn)出極強的競爭力。目前,它已經(jīng)能夠被用于人工培養(yǎng)腎細(xì)胞,以及快速準(zhǔn)確診斷禽流感、西尼羅河等病毒感染。由于它能檢測細(xì)胞內(nèi)生物信息的變化,因此可以用于癌癥、心臟病、動脈硬化等疾病的診斷,甚至還能幫助盲人恢復(fù)視覺。
在信息技術(shù)領(lǐng)域,DNA計算機有望被用于研究邏輯、破譯密碼、情報分析或超大規(guī)模信息處理等業(yè)務(wù)?,F(xiàn)有安全系統(tǒng)的安全性和可靠性主要源于以現(xiàn)有計算能力破解密碼需要幾十年、幾百年時間,而DNA計算機的計算速度和并行性會使原本的安全系統(tǒng)“潰不成軍”。
DNA計算機甚至可以實現(xiàn)對電子計算機的控制。有研究將DNA計算機隱藏在生物樣本中,通過預(yù)先編程,在檢測樣本的過程中入侵電子計算機的應(yīng)用程序,獲取其中信息,并使之按照DNA計算機的意圖運行。
另一方面,隨著DNA計算機的不斷發(fā)展,人們發(fā)現(xiàn)DNA分子能夠儲存海量信息,且具有驚人的并行計算能力。這使人們意識到,DNA計算機蘊藏巨大商業(yè)價值。2002年,日本公司首次研制出能夠投入到商業(yè)應(yīng)用的DNA計算機。緊接著,美國加州斯克里普斯研究所和以色列理工學(xué)院的科學(xué)家聯(lián)合開發(fā)出了一種DNA計算機,可用于破譯存儲在DNA芯片中的加密圖像。
▲DNA計算機運行原理示意圖。
盡管發(fā)展迅速、充滿機遇,但DNA計算機還有很多問題亟待克服。
首先,DNA計算機得依靠DNA級聯(lián)反應(yīng)完成復(fù)雜計算任務(wù)。DNA級聯(lián)反應(yīng)是指把前一個反應(yīng)的“輸出”作為“輸入”引發(fā)后一個反應(yīng)。隨著計算規(guī)模不斷擴展,DNA級聯(lián)反應(yīng)的數(shù)目也會不斷增加,從而導(dǎo)致計算速度不斷下降,完成計算任務(wù)所消耗的時間就會不斷延長。當(dāng)級聯(lián)反應(yīng)數(shù)為7時,通常需要6到10個小時來完成反應(yīng)。因此從目前來看,DNA計算機的規(guī)模及其復(fù)雜性還不能無限擴大。
其次,大規(guī)模的DNA計算機需要在一支試管中使用大量(數(shù)萬億個)DNA分子執(zhí)行計算任務(wù),這使得DNA計算機的設(shè)計難度隨著規(guī)模的擴大迅速上升,副反應(yīng)也會增加。因此,平衡計算機的規(guī)模、計算速度和執(zhí)行計算的DNA分子數(shù)目至關(guān)重要,構(gòu)建具有更強大計算能力的人工分子反應(yīng)網(wǎng)絡(luò)仍存在極大挑戰(zhàn)。
邁出復(fù)雜識別第一步
目前人工智能中常用的卷積神經(jīng)網(wǎng)絡(luò),是一類強大的機器學(xué)習(xí)模型,網(wǎng)絡(luò)具有稀疏連接和權(quán)重共享的特征。與大多數(shù)機器學(xué)習(xí)模型相比,卷積神經(jīng)網(wǎng)絡(luò)能夠以更低的復(fù)雜度實現(xiàn)更復(fù)雜的計算任務(wù)??茖W(xué)家自然不會放過在這種模型上嘗試DNA分子計算。
華東師范大學(xué)化學(xué)與分子工程學(xué)院裴昊教授團隊一直致力于DNA計算機的設(shè)計和開發(fā)?;谠诤怂峄瘜W(xué)方面的研究基礎(chǔ),面向分析化學(xué)、計算機科學(xué)與分子生物學(xué)的交叉融合發(fā)展,課題組針對發(fā)展超大規(guī)模DNA分子反應(yīng)網(wǎng)絡(luò)這一關(guān)鍵科學(xué)難題,與長期從事人工智能與分子科學(xué)研究的朱通課題組合作,建立了一種DNA卷積神經(jīng)網(wǎng)絡(luò)的系統(tǒng)實現(xiàn)策略。簡言之,就是使用模仿人腦功能的卷積神經(jīng)網(wǎng)絡(luò),讓DNA計算機“學(xué)習(xí)”大量訓(xùn)練數(shù)據(jù),“記憶”32個類別的分子字跡。
最近,國際權(quán)威學(xué)術(shù)期刊《自然·機器智能》報道了裴昊團隊設(shè)計的一種新的DNA計算模塊——“開關(guān)門”,用以在分子水平上實現(xiàn)卷積神經(jīng)網(wǎng)絡(luò),進(jìn)而完成對32類圖譜的識別和分類。
在計算任務(wù)中,手寫字符首先被轉(zhuǎn)化為12×12的正方形網(wǎng)格上的25個像素格點,被稱為“分子筆跡”。這意味著,每個“分子筆跡”都由144個DNA分子庫中的任意25個DNA分子組成。接下來,研究人員構(gòu)建了兩個簡單的DNA計算機,成功實現(xiàn)了兩類“分子筆跡”在360°平面上不同旋轉(zhuǎn)角度下的識別,以及以“火”“土”“木”“水”“天”“氣”“人”和“生”這八個甲骨文字作為目標(biāo)“記憶”模式的分類任務(wù)。
在這項工作中,裴昊研究組進(jìn)一步構(gòu)建了具有兩層電路結(jié)構(gòu)的DNA計算機,通過粗分類(語言粗略分類)和細(xì)分類(特定的手寫符號)兩個步驟,實現(xiàn)了32個類別的模式識別。這是現(xiàn)有的能夠識別最多種類圖譜的DNA計算機。
值得一提的是,完成這項任務(wù)的整個DNA卷積神經(jīng)網(wǎng)絡(luò)只需512類不同的DNA分子,這一數(shù)量遠(yuǎn)遠(yuǎn)低于已經(jīng)被報道的DNA神經(jīng)網(wǎng)絡(luò)正確運行所需的DNA分子數(shù),揭示了利用卷積神經(jīng)網(wǎng)絡(luò)能夠在大規(guī)模DNA計算機中有效減少使用的DNA分子數(shù)目,這對未來的DNA計算機設(shè)計具有重要意義。
在這篇論文中,研究人員還提出了一種簡單的循環(huán)凍融策略——將DNA計算機在液氮中迅速冷凍之后再在37℃下解凍,并多次循環(huán)這一操作。循環(huán)凍融策略成功地將DNA計算機的計算時間從幾小時縮短到幾分鐘。
這一DNA計算機具有超高的計算能力,且能夠?qū)崿F(xiàn)對復(fù)雜信息的準(zhǔn)確分類,并可能賦予DNA計算機類似于生物神經(jīng)網(wǎng)絡(luò)的“智能”行為。原則上,基于DNA的計算設(shè)備可通過連接感官輸入,使用數(shù)百個目標(biāo)作為輸入,促進(jìn)在疾病診斷、表達(dá)模式分析和精準(zhǔn)醫(yī)學(xué)中的更廣泛應(yīng)用。
盡管科學(xué)家們才剛剛開始探索在分子體系中創(chuàng)造人工智能的方法,但DNA計算機的潛力不可低估?;蛟S在不遠(yuǎn)的將來,與人體合二為一的DNA計算機會成為人體的一部分,甚至是外部延伸,完成電子計算機難以實現(xiàn)的醫(yī)療診斷和治療任務(wù)。
來源:宇宙解碼