近日,東南大學(xué)師生團(tuán)隊(duì)成功將該校校訓(xùn)“止于至善”存入一段DNA序列,實(shí)現(xiàn)了DNA存儲(chǔ)技術(shù)的新突破,并將相關(guān)成果發(fā)表在國(guó)際學(xué)術(shù)期刊《科學(xué)·進(jìn)展》上。
劉宏團(tuán)隊(duì)改進(jìn)傳統(tǒng)的化學(xué)合成方法,運(yùn)用電化學(xué)方法,將東南大學(xué)校訓(xùn)“止于至善”4個(gè)字“翻譯”為DNA序列,并將其存儲(chǔ)在電極上,隨后又成功讀取出來(lái)。
“我們的重要突破點(diǎn)就是實(shí)現(xiàn)了DNA合成與測(cè)序環(huán)節(jié)的一體化,實(shí)現(xiàn)一體化后,DNA存儲(chǔ)的效率和準(zhǔn)確性會(huì)提高,更容易實(shí)現(xiàn)大規(guī)模的數(shù)據(jù)存儲(chǔ)。”
近年來(lái)該領(lǐng)域迎來(lái)一個(gè)新的研究方向——DNA存儲(chǔ),這項(xiàng)研究有助于解決大數(shù)據(jù)時(shí)代數(shù)據(jù)存儲(chǔ)難題。”
1994年,比爾蓋茨坐在33萬(wàn)張紙上,手中拿著一張光盤告訴全世界:一張光盤能記錄的內(nèi)容,比這33萬(wàn)張紙都多。
“未來(lái)5-15年,中國(guó)科學(xué)家將在數(shù)據(jù)中心,手中拿著一管DNA告訴全世界:這里面記錄的是當(dāng)前全世界的數(shù)據(jù)?!?日前,中國(guó)科學(xué)院院士樊春海對(duì)未來(lái)DNA存儲(chǔ)技術(shù)的前景作出如此預(yù)判。
什么是DNA存儲(chǔ)技術(shù)?為何它被寄予如此厚望?
DNA存儲(chǔ)技術(shù)取得新突破
隨著互聯(lián)網(wǎng)和人工智能等信息技術(shù)和數(shù)字技術(shù)的快速發(fā)展,信息量呈指數(shù)級(jí)飛快增長(zhǎng),磁盤、硬盤、閃存等傳統(tǒng)存儲(chǔ)介質(zhì)已經(jīng)逐漸不能滿足全世界范圍內(nèi)數(shù)據(jù)存儲(chǔ)的需要。
在此背景下,信息技術(shù)和生物技術(shù)交融下的DNA存儲(chǔ)技術(shù)逐漸走入我們的視野。
近日,東南大學(xué)師生團(tuán)隊(duì)成功將該校校訓(xùn)“止于至善”存入一段DNA序列,實(shí)現(xiàn)了DNA存儲(chǔ)技術(shù)的新突破,并將相關(guān)成果發(fā)表在國(guó)際學(xué)術(shù)期刊《科學(xué)·進(jìn)展》上。
東南大學(xué)師生團(tuán)隊(duì)研發(fā)的DNA存儲(chǔ)電極。供圖/劉宏團(tuán)隊(duì)
“DNA是一種序列確定的生物大分子。DNA存儲(chǔ)技術(shù)就是將生物DNA分子進(jìn)行編碼,從而在DNA序列上存儲(chǔ)信息?!?東南大學(xué)生物電子學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室劉宏教授介紹道。
劉宏團(tuán)隊(duì)改進(jìn)傳統(tǒng)的化學(xué)合成方法,運(yùn)用電化學(xué)方法,將東南大學(xué)校訓(xùn)“止于至善”4個(gè)字“翻譯”為DNA序列,并將其存儲(chǔ)在電極上,隨后又成功讀取出來(lái)。“因?yàn)槲冶旧砭陀须娀瘜W(xué)的背景,電極是我們最常用到的工具,所以就想到以這個(gè)為切入點(diǎn)來(lái)研究?!?/p>
“我們的重要突破點(diǎn)就是實(shí)現(xiàn)了DNA合成與測(cè)序環(huán)節(jié)的一體化,目前大多數(shù)DNA存儲(chǔ)的合成和測(cè)序是分開(kāi)的,實(shí)際上這是一個(gè)比較偏實(shí)驗(yàn)室的基礎(chǔ)研究。”劉宏表示,“實(shí)現(xiàn)一體化后,DNA存儲(chǔ)的效率和準(zhǔn)確性會(huì)提高,更容易實(shí)現(xiàn)大規(guī)模的數(shù)據(jù)存儲(chǔ)?!?/p>
談及研究初衷,劉宏表示:“東南大學(xué)生物電子學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,一直從事生物電子方面的研究,近年來(lái)該領(lǐng)域迎來(lái)一個(gè)新的研究方向——DNA存儲(chǔ),于是我們?cè)谝荒昵伴_(kāi)始了這項(xiàng)研究。更重要的是,這項(xiàng)研究有助于解決大數(shù)據(jù)時(shí)代數(shù)據(jù)存儲(chǔ)難題?!?/p>
據(jù)國(guó)際數(shù)據(jù)公司IDC統(tǒng)計(jì),全球數(shù)據(jù)信息總量將從2018年的30ZB(Zettabyte,十萬(wàn)億億字節(jié))增長(zhǎng)到2025年的163ZB。
“現(xiàn)在數(shù)據(jù)產(chǎn)生的速度,遠(yuǎn)遠(yuǎn)要超過(guò)我們生產(chǎn)這些存儲(chǔ)介質(zhì)的速度,所以必須要有新的介質(zhì)來(lái)解決這個(gè)難題?!眲⒑瓯硎?。
而將DNA作為存儲(chǔ)介質(zhì),劉宏認(rèn)為其有著天然的優(yōu)勢(shì):一是信息密度高,據(jù)微軟研究院此前估計(jì),1立方毫米的DNA就能夠存儲(chǔ)1個(gè)EB(Exabyte,百億億字節(jié))的數(shù)據(jù);二是存儲(chǔ)時(shí)間長(zhǎng)、穩(wěn)定性強(qiáng),在合適的條件下,可以存儲(chǔ)上萬(wàn)年;三是存儲(chǔ)能耗很低。
從正式研究到取得新的突破,劉宏團(tuán)隊(duì)只用了一年多時(shí)間?!暗芏嗷A(chǔ)研究其實(shí)早就開(kāi)始了。”劉宏說(shuō)道。2013年,劉宏結(jié)束博士后工作回到國(guó)內(nèi),一直在做電化學(xué)傳感方面的研究,也正是這8年的沉淀,為DNA存儲(chǔ)技術(shù)的快速突破打下了堅(jiān)實(shí)的基礎(chǔ)。
劉宏教授(左)與學(xué)生觀察DNA存儲(chǔ)電極。供圖/劉宏團(tuán)隊(duì)
“我們?cè)谡撐耐陡宓耐瑫r(shí),還在繼續(xù)完善研究,補(bǔ)充了很多新數(shù)據(jù),所以雖然論文只有幾頁(yè)紙,但我們的計(jì)算材料大概有幾十頁(yè)。”回想起論文投稿環(huán)節(jié),劉宏表示:“做科研其實(shí)每一個(gè)環(huán)節(jié)都不容忽視,從投稿到修改稿件,我們用了差不多三四個(gè)月時(shí)間?!?/p>
談及為何會(huì)選擇將校訓(xùn)存入DNA序列,劉宏直言:“可能因?yàn)樾S?xùn)就刻在每一個(gè)東南大學(xué)師生的DNA里?!?/p>
DNA存儲(chǔ)技術(shù)面臨哪些挑戰(zhàn)?
在全球數(shù)據(jù)信息總量呈指數(shù)級(jí)增長(zhǎng)的背景下,DNA存儲(chǔ)技術(shù)開(kāi)始在不同領(lǐng)域探索應(yīng)用。因其存儲(chǔ)優(yōu)越性,DNA 存儲(chǔ)技術(shù)也已引起多個(gè)國(guó)家和地區(qū)的重視。
美國(guó)是進(jìn)行相關(guān)規(guī)劃布局最多的國(guó)家,其涵蓋了從數(shù)據(jù)“寫(xiě)入”到“讀取”的多個(gè)技術(shù)過(guò)程;歐盟雖未明確出臺(tái)文件政策進(jìn)行 DNA 存儲(chǔ)技術(shù)布局,但也對(duì)相關(guān)研發(fā)進(jìn)行了資助;日本、澳大利亞等國(guó)在合成生物學(xué)領(lǐng)域的重視程度也進(jìn)一步提升;我國(guó)也已布局相關(guān)領(lǐng)域,我國(guó)“十四五”規(guī)劃明確提出“加快布局量子計(jì)算、量子通信、神經(jīng)芯片、DNA存儲(chǔ)等前沿技術(shù)”。
企業(yè)也早已敏銳看到了這一領(lǐng)域的廣闊前景。美國(guó)微軟公司是最早研究DNA存儲(chǔ)技術(shù)的公司之一,2016年微軟宣布購(gòu)買1000萬(wàn)條DNA用于研究數(shù)據(jù)儲(chǔ)存。2019年,華為宣布成立戰(zhàn)略研究院,表示主要研發(fā)前沿技術(shù),比如光計(jì)算、DNA存儲(chǔ)及原子制造。在今年的華為全球分析師大會(huì)上,華為董事、戰(zhàn)略研究院院長(zhǎng)徐文偉表示將要借助DNA存儲(chǔ)來(lái)突破超大存儲(chǔ)空間模型和編碼技術(shù),打破容量墻。
對(duì)于DNA存儲(chǔ)技術(shù)的應(yīng)用場(chǎng)景,劉宏表示,DNA存儲(chǔ)適合應(yīng)用于有長(zhǎng)期信息存儲(chǔ)需求的地方,主要起到存儲(chǔ)功能,不需要經(jīng)常讀取信息。
盡管DNA存儲(chǔ)技術(shù)潛力巨大,但就其應(yīng)用來(lái)看,依然面臨挑戰(zhàn)。
據(jù)了解,目前DNA存儲(chǔ)技術(shù)還受到數(shù)據(jù)覆蓋和重寫(xiě)、隨機(jī)讀寫(xiě)等方面的制約?!坝绕涫荄NA合成的成本和效率,仍然是限制DNA存儲(chǔ)技術(shù)發(fā)展的主要挑戰(zhàn)?!眲⒑瓯硎尽?jù)業(yè)內(nèi)分析師估計(jì),目前DNA存儲(chǔ)200MB數(shù)據(jù),需要耗資80萬(wàn)美元。
“但相信經(jīng)過(guò)技術(shù)的不斷發(fā)展,成本會(huì)越來(lái)越低?!?劉宏說(shuō)道。
雖然研究已經(jīng)取得了重要進(jìn)展,但劉宏認(rèn)為這還只是一個(gè)初步成果?!盀榇鎯?chǔ)更多數(shù)據(jù),下一步我們要做基于大規(guī)模電極陣列的數(shù)據(jù)存儲(chǔ)。我們現(xiàn)走的只是第一步,用DNA做存儲(chǔ)介質(zhì)實(shí)際上還有很長(zhǎng)的路要走?!眲⒑暾f(shuō)道。
來(lái)源:中國(guó)網(wǎng)信雜志(ID:newmedia_2014)
本文已獲授權(quán),轉(zhuǎn)載請(qǐng)聯(lián)系原作者
本文有科普中國(guó)水印的圖片均來(lái)自版權(quán)圖庫(kù),圖片內(nèi)容不授權(quán)轉(zhuǎn)載