如果讓你給千年后的世界留下這個時代的訊息,你會選擇用什么樣的方式呢?
寫在紙上?難以保存。
刻在石頭上?保存久,但容量有限。
存進電子芯片?容量大了,但長期放置不用,數(shù)據(jù)容易消失。
……
難道就沒有一種更靠譜的存儲介質(zhì)嗎?別急,大自然早已給我們準備了一套精妙的存儲方案。
它誕生自亙古,跨越億年延用至今,各類生物紛紛表示“真香”;
它有長達521年的半衰期,讓長期保存不是笑談;
它的裝載量驚人又不占空間,1g就中能裝進一千億張 DVD 光盤的內(nèi)容,1kg能裝下全球所有的信息數(shù)據(jù)[1]!
沒錯,它就是譜寫生命密碼的 DNA 。
流行語我都懂,但具體要怎么實現(xiàn)?| bilibili網(wǎng)頁截圖
“小維納斯”的誕生
DNA存儲并不是一個新鮮的概念,早在1960年代中期,蘇聯(lián)物理學家米哈伊爾·薩米奧維奇·紐曼(Mikhail Samiolvich Neumann)就大膽設(shè)想用DNA作為數(shù)據(jù)存儲載體,可惜1970年前尚不會合成DNA,甚至連怎樣閱讀生物DNA中的信息還八字沒一撇(初代DNA測序技術(shù)到1977年才出現(xiàn))。因此,在很長的一段時間里,寫進DNA的浪漫只能在科幻故事里出現(xiàn)。
真正在技術(shù)上第一次把人類文明寫進DNA,始于1988年的一場藝術(shù)與科學的碰撞。
麻省理工學院的科學藝術(shù)家喬·戴維斯(Joe Davis)參考古老的日耳曼符文,用簡單的線條設(shè)計了一個代表 生命 ( life ) 和 女性地球 ( female earth ) 的“基因藝術(shù)品” ——小維納斯(Microvenus)[2]
通過和哈佛大學的研究者合作,這個有著“繁育女神”意味的符號被轉(zhuǎn)換為簡單的二進制代碼(0代表亮點,1代表暗點),隨后他們按數(shù)字0或1重復的次數(shù)來定義對應(yīng)的堿基,即:
C=X,
T=XX,
A=XXX,
G=XXXX.
(例如其中的一段二進制編碼10101011100010000100001000010000100,便被翻譯為DNA序列CCCCCCAACGCGCGCGCT。)
戴維斯將這段編譯著符文的DNA導入大腸桿菌中,伴隨著大腸桿菌的每一次復制分裂,“小維納斯”便成為永生的藝術(shù)。
戴維斯在論文中展示的"小維納斯"形象 | 參考文獻[2]
“打破印刷記錄”的丘奇之書
隨著21世紀的到來,DNA合成和測序技術(shù)也有了跨時代的飛躍。當科學的齒輪咬合,技術(shù)這架馬車緩緩啟動,曾經(jīng)前衛(wèi)的藝術(shù)品便成為了拉動變革的那只手。
DNA存儲量和電子存儲的比較 | Nature
2012年,哈佛大學的合成生物學家喬治·丘奇(George Church)率先率領(lǐng)團隊將自己的一本659kb的書順利存進了DNA中,這便是在合成生物學領(lǐng)域頗具盛名的 丘奇之書 ,這本書中有53426個單詞,11個JPG圖像和一個JavaScript程序[3]。 只需要通過DNA測序技術(shù)重新獲得堿基排列順序,再反向把堿基翻譯回二進制,就可以通過電子設(shè)備進行閱讀啦 。
這里還有一個有趣的梗,因為含有丘奇之書的DNA 被導入了大腸桿菌,并通過大腸桿菌的增殖得到了 900 億份復制品,于是這本書真真切切的成了出版史上被 “印刷”次數(shù)最多的一本書 !
丘奇對DNA存儲領(lǐng)域的貢獻并未止步于增加“書”的厚度,他與及合作們還實現(xiàn)了從文本信息存儲到視頻信息存儲的突破。
借鑒天然狀態(tài)下三堿基編碼20種氨基酸及終止密碼子,丘奇等人將21種顏色信息與三種堿基的排列進行組合對應(yīng)(下圖),再命令C=00, T=01, A=10,G=11,將堿基序列轉(zhuǎn)化為二進制序列(下圖)[4]。通過這種方式,丘奇等人順利實現(xiàn)了圖片存儲。
丘奇等人使用的圖片編譯方法 | 參考文獻[4]
丘奇等人編碼所用圖片及從DNA序列中重新解碼后獲得的結(jié)果 | 參考文獻[4]
通過進一步精簡編譯方式,直接用四位二進制數(shù)對應(yīng)三個堿基的組合,丘奇團隊還將一張“奔跑的馬”的GIF格式的小動畫存進了DNA里。
丘奇等人使用的GIF編譯方法 | 參考文獻[4]
“奔跑的馬“GIF | 參考文獻[4]
推動DNA存儲技術(shù)發(fā)展的并不只有丘奇的團隊,其他諸多研究團隊也做出了杰出的貢獻。而被寫入DNA中的,不乏許多非常有紀念意義的歷史資料,譬如 DNA的莎士比亞的十四行詩 、 馬丁?路德金的演講原聲 等等,這些或許也是科學家們的赤子之心吧。
散發(fā)著工業(yè)的氣息的“斯坦福兔兔”
想讓DNA存儲從實驗室走到尋常百姓家,合適的DNA“容器”必不可少。畢竟讓大家在家里培養(yǎng)大腸桿菌、提取DNA不太現(xiàn)實。
那么,未來的DNA存儲器會是什么樣子的呢?
兔兔那么可愛,不如就把它做成兔兔吧!
3D打印斯坦福兔子GIF | 參考文獻[5]
2020年,一只看似平平無奇的3D打印版斯坦福兔子(Stanford Bunny,是一個常用的計算機圖形三維測試模型)在蘇黎世聯(lián)邦理工學院的實驗室中誕生[5]。
在這只兔兔的身體里嵌著數(shù)以萬計微小珠子,而每顆珠子內(nèi)都有幾十個DNA 分子,科學家們將打印兔兔的藍圖直接存進了這些DNA里,因此這只兔兔的體內(nèi)包含著3.7億份“克隆”自己的數(shù)據(jù)代碼。 從它身上取下一小塊,獲得DNA,再解碼并復制其中的信息,便能制作出下一代的兔兔 ( 沒錯,就是套娃兔行為!)。
這便是蘇黎世聯(lián)邦理工學院羅伯特·格拉斯(Robert Grass)和以色列亞尼夫·埃利希(Yaniv Erlich)實驗室的DoT(DNA of Things)構(gòu)架,即將DNA分子融合到一種功能性材料中,從而創(chuàng)建具有存儲功能的實物,除了斯坦福兔兔,這些科學家們還制作出存有視頻的眼鏡。
內(nèi)含DNA的3D打印兔 | 參考文獻[5]
這項技術(shù)的魅力不僅在于實現(xiàn)了DNA存儲的實體化,更在于其中使用的“DNA噴泉(DNA Foutain)”保障了極高的儲存量和容錯量,使得缺失了80%的信息依然可以正確解碼文件。復制到第五代的兔子依然保存著和初代完全一樣的外形,這就說明信息在經(jīng)過五輪的傳遞依舊高保真!
兔兔經(jīng)過多代復制后保存穩(wěn)定 | 參考文獻[5]
新時代前的巨石
斯坦福兔兔或許能帶著我們蹦蹦跳跳的闖進DNA存儲的新時代,但前方依舊有不少難題亟待科學家們解決。
第一道門 檻就是價格,當前的DNA存儲實在是太燒錢了!
要知道,DNA目前的合成成本在3元一個堿基!在建國70周年時,華大基因曾將記錄著開國大典的一段視頻存進了DNA里,僅僅十幾kb就花費了近四萬元人民幣!
但是希望還是有的,華大基因公司預(yù)測DNA合成成本正以每年3-4倍的速度下降,美國Catalog公司也大膽預(yù)測未來進行1MB數(shù)據(jù)DNA存儲成本將不到0.001美分。
目前的DNA存儲技術(shù)還十分“燒錢” | Pixabay
其次, DNA存儲及讀取的速度都不如人意 ,目前比較快的記錄是Catalog公司存入數(shù)據(jù)的速度4Mbps,盡管一天便可裝滿一個手機的內(nèi)存,但顯然還有很大的提升空間。
DNA存儲還有一個非常令人頭疼的問題,那就是 不方便靈活的存儲及調(diào)用,更難以修改 ,雖然現(xiàn)在研究員們已經(jīng)想到了通過加標簽序列的方式提高信息讀取的效率,但具體運用還有不小的阻礙。
無論如何,我們不妨保持著樂觀美好的幻想,也許在不久的將來,我們便可以在贈與心愛之人的玫瑰中寫入DNA編碼的告白。
《月色真美》劇照
參考文獻
[1] Extance, A.J.N., How DNA could store all the world's data. 2016. 537(7618): p. 22-24.
[2] Davis, J., Microvenus. Art Journal, 1996. 55(1): p. 70-74.
[3] Church, G.M., Y. Gao, and S. Kosuri, Next-Generation Digital Information Storage in DNA. Science, 2012. 337(6102): p. 1628.
[4] Shipman, S.L., et al., CRISPR–Cas encoding of a digital movie into the genomes of a population of living bacteria. Nature, 2017. 547(7663): p. 345-349.
[5] Koch, J., et al., A DNA-of-things storage architecture to create materials with embedded memory. Nature Biotechnology, 2020. 38(1): p. 39-43.
作者:一只哈代
編輯:Yuki
排版:洗碗