CRISPR-Cas9最著名的功能是作為編輯DNA的實驗室工具,但它的自然功能是作為免疫系統(tǒng)的一部分,幫助某些微生物對抗病毒。
麻省理工學(xué)院生物化學(xué)家張鋒團隊聯(lián)合美國國家生物技術(shù)信息中心研究人員開發(fā)出一種名為FLSHclust的新算法,在數(shù)十億個蛋白質(zhì)序列中發(fā)現(xiàn)了188個罕見且以前未知的CRISPR連接基因模塊。新發(fā)現(xiàn)為利用CRISPR系統(tǒng)和了解微生物蛋白質(zhì)的功能多樣性提供了新機會。
“我們對CRISPR系統(tǒng)的多樣性感到驚訝。”麻省理工學(xué)院生物化學(xué)家張鋒,“做這種分析可以讓我們一石二鳥:既研究生物學(xué),也可能找到有用的東西?!?/p>
單細胞細菌和古細菌使用CRISPR系統(tǒng)來保護自己免受噬菌體的侵害。CRISPR系統(tǒng)通常由兩部分組成:識別并結(jié)合噬菌體DNA或RNA的“引導(dǎo)RNA”分子,以及在引導(dǎo)RNA指示的位點切割或干擾遺傳物質(zhì)的酶。
到目前為止,研究人員已經(jīng)確定了六種CRISPR系統(tǒng),分別從I命名到VI。它們有不同的特性,包括使用酶的類型,以及它們?nèi)绾巫R別、結(jié)合和切割RNA或DNA。用于基因工程的CRISPR - cas9系統(tǒng)被歸類為II型,其他類型的CRISPR特征可能對其他方面有用。
為了在自然界中找到不同的CRISPR系統(tǒng),張鋒團隊開發(fā)了一種名為FLSHclust的算法,可分析公共數(shù)據(jù)庫中的基因序列。這些數(shù)據(jù)庫包含來自細菌和古細菌的數(shù)十萬個基因組,數(shù)億個未與特定物種相關(guān)聯(lián)的序列,以及數(shù)十億個編碼蛋白質(zhì)的基因。FLSHclust通過尋找基因序列之間的相似性,并將它們分組成大約5億個簇,發(fā)現(xiàn)了CRISPR相關(guān)基因。
通過觀察這些簇的預(yù)測功能,研究人員發(fā)現(xiàn)了大約13萬個基因以某種方式與CRISPR相關(guān),其中188個是以前從未見過的,他們在實驗室測試了幾個基因以了解它們的作用。實驗結(jié)果揭示了CRISPR系統(tǒng)用來攻擊噬菌體的各種策略,包括解開DNA雙螺旋結(jié)構(gòu),以及以允許基因插入或刪除的方式切割DNA。他們還發(fā)現(xiàn)了“抗CRISPR”的DNA片段,這可能有助于噬菌體逃避細菌的防御。
在這些新基因中,有一種完全未知的靶向RNA的CRISPR系統(tǒng)的代碼,該團隊將其命名為VII型。研究通訊作者之一、美國國家生物技術(shù)信息中心生物學(xué)家 Eugene Koonin表示,找到新的CRISPR系統(tǒng)越來越難了,VII型和任何其他尚未被識別的CRISPR類型在自然界中一定是極其罕見的,這可能需要付出巨大的努力才能找到下一種類型。
巴黎薩克雷大學(xué)微生物學(xué)家Christine Pourcel說,很難知道某些類型的CRISPR系統(tǒng)是罕見的,因為它們對微生物通常沒有用處,還是專門適應(yīng)于生活在特定環(huán)境中的生物體。她補充說,由于研究中使用的基因數(shù)據(jù)庫包括與特定生物體沒有聯(lián)系的基因組片段,因此很難研究一些新系統(tǒng)的作用。
新西蘭達尼丁奧塔哥大學(xué)生物化學(xué)家Chris Brown表示,該算法本身就是一項重大進步,因為它將使研究人員能夠在不同物種之間尋找其他類型的蛋白質(zhì)。
“這是生物化學(xué)家的寶庫?!钡聡R爾堡大學(xué)微生物學(xué)家Lennart Randau對此表示贊同。他說,下一步將是找出酶和系統(tǒng)工作的機制,以及如何將它們用于生物工程?!耙恍〤RISPR蛋白會隨機切割DNA,對工程毫無用處。但它們在檢測DNA或RNA序列方面非常精確,可能會成為很好的診斷或研究工具。”
研究人員認為,現(xiàn)在說VII型CRISPR系統(tǒng)或FLSHclust鑒定的任何其他基因是否對基因工程有幫助還為時過早,但它們有一些可能有用的特性。例如,VII型病毒只涉及很少的基因,這些基因可以很容易地裝入病毒載體并傳遞到細胞中。相比之下,該團隊發(fā)現(xiàn)的其他一些系統(tǒng)包含非常長的引導(dǎo)RNA,這可能使它們能夠以前所未有的準(zhǔn)確性靶向特定的基因序列。