版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

第一份人類“泛基因組”草圖發(fā)布,其有何重大意義?

星空計(jì)劃
原創(chuàng)
星空計(jì)劃運(yùn)營團(tuán)隊(duì)賬號:活動信息發(fā)布、創(chuàng)作者培育計(jì)劃作品發(fā)布等
收藏

你知道么,人類的第一份基因組序列草圖發(fā)布至今已經(jīng)20年了,在20年前發(fā)表的人類基因組序列中,大部分?jǐn)?shù)據(jù)來自于一名白人志愿者,以及其他至少3個(gè)人的基因組混合而成,其中這名白人占據(jù)了70%以上的數(shù)據(jù)。

至于為什么這樣,大概是因?yàn)楫?dāng)時(shí)測序一個(gè)人的基因組實(shí)在太貴,按照最后的統(tǒng)計(jì),六國科學(xué)家用了總計(jì)42億美元,才完成了第一個(gè)人類基因組草圖。當(dāng)時(shí)的科學(xué)家們或許是希望通過一個(gè)基因組計(jì)劃獲得盡可能多的人類基因信息,所以將不同人的DNA進(jìn)行了混合;同時(shí)受制于技術(shù),當(dāng)時(shí)制作物理圖等技術(shù)需要消耗大量的DNA,如果都是來自一個(gè)人,恐怕得抽很多血了。雖然是來自于至少4個(gè)人,但是這份基因組圖是以“一個(gè)人”的形式出現(xiàn)的。

在過去20年中,有數(shù)以萬計(jì)的關(guān)于人類基因的研究基于人類基因組計(jì)劃完成的基因組序列。但是,這個(gè)參考基因組還是有很多問題。比如,當(dāng)時(shí)基因組技術(shù)落后,我們看到的基因組并不是每條染色體完整的,而是有很多的“洞”,特別是在重復(fù)序列多的部分,比如端粒和著絲粒部分。2003年發(fā)表時(shí),其實(shí)基因組的完成度只有92%,剩余部分科學(xué)家們又用了20年才完成;第二,不同人類個(gè)體的基因組雖然平均來說99.6%以上的序列是相同的,但是差別的那0.4%卻造成了人類的多種多樣,比如我們頭發(fā)的顏色、身高、皮膚的顏色等等都不相同,就是那0.4%決定的。而這些特征,在人類基因組計(jì)劃完成的序列圖由于只代表“一個(gè)人”的基因,是無法完整描述這些遺傳多樣性信息的。

過去的20年中,在技術(shù)的進(jìn)步和科學(xué)家們的不斷努力之下,2022年科學(xué)家們發(fā)表了從端粒到端粒的人類基因組計(jì)劃完成圖,填補(bǔ)了人類基因組計(jì)劃留下的幾乎所有的“洞”。我們真正看到了完整的“一個(gè)”人類基因組圖譜。完成了前面所述的人類基因組有很多“洞”的遺憾。而在是2023年5月初發(fā)表在《自然》和《自然·生物技術(shù)》雜志的四篇文章,更是將人類基因組推進(jìn)到了“泛基因組”時(shí)代,也就是每個(gè)人的基因特征的時(shí)代。今天,我們就講講最新的這一系列進(jìn)展。

首先,什么是泛基因組?泛基因組(Pan-genome)指一個(gè)物種內(nèi)所有基因組信息的總和,它比單一參考基因組涵蓋了更多的遺傳多樣性。最完整的泛基因組,就是這個(gè)物種所有個(gè)體的基因總和。

這次發(fā)表在《自然》《自然·生物技術(shù)》等期刊上的幾篇文章,分別包括:發(fā)表于《自然-生物技術(shù)》的“人類泛基因組參考序列草圖”;《自然》雜志的“人類片段化擴(kuò)增中的突變和基因轉(zhuǎn)化增加”、“人類異源染色體近端著絲粒之間的重組”、“使用Minigraph-Cactus比對工具來構(gòu)建人類泛基因組圖”。

我們總結(jié)一下這四篇研究的研究成果:首先,這次的泛基因組草圖,是由47個(gè)不同來源的獨(dú)立的個(gè)體的獨(dú)立的完整的個(gè)人基因組數(shù)據(jù)分析得到的,相比當(dāng)前被廣泛使用的人類基因組參考序列GRCh38版本,草圖增加了1.19億個(gè)堿基對(指在DNA雙螺旋結(jié)構(gòu)中的兩個(gè)互補(bǔ)配對的堿基)和1115個(gè)基因重復(fù)。

配圖來自圖蟲網(wǎng)

相比于GRCh38,該草圖能檢測到結(jié)構(gòu)變異基因的數(shù)量增加了104%。彌補(bǔ)了GRCh38中 210 Mb(兆堿基)的DNA序列片段,其中151 Mb的區(qū)域之前完全未知,59 Mb的區(qū)域是通過之前計(jì)算機(jī)模擬得到的預(yù)測序列。之前這種缺失的情況會造成相關(guān)研究的數(shù)據(jù)偏差,也意味著在人類基因圖譜中,依然有很多區(qū)域是我們未知的。還需要繼續(xù)完善。

第二,科學(xué)家們開發(fā)了一個(gè)單核苷酸變異(SNV)圖譜,其中包含了數(shù)百萬先前未被描繪的SNV,同時(shí)新的泛基因組圖譜描述了一些基因組區(qū)域的變異性質(zhì),這些區(qū)域擁有片段重復(fù)序列,并在基因組的一個(gè)或多個(gè)位點(diǎn)上重復(fù)出現(xiàn),共享著高度相同的DNA序列。這種重復(fù)序列的存在可能導(dǎo)致基因組變異,從而對個(gè)體的表型特征和患病風(fēng)險(xiǎn)產(chǎn)生影響。

第三,科學(xué)家們利用人類泛基因組草圖,觀察到異源著絲粒染色體短臂之間的重組模式,并觀察到了某種DNA交換機(jī)制。這表明,在染色體之間,存在一種過去曾被推測存在但未被證實(shí)的DNA交換方式的確存在。

第四,研究人員利用人類泛基因組草圖提高了泛基因組參考基因組的準(zhǔn)確性。在此次研究中,科學(xué)家們展示了“Minigraph-Cactus 泛基因組分析”的流程,該方法可以直接從全基因組比對中創(chuàng)建泛基因組,同時(shí)它還可以處理比較人類和果蠅之間的跨物種基因組數(shù)據(jù)。這為將來更好地理解物種間和個(gè)體間的基因組變異提供了更全面的信息。

當(dāng)然,這次取得的研究成果還只是人類泛基因組研究發(fā)展中的一個(gè)過渡階段,整個(gè)計(jì)劃旨在觀察和描繪350名個(gè)體的遺傳多樣性?,F(xiàn)在完成的,只是其中一小部分。研究人員計(jì)劃到2024年年中完成這350人的基因組測序工作。

最后,從人類基因組計(jì)劃,到現(xiàn)在泛基因組計(jì)劃,我們都看到了中國人的貢獻(xiàn),而且貢獻(xiàn)的比例從華大基因代表中國參與人類基因組計(jì)劃1%開始,在逐步的提高,這次我們看到在四篇文章中,有兩篇的通訊作者是來自中國的李恒博士,也是基因組研究領(lǐng)域的大神,還有多個(gè)中國人的名字位列作者名單中。

我們也希望在未來,人類基因組研究領(lǐng)域,有更多中國的聲音,有更多來自中國的貢獻(xiàn)。

本文為科普中國·星空計(jì)劃扶持作品

作者:田埂

審核:陶寧(中科院生物物理研究所 副研究員)

出品:中國科協(xié)科普部

監(jiān)制:中國科學(xué)技術(shù)出版社有限公司、北京中科星河文化傳媒有限公司

內(nèi)容資源由項(xiàng)目單位提供

評論
演繹無限精彩
大學(xué)士級
人類泛基因組草圖發(fā)布,讓“生命天書”更具全球代表性。中國學(xué)者同樣致力于建立更多樣化的基因組,為我國乃至世界的基因研究與醫(yī)療公平作出貢獻(xiàn)!
2023-08-01
天津—陳杰
學(xué)士級
過去的20年中,在技術(shù)的進(jìn)步和科學(xué)家們的不斷努力之下,2022年科學(xué)家們發(fā)表了從端粒到端粒的人類基因組計(jì)劃完成圖,填補(bǔ)了人類基因組計(jì)劃留下的幾乎所有的“洞”,我們真正看到了完整的“一個(gè)”人類基因組圖譜。???
2023-08-01
回憶人生路
庶吉士級
人類基因組研究領(lǐng)域,有更多中國的聲音,有更多來自中國的貢獻(xiàn)。
2023-08-01