3個(gè)最近在北京取樣的新冠病毒序列并不一樣,暗示可能早在1-2個(gè)月前,新冠病毒已經(jīng)在北京社區(qū)里默默傳播了。
撰文 | 史雋
全球確診人數(shù) 8242999
全球死亡人數(shù) 445535
(截至發(fā)稿時(shí)的最新數(shù)據(jù) ,來源|WHO)
在4月21日的一篇日記《詳解病毒基因序列追蹤流調(diào)大法》里面,我曾經(jīng)提到過病毒序列共享和Nextstrain這個(gè)計(jì)劃。
一場流行病暴發(fā)以后,世界各國的科學(xué)家們都會(huì)測序新收集到的病毒樣本。因?yàn)橐咔榫o急,很多科學(xué)家會(huì)把尚未發(fā)表的病毒基因序列上傳到一些共享數(shù)據(jù)庫 (例如GISAID),和全世界共享。
西雅圖弗雷德·哈欽森癌癥研究中心的Trevor Bedford等病毒進(jìn)化專家團(tuán)隊(duì)組織了一個(gè)名為Nextstrain的項(xiàng)目??茖W(xué)家們會(huì)盡快去把共享的病毒序列下載到Nextstrain的后臺(tái),將這些序列納入全球傳播地圖,并在nextstrain.org上公布新冠病毒的基因組流行病學(xué)的最新信息,更新病毒家族樹譜。
Nextstrain軟件平臺(tái)在過去幾年逐步開發(fā)完善,曾應(yīng)用于埃博拉、Zika和季節(jié)性流感等疫情,旨在讓基因組流行病學(xué)在疫情期間盡快地發(fā)揮作用。今年它也在時(shí)刻更新新冠病毒的傳播信息。
今天,Nextstrain的twitter公布了新的3條新冠病毒基因序列,均來自最近北京暴發(fā)的病毒樣本。這3個(gè)樣本采集于2020年6月11日,兩個(gè)來自于感染者,一個(gè)是環(huán)境采樣。由中國疾控中心病毒病預(yù)防控制所(NIVDC)快速測序并且在GISAID共享。
這3個(gè)序列落在一個(gè)進(jìn)化簇中,該簇包含了很多來自歐洲的樣本(圖1,上下兩幅),和2020年3月19-20日采樣的3個(gè)輸入北京的病毒的基因序列很不一樣。
圖1 全球新冠病毒家族樹譜。上圖以取樣時(shí)間為橫坐標(biāo),下圖以突變的數(shù)目為橫坐標(biāo)。(點(diǎn)擊看大圖)
在全球架構(gòu)中,和這3個(gè)北京的序列最接近的序列來自捷克、中國臺(tái)灣、希臘和葡萄牙(圖2)。因?yàn)镹extstrain最近精簡了數(shù)據(jù)庫里的很多重復(fù)的序列,還不能確認(rèn)北京的病毒到底來自什么地方。
圖2(點(diǎn)擊看大圖)
如果按地區(qū)分布看,在亞洲架構(gòu)中(圖3),北京的序列和來自捷克、中國臺(tái)灣、丹麥、哥倫比亞、以色列和奧地利的序列很接近。
圖3(點(diǎn)擊看大圖)
在歐洲架構(gòu)中(圖4),北京的序列和來自捷克、丹麥等許多歐洲國家的序列很接近,其中和來自葡萄牙和瑞典的基因序列只相差1個(gè)突變。
圖4(點(diǎn)擊看大圖)
因此從基因序列分析來看,北京最近傳播的新冠病毒與歐洲流行的病毒有關(guān)。但是因?yàn)榕c許多國家/地區(qū)的序列類似,還無法定論它可能起源于何處,何時(shí)傳入北京的。
最后,最重要的一點(diǎn),北京的3個(gè)病毒基因序列雖然接近,但都不相同。樣品 (1) 和樣品 (2、3) 之間已經(jīng)有兩個(gè)突變 (圖5)。其中第一步突變(A29694C)樣品(2、3)都有,但是第二步突變是不一樣的 (C12085T和A11910G)。這暗示了在暴發(fā)之前,新冠病毒可能已經(jīng)在北京社區(qū)里默默傳播了一段時(shí)間。因?yàn)樾鹿诓《镜淖儺愃俣炔凰憧欤骄吭峦蛔儍纱?。如果是一個(gè)點(diǎn) (新發(fā)地市場) 短時(shí)間內(nèi)的暴發(fā),病毒的基因序列很大可能是一樣的。
圖5(點(diǎn)擊看大圖)
以前的日記里面也講過 (詳見《開棺驗(yàn)尸:各國到底何時(shí)起出現(xiàn)新冠病毒感染 | 117疫情觀察》),世界很多地區(qū),例如美國的西雅圖和紐約,法國巴黎等,新冠病毒都是在社區(qū)里默默地、不被人們所意識(shí)到地傳播了1-2個(gè)月,才引起了全面的暴發(fā)。北京的新冠病毒的社區(qū)傳播很可能也在1-2個(gè)月之前就開始了。
參考文獻(xiàn)
https://mobile.twitter.com/nextstrain/status/1273642115826880512