文 / 徐軍
0 引言
人工智能技術(shù)對醫(yī)學(xué)的發(fā)展產(chǎn)生了深遠(yuǎn)影響。計(jì)算病理是數(shù)字病理和人工智能技術(shù)的結(jié)合,它運(yùn)用先進(jìn)的機(jī)器學(xué)習(xí)和圖像分析的方法定量分析高分辨率數(shù)字化病理切片,同時(shí)構(gòu)建病理組學(xué)把病理醫(yī)生的診斷經(jīng)驗(yàn)和知識(shí)進(jìn)行量化,以融入到人工智能輔助病理診療系統(tǒng)。病理診斷是大多數(shù)疾病診斷的“金標(biāo)準(zhǔn)”,它來源于病理醫(yī)生對于醫(yī)學(xué)知識(shí)和臨床研究的歸納學(xué)習(xí),以及長期實(shí)踐經(jīng)驗(yàn)的總結(jié)積累,病理精準(zhǔn)診斷是臨床精準(zhǔn)治療疾病的依據(jù)。
我國病理醫(yī)生數(shù)量不足,因此每個(gè)病理醫(yī)生都承擔(dān)了超常規(guī)工作量的閱片工作。計(jì)算病理能輔助病理醫(yī)生處理簡單重復(fù)性的閱片工作,減輕病理醫(yī)生的工作量,提高工作效率。同時(shí),運(yùn)用計(jì)算病理技術(shù)能夠幫助病理醫(yī)生從繁重的重復(fù)性診斷任務(wù)中解脫出來,把簡單重復(fù)性工作交給計(jì)算機(jī)處理,節(jié)省的時(shí)間用于處理計(jì)算機(jī)無法處理的更加復(fù)雜的任務(wù);同時(shí)這個(gè)技術(shù)還能減少人的主觀性差異,使閱片過程標(biāo)準(zhǔn)化、定量化、客觀化、可重復(fù)、高通量,從而盡可能避免漏診和誤診的發(fā)生。另外,計(jì)算病理能超越病理醫(yī)生的視覺和記憶,能對人類的知識(shí)和經(jīng)驗(yàn)進(jìn)行量化建模,構(gòu)建超越人的視覺水平的亞視覺特征;同時(shí)利用高性能計(jì)算機(jī)對大規(guī)模數(shù)字化切片進(jìn)行訓(xùn)練和學(xué)習(xí),通過歸納數(shù)據(jù)中的共性、趨勢和規(guī)律,可以超越診斷的任務(wù),實(shí)現(xiàn)疾病的預(yù)測和預(yù)后等更復(fù)雜問題的解決,從而推動(dòng)精準(zhǔn)醫(yī)學(xué)的發(fā)展。精準(zhǔn)醫(yī)學(xué)的目標(biāo)是能讓患者獲得更為精準(zhǔn)的診斷和有效的治療,從而針對每位患者的個(gè)體特征定制醫(yī)學(xué)護(hù)理和治療方案。
1 從數(shù)字病理到計(jì)算病理和精準(zhǔn)醫(yī)學(xué)
數(shù)字病理是指運(yùn)用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)的虛擬病理,通過運(yùn)用全切片數(shù)字掃描技術(shù)(Whole Slide Imaging, WSI)對病理切片進(jìn)行數(shù)字成像,將物質(zhì)形式的玻璃切片轉(zhuǎn)化為數(shù)字形式的圖像,并對它進(jìn)行數(shù)據(jù)管理。1994 年人類第一個(gè) WSI 系統(tǒng) BLISS System 在美國誕生,2017 年飛利浦的 WSI 系統(tǒng)IntelliSite 和 2019 年徠卡的 Aperio AT2 DX 先后獲得 FDA 批準(zhǔn)可以作為“首診”,這是數(shù)字病理領(lǐng)域具有里程碑意義的進(jìn)展。數(shù)字病理的大規(guī)模使用,預(yù)示著擁有 300 多年歷史的光學(xué)顯微鏡將可能被數(shù)字病理所取代。隨著各種存儲(chǔ)和網(wǎng)絡(luò)技術(shù)的推動(dòng),越來越多的醫(yī)院正在加快數(shù)字化病理科的建設(shè),在不久的將來,如同目前的影像科一樣,病理科也將實(shí)現(xiàn)全數(shù)字化,這是不可逆轉(zhuǎn)的發(fā)展趨勢。
切片數(shù)字化使病理醫(yī)生的傳統(tǒng)工作模式將發(fā)生巨大的變革,他們會(huì)像影像科醫(yī)生一樣在日常工作中使用數(shù)字化的全切片并通過高分辨率顯示器來閱片和診斷。隨著大規(guī)模玻璃切片被數(shù)字化,數(shù)字化病理切片每天正以指數(shù)級的數(shù)量快速增長,如何充分利用大規(guī)模數(shù)字化切片,從而推動(dòng)精準(zhǔn)醫(yī)學(xué)的發(fā)展,給人工智能領(lǐng)域帶來了巨大的研究機(jī)遇和挑戰(zhàn)。
人類的首張數(shù)字化圖像誕生在 1957 年。早在1965 年,美國科研人員就曾嘗試使用數(shù)字圖像處理技術(shù),定量分析數(shù)字化的細(xì)胞核形態(tài),以區(qū)分不同類型的細(xì)胞核。這是最早把計(jì)算病理的技術(shù)運(yùn)用于數(shù)字化病理切片的定量分析。計(jì)算病理是數(shù)字病理和以圖像計(jì)算、機(jī)器學(xué)習(xí)為代表的人工智能技術(shù)相結(jié)合,并應(yīng)用于數(shù)字病理切片的定量分析。它的目標(biāo)是定量化分析患者的標(biāo)本切片,以研究和理解疾病。同時(shí)通過病理切片的數(shù)字化和全數(shù)字化病理科的建設(shè),計(jì)算病理技術(shù)能幫助優(yōu)化有限的病理科人力資源的配置,推動(dòng)分子病理領(lǐng)域的發(fā)展。計(jì)算病理未來還能推動(dòng)病理學(xué)科和其他醫(yī)學(xué)學(xué)科的多學(xué)科融合,使得病理科成為臨床決策中的一個(gè)重要環(huán)節(jié)。此外,以數(shù)字病理數(shù)據(jù)為核心,可以跨模態(tài)、跨尺度融合多種數(shù)據(jù),比如影像檢查數(shù)據(jù)和分子、基因檢測數(shù)據(jù)和蛋白、轉(zhuǎn)錄組等數(shù)據(jù),以及臨床數(shù)據(jù)、血液檢查、臨床表現(xiàn)、標(biāo)本檢測、免疫學(xué)檢測等。這些跨模態(tài)、多尺度數(shù)據(jù)分別從不同的維度反映了疾病的全貌,它們之間的融合將能從宏觀到微觀更全面地展示疾病的信息,依據(jù)這些數(shù)據(jù)融合所構(gòu)建的診療和預(yù)后模型將能更好地輔助醫(yī)生制定患者最優(yōu)的臨床決策,推動(dòng)精準(zhǔn)醫(yī)學(xué)的發(fā)展。因此,計(jì)算病理能輔助醫(yī)生在準(zhǔn)確的時(shí)間為正確的患者制定最優(yōu)的治療方案,從而回答精準(zhǔn)醫(yī)學(xué)的如下三個(gè)核心問題。
(1)誰需要治療。通過自動(dòng)檢測和識(shí)別患者切片中病變區(qū)域,評估病變區(qū)域的性質(zhì)等,輔助醫(yī)生實(shí)現(xiàn)更精確的診斷。
(2)如何治療。通過評估患者疾病的風(fēng)險(xiǎn)或嚴(yán)重程度、分型,并根據(jù)組織形態(tài)學(xué)特征預(yù)測可能的治療反應(yīng)為患者量身定制更優(yōu)的臨床決策。
(3)療效如何。通過評估治療前、中、后患者腫瘤標(biāo)本的組織學(xué)形態(tài)特征等信息,來判斷患者對治療的反應(yīng)或治療效果及患者預(yù)后等。
2 病理圖像計(jì)算
病理圖像包含了豐富的圖像表型信息,病理診斷之所以稱為“金標(biāo)準(zhǔn)”,主要是因?yàn)檫@些圖像信息能從細(xì)胞和組織層面揭示疾病潛在的發(fā)病機(jī)理,因此基于病理圖像的形態(tài)學(xué)定量分析可以用于評估疾病的惡性程度、進(jìn)展,以及預(yù)測患者的生存期。實(shí)現(xiàn)這樣的計(jì)算機(jī)輔助診療和預(yù)后的任務(wù),需要從細(xì)胞、組織和切片層面構(gòu)建定量的圖像計(jì)算方法,如圖 1 所示。在這里使用“計(jì)算”而不僅是“分析”,包含兩個(gè)層次的任務(wù)。第一個(gè)層次即病理圖像分析的任務(wù),包括基于傳統(tǒng)的圖像像素的目標(biāo)識(shí)別、檢測、分割等任務(wù) ( 如 圖 1 中的 1A~1E 內(nèi)圈所示 );第二個(gè)層次是指構(gòu)建基于病理細(xì)胞、組織、切片層次圖像亞視覺特征的“病理組學(xué)”?!安±斫M學(xué)”通過運(yùn)用圖像分析方法將病理圖像轉(zhuǎn)化為高保真度、高通量的可挖掘的高維病理形態(tài)學(xué)特征集,這個(gè)特征集涵蓋組織形態(tài)學(xué)中不同細(xì)胞之間的拓?fù)淇臻g關(guān)系、紋理特征、形態(tài)學(xué)特征、邊緣梯度特征、生物學(xué)特性等定量特征,并將這些特征用于定量描述疾病的惡性程度、復(fù)發(fā)風(fēng)險(xiǎn)、轉(zhuǎn)移風(fēng)險(xiǎn)、治療反應(yīng)、進(jìn)展及患者生存 ( 如圖 1 的外圈所示 )。此外,這個(gè)結(jié)果還能超越病理診斷,在數(shù)據(jù)上與包括血液檢查、影像檢查、臨床表現(xiàn)、標(biāo)本檢測、分子檢測、免疫學(xué)檢測等數(shù)據(jù)融合,從宏觀到微觀整合到一起得到腫瘤病理表型組。具體包含細(xì)胞、組織和切片三個(gè)層次的任務(wù)。
2.1 細(xì)胞層次
細(xì)胞是生命的基本單元,細(xì)胞核的識(shí)別和分割是構(gòu)建研究疾病輔助診療和預(yù)后,以及精準(zhǔn)醫(yī)學(xué)相關(guān)問題的基礎(chǔ),通過構(gòu)建深度學(xué)習(xí)模型可以精準(zhǔn)地識(shí)別和分割不同類型的細(xì)胞核。
圖 1 計(jì)算病理在細(xì)胞、組織、切片層次的計(jì)算及其在疾病診療和預(yù)后等精準(zhǔn)醫(yī)學(xué)問題的應(yīng)用價(jià)值
如圖 1A 所示,通過構(gòu)建深度機(jī)器學(xué)習(xí)模型可以識(shí)別結(jié)直腸數(shù)字切片中癌變上皮細(xì)胞、纖維母細(xì)胞、炎癥細(xì)胞及其他細(xì)胞四種類型的細(xì)胞核。我們針對結(jié)直腸全景切片對圖2(a)中結(jié)直腸全景切片,可以構(gòu)建深度學(xué)習(xí)模型自動(dòng)識(shí)別炎癥 / 淋巴細(xì)胞、正常上皮細(xì)胞、增生 / 惡性上皮細(xì)胞、成纖維細(xì)胞、肌細(xì)胞、內(nèi)皮和其他類型細(xì)胞 7 種類型的細(xì)胞核(如圖 2(b)所示),從而為構(gòu)建基于領(lǐng)域知識(shí)啟發(fā)的組織形態(tài)學(xué)特征奠定了基礎(chǔ)。此外,細(xì)胞層次的分析還可以定量化度量免疫組化切片中的生物學(xué)標(biāo)記物,比如 PD-1/PD-L1的表達(dá),也可以定量計(jì)算組織切片中細(xì)胞核表達(dá)、細(xì)胞質(zhì)表達(dá)、細(xì)胞膜表達(dá),以及細(xì)胞之間的空間關(guān)系和排列。
圖 2 結(jié)直腸常規(guī) HE 染色全景切片及其細(xì)胞核自動(dòng)識(shí)別結(jié)果
2.2 組織層次
組織是具有相似結(jié)構(gòu)并共同作用以執(zhí)行特定功能的細(xì)胞群,它是生物學(xué)中介于細(xì)胞和器官之間的層次,由許多屬于同一器官形態(tài)相似的細(xì)胞和細(xì)胞外基質(zhì)組成。不同組織分工合作形成器官。因此,對于組織層次定量分析也是計(jì)算病理的基礎(chǔ)環(huán)節(jié)。比如,在癌癥的研究中僅研究癌細(xì)胞還不夠,還需要研究支撐癌細(xì)胞生長的微環(huán)境,因此組織層次的分析非常重要。如圖 1 中的 1C 所示,可以構(gòu)建深度機(jī)器學(xué)習(xí)模型識(shí)別結(jié)直腸數(shù)字切片中 10 種類型的組織——背景、脂肪、粘液、上皮癌變、腺體、肌肉、基質(zhì)、血管、免疫細(xì)胞、壞死區(qū)域。我們構(gòu)建了針對結(jié)直腸全景切片中 10 種組織的自動(dòng)分割模型,其流程圖如圖 3 所示。此外,組織層次的分析對于定量分析全景切片中的微血管密度、腫瘤的異質(zhì)性,以及腫瘤微環(huán)境都具有很重要價(jià)值。
圖 3 基于深度網(wǎng)絡(luò)的結(jié)直腸 10 類組織自動(dòng)分割框架
2.3 切片層次
全景切片包含了數(shù)十億像素組織切片信息,面向千兆像素的有效分析方法,使得切片層次定量分析的臨床轉(zhuǎn)化解決方案成為可能。針對全景切片定量分析可以實(shí)現(xiàn)疾病的惡性程度評估、疾病的進(jìn)展,以及患者生存預(yù)后等臨床問題的解決。如圖 1 中的1D 所示,通過對前列腺中不同 Gleason 等級區(qū)域的訓(xùn)練和學(xué)習(xí),我們構(gòu)建了前列腺全景切片格林森自動(dòng)分級模型。此外,在全景切片層次可以定量分析細(xì)胞質(zhì)免疫組化染色、感興趣區(qū)域的免疫組化定量化。比如,腫瘤微環(huán)境中腫瘤和免疫細(xì)胞的相互作用和關(guān)系,對研究腫瘤免疫至關(guān)重要。
2.4 基于領(lǐng)域知識(shí)啟發(fā)的組織形態(tài)學(xué)特征的構(gòu)建和量化
基于上述中對細(xì)胞、組織和切片層次的定量分析結(jié)果,可以構(gòu)建基于領(lǐng)域知識(shí)啟發(fā)的組織形態(tài)學(xué)亞視覺特征 ( 如圖 1 中的 1E 所示 ),定量描述疾病的惡性程度。這里的“亞視覺”特征是指人眼無法區(qū)分的微小圖像變化或者圖像模式,這些特征不僅歸納和總結(jié)病理醫(yī)生的診斷經(jīng)驗(yàn)和知識(shí),而且能進(jìn)行量化;同時(shí)這些特征能拓展甚至超越人的視覺水平,因此能實(shí)現(xiàn)超越醫(yī)生視覺和記憶水平的疾病預(yù)測和預(yù)后任務(wù)。
3 計(jì)算病理與免疫組化和分子病理
免疫組化 (immunohistochemistry) 又稱為免疫細(xì)胞化學(xué),是指帶顯色劑標(biāo)記的特異性抗體在組織細(xì)胞原位通過抗原抗體反應(yīng)和組織化學(xué)的呈色反應(yīng),對相應(yīng)抗原進(jìn)行定性、定位、定量測定的一項(xiàng)新技術(shù)。分子病理是在分子水平上對疾病的研究,包括在組織、器官甚至體液中發(fā)現(xiàn)的分子?!胺肿釉\斷”通常就是用于描述分子病理領(lǐng)域的醫(yī)學(xué)診斷。計(jì)算病理可以在細(xì)胞、組織和切片水平上對免疫組化進(jìn)行定量分析和評估,比如,對于 Her2、ER、PR、Ki67 的免疫組化生物標(biāo)記物進(jìn)行定量計(jì)算并得到相應(yīng)的定量表達(dá),可以避免人的主觀性差異。目前在分子診斷過程中對全切片中估計(jì)腫瘤細(xì)胞的比例估計(jì)主觀性很強(qiáng),而且很容易出現(xiàn)錯(cuò)誤,這對于一些腫瘤標(biāo)志物,如 EGFR、RAS 和 BRAF 驗(yàn)證具有很不利的影響,同時(shí)對于發(fā)現(xiàn)和驗(yàn)證新腫瘤中基于組織生物標(biāo)記物也很不利。運(yùn)用計(jì)算病理方法,還可以定量評估全切片某些生物標(biāo)志物的表達(dá)。通過計(jì)算整張切片中整體的細(xì)胞數(shù)量和腫瘤比例,可以應(yīng)用于定量評估確定腫瘤細(xì)胞的成分,這對于分子診斷至關(guān)重要。
總之,計(jì)算病理在免疫組化、分子病理、組織分析、發(fā)現(xiàn)新的生物標(biāo)志物等現(xiàn)代轉(zhuǎn)化醫(yī)學(xué)的研究領(lǐng)域?qū)⒕哂芯薮笸苿?dòng)能力。通過運(yùn)用計(jì)算病理方法可以通過快速分析成千上萬個(gè)細(xì)胞和組織樣本,縮短研發(fā)周期,篩選可能的生物標(biāo)記物,運(yùn)用大數(shù)據(jù)驅(qū)動(dòng),更好地理解腫瘤的生物學(xué)行為等。此外,計(jì)算病理還能推動(dòng)伴隨診斷到伴隨算法的轉(zhuǎn)變,支撐未來新生物標(biāo)志物的發(fā)現(xiàn),同時(shí)更好地輔助醫(yī)生對患者進(jìn)行分層護(hù)理。
4 計(jì)算病理與藥物發(fā)現(xiàn)和新藥物開發(fā)
近年來,運(yùn)用機(jī)器學(xué)習(xí)技術(shù)的藥物發(fā)現(xiàn)和新藥物開發(fā)得到很大的進(jìn)展。制藥公司需要了解藥物治療如何影響特定的組織和細(xì)胞,并且需要在選擇臨床試驗(yàn)候選者之前測試數(shù)千種化合物。隨著臨床試驗(yàn)數(shù)量的增加,發(fā)現(xiàn)新的生物標(biāo)志物對于識(shí)別對特定療法有反應(yīng)的患者變得越來越重要。使用計(jì)算病理可能發(fā)現(xiàn)新的生物標(biāo)志物并以更精確、可重復(fù)和高通量的方式獲取它們,能縮短藥物開發(fā)時(shí)間,使患者更快地獲得最優(yōu)的治療。由于大部分患者在接受如細(xì)胞毒劑或免疫檢查點(diǎn)抑制劑等治療時(shí),并不能對這些治療有反應(yīng),因此運(yùn)用計(jì)算病理技術(shù)來評判和識(shí)別那些對治療有反應(yīng)患者的研究引起了越來越多的關(guān)注。我們團(tuán)隊(duì)最近的研究成果表明,通過評估細(xì)胞核的形狀、方向和空間排列這些特征,可以區(qū)分早期非小型細(xì)胞癌患者的復(fù)發(fā)風(fēng)險(xiǎn),還可以評判患者對新輔助化療療效的效果。
5 計(jì)算病理與精準(zhǔn)醫(yī)學(xué)
精準(zhǔn)醫(yī)學(xué)的目標(biāo)是讓患者獲得更為精準(zhǔn)的診斷和有效治療,通過運(yùn)用先進(jìn)的計(jì)算病理技術(shù),能夠?qū)崿F(xiàn)下面三個(gè)方面的任務(wù),從而針對每位患者的個(gè)體特征定制醫(yī)學(xué)治療方案。
(1)診斷任務(wù)。精準(zhǔn)識(shí)別病變區(qū)域、惡性程度自動(dòng)評分。
(2)預(yù)后任務(wù)。預(yù)測疾病的結(jié)果、進(jìn)展。
(3)預(yù)測任務(wù)。預(yù)測患者對治療的反應(yīng)。
通過構(gòu)建定量組織形態(tài)學(xué)特征,可以評估和預(yù)測疾病惡性程度、復(fù)發(fā)風(fēng)險(xiǎn)、轉(zhuǎn)移風(fēng)險(xiǎn)、治療反應(yīng)、進(jìn)展,以及患者生存 ( 見圖 1),最近我們構(gòu)建了基于乳腺全景穿刺切片定量分析的新輔助化療預(yù)測框架,如圖 4 所示。
圖 4 基于乳腺穿刺全景切片組織形態(tài)學(xué)特征構(gòu)建的新輔助化療療效預(yù)測框架
6 結(jié)束語
我國人口眾多,地區(qū)經(jīng)濟(jì)發(fā)展不平衡,同時(shí)病理醫(yī)生的數(shù)量嚴(yán)重不足,好的病理醫(yī)生通常集中在少數(shù)發(fā)達(dá)城市,病理醫(yī)生承擔(dān)著超負(fù)荷的閱片工作,因此這個(gè)領(lǐng)域迫切需要人工智能技術(shù)的介入和支撐。隨著數(shù)字病理技術(shù)的推動(dòng),模擬的玻璃切片正在被大規(guī)模數(shù)字化,其數(shù)字化病理切片以幾何級數(shù)量快速增加。如何充分挖掘這些數(shù)字化病理切片,推動(dòng)精準(zhǔn)醫(yī)學(xué)的發(fā)展,將是非常有價(jià)值和前景的研究課題。當(dāng)前盡管分子和基因診斷被大規(guī)模采用,但是由于腫瘤具有高度異質(zhì)性,基于微觀的分子及基因檢測和診斷具有一定局限性,而計(jì)算病理可以在宏觀圖像表型上彌補(bǔ)微觀診斷的不足。
計(jì)算病理技術(shù)通過運(yùn)用機(jī)器學(xué)習(xí)和圖像分析為核心的人工智能技術(shù)能減少人主觀因素的影響,實(shí)現(xiàn)病理診斷過程的標(biāo)準(zhǔn)化、定量化、客觀化、可重復(fù)和高通量;通過構(gòu)建新穎的亞視覺特征能俘獲人眼無法分辨的微小圖像模式,從而超越人的視覺局限;通過量化基于領(lǐng)域知識(shí)啟發(fā)組織形態(tài)學(xué)特征構(gòu)建病理組學(xué),能夠挖掘出數(shù)據(jù)中的規(guī)律和趨勢。此外,計(jì)算病理對于分子病理與分子診斷領(lǐng)域的研究和發(fā)展,新的分子和生物標(biāo)志物的篩選和發(fā)現(xiàn),伴隨診斷的發(fā)展,藥物的發(fā)現(xiàn)和新藥物的開發(fā)等都具有很重要價(jià)值。此外,計(jì)算病理還有助于構(gòu)建計(jì)算機(jī)輔助診療系統(tǒng),幫助醫(yī)生制定最優(yōu)的臨床決策中發(fā)揮重要作用,推動(dòng)精準(zhǔn)醫(yī)學(xué)領(lǐng)域的研究和臨床轉(zhuǎn)化。
最后,計(jì)算病理還可以應(yīng)用于幾乎任何類型的數(shù)字化載玻璃切片定量分析中,比如細(xì)胞學(xué)、血液學(xué)、獸醫(yī)和植物病理等。計(jì)算病理如一個(gè)尚未被充分開采的“金礦”,充滿了誘人的研究機(jī)遇,同時(shí)其研究成果具有重要的臨床轉(zhuǎn)化價(jià)值,最終讓患者獲益。這個(gè)領(lǐng)域正等待著人工智能領(lǐng)域?qū)<液团R床專家一起共同開拓與發(fā)展。
(參考文獻(xiàn)略)
選自《中國人工智能學(xué)會(huì)通訊》
2021年第11卷第9期
智慧醫(yī)療專輯