版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

直擊三大實體瘤!中國科學(xué)家發(fā)布深度學(xué)習(xí)系統(tǒng),應(yīng)對“全球頭號殺手”更有底氣!

HyperAI超神經(jīng)
原創(chuàng)
人工智能說明書,了解 AI 的功效和副作用。
收藏

世界衛(wèi)生組織 2022 年發(fā)布的報告指出,癌癥等非傳染性疾病 (NCDs)) 已超過傳染病,成為「全球頭號殺手」。中國國家癌癥中心發(fā)布的最新數(shù)據(jù)顯示,2022 年中國約有 482.47 萬新發(fā)癌癥病例和 257.42 萬新發(fā)癌癥死亡病例。

很長一段時間里,人們「聞癌色變」,但其實癌癥作為一種慢性病,1/3 是可以預(yù)防的,1/3 是可以通過早發(fā)現(xiàn)、早診斷、早治療達(dá)到治愈的,1/3 不可治愈,但通過適當(dāng)治療可以控制、獲得較好的生活質(zhì)量并延長生存期。其中,預(yù)防主要是通過提高自身免疫力、定期體檢等途徑,關(guān)注個人健康。而在確診癌癥后,預(yù)后分析十分重要。

癌癥預(yù)后是指預(yù)測癌癥患者的可能病程和結(jié)局,預(yù)后分析有助于提高癌癥患者的生存機會。過去,研究人員基于空間轉(zhuǎn)錄組學(xué) (ST) 技術(shù),從空間基因表達(dá)的角度對腫瘤微環(huán)境 (TME) 進行表征,從而區(qū)分癌癥患者的不同預(yù)后亞組。然而,ST 的高昂成本和長實驗周期阻礙了其應(yīng)用于大規(guī)模癌癥患者隊列進行生存預(yù)測。與之相比,組織學(xué)圖像具有成本效益,在臨床環(huán)境中易于獲取,并且能夠提供有關(guān)腫瘤形態(tài)的豐富信息,是分子水平 TME 分析的更好替代品,可實現(xiàn)更精確的癌癥預(yù)后。

近日,上海國家應(yīng)用數(shù)學(xué)中心(上海交通大學(xué)分中心)俞章盛課題組(生命科學(xué)技術(shù)學(xué)院/醫(yī)學(xué)院臨床研究中心),王宇光課題組(自然科學(xué)研究院/數(shù)學(xué)科學(xué)學(xué)院)與合作者在 Cell Reports Medicine 發(fā)表了題為「Harnessing TME depicted by histological images to improve cancer prognosis through a deep learning system」的論文。該研究開發(fā)了一個深度學(xué)習(xí)系統(tǒng),可以通過組織病理學(xué)圖像,為沒有空間轉(zhuǎn)錄組數(shù)據(jù)的癌癥患者預(yù)測腫瘤微環(huán)境信息,從而實現(xiàn)精確的癌癥預(yù)后。

研究亮點:

通過組織病理學(xué)圖像為沒有 ST 數(shù)據(jù)的癌癥患者預(yù)測 TME 信息

以 IGI-DL 為特征的 TME 提高了癌癥生存預(yù)測的準(zhǔn)確性

大幅拓展了基因空間表達(dá)信息在大型生物醫(yī)學(xué)病理圖像公共數(shù)據(jù)庫的使用

數(shù)據(jù)集:評估 3 種實體瘤類型組織樣本
本研究為了評估模型在結(jié)直腸癌 (CRC)、乳腺癌和皮膚鱗狀細(xì)胞癌 (cSCC) 這三種不同實體瘤類型組織樣本上的性能,使用了 3 種不同的數(shù)據(jù)集。

對于結(jié)直腸癌,研究人員使用了來自上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院 10 名 CRC 患者的 10 個 ST 數(shù)據(jù)集的 41,492 個點,這些數(shù)據(jù)集由 10× Visium 測序,作為留一患者 (leave-one-patient-out) 驗證集,如下表所示。

內(nèi)部 CRC 數(shù)據(jù)集的臨床特征

對于乳腺癌,研究人員使用了來自 27 名患者的 92 個組織樣本的 34,678 個點,這些樣本通過傳統(tǒng)的 ST 技術(shù)進行了測序,作為留一患者驗證集,如下表所示。

乳腺癌空間轉(zhuǎn)錄組數(shù)據(jù)集匯總

對于皮膚鱗狀細(xì)胞癌,研究人員使用了來自 4 名患者的 12 個組織樣本的 4,353個 點,這些樣本通過傳統(tǒng)的 ST 技術(shù)進行了測序,作為留一患者驗證集,如下表所示。

cSCC 空間轉(zhuǎn)錄組數(shù)據(jù)集匯總

模型架構(gòu):新型深度學(xué)習(xí)系統(tǒng)改善癌癥預(yù)后
在本研究中,研究人員開發(fā)了一個深度學(xué)習(xí)系統(tǒng),可以利用組織學(xué)圖像描繪的 TME 改善癌癥預(yù)后。

該深度學(xué)習(xí)系統(tǒng)包含兩部分

該系統(tǒng)包含兩個部分:

第一部分(上圖中 Connection 1)是基于 integrated graph 和圖深度學(xué)習(xí)的模型 (integrated graph and image deep learning, IGI-DL),該模型采用卷積神經(jīng)網(wǎng)絡(luò)和圖神經(jīng)網(wǎng)絡(luò)將 H&E 染色組織學(xué)圖像 (histological images) 投射到基因表達(dá)空間 (gene expression space)。

第二部分(上圖中 Connection 2),研究人員在癌癥基因組圖譜 (TCGA) 數(shù)據(jù)集中的結(jié)直腸癌隊列和乳腺癌隊列中,使用 super-patch graph 和 IGI-DL 預(yù)測的空間基因表達(dá) (spatial gene expression) 作為節(jié)點特征 (node features),進行了預(yù)后預(yù)測,然后在外部測試集 MCO-CRC (Molecular and Cellular Oncology colorectal cancer) 中進行了驗證。

深度學(xué)習(xí)系統(tǒng)的工作流程

具體而言,該系統(tǒng)的構(gòu)建包括 3 個步驟:H&E 染色組織學(xué)圖像預(yù)處理、空間基因表達(dá)預(yù)測模型和基于預(yù)測的空間基因表達(dá) super-patch graph 生存模型。

H&E 染色組織學(xué)圖像 (H&E-stained histological image) 預(yù)處理:

首先根據(jù)每個點的坐標(biāo),將每個 H&E 染色的組織學(xué)圖像分割成多個非重疊的 200×200 像素的 patches,分辨率為 0.5 μm/pixel;

空間基因表達(dá)預(yù)測模型:

對于每個 patch,研究人員建立了一個 Nuclei-Graph,其中由 Hover-Net24 分割的每個細(xì)胞核表示為一個節(jié)點 (node),并且每個細(xì)胞核對之間的距離決定了是否存在邊緣 (edge) 連接。根據(jù)上圖 C 所示的架構(gòu),研究人員使用 IGI-DL 模型來預(yù)測組織學(xué)圖像中每個點的目標(biāo)基因表達(dá)。

基于預(yù)測的空間基因表達(dá)的 super-patch graph 生存模型:

為了進一步基于由空間基因表達(dá)勾畫的 TME 進行預(yù)后預(yù)測,研究人員從每個患有癌癥的患者的 H&E 染色全切片成像 (whole-slide imaging, WSI) 中構(gòu)建了一個 super-patch graph,然后利用構(gòu)建的 super-patch graph 和臨床特征作為輸入,構(gòu)建了基于圖的生存預(yù)測模型。

研究結(jié)果:IGI-DL 模型綜合表現(xiàn)出色

總體來看,本研究構(gòu)建的 IGI-DL 模型集成了卷積神經(jīng)網(wǎng)絡(luò)和圖神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,充分利用組織病理學(xué)圖像中的像素強度和結(jié)構(gòu)特征,實現(xiàn)更準(zhǔn)確的基因空間表達(dá)水平預(yù)測。模型在結(jié)直腸癌、乳腺癌和皮膚鱗狀細(xì)胞癌這 3 種類型實體瘤中均表現(xiàn)出色,與 5 種現(xiàn)有方法相比平均相關(guān)系數(shù)提升了 0.171。

IGI-DL在CRC中空間基因表達(dá)的預(yù)測性能和可視化

對于結(jié)直腸癌,研究人員將 IGI-DL 預(yù)測的 179 個基因的 Pearson 相關(guān)性與 5 個 SOTA 模型進行比較,IGI-DL 在 10 名保留患者中實現(xiàn)了 0.343 的平均 Pearson 相關(guān)性,明顯優(yōu)于其他模型,平均增加了 0.233,如上圖所示。

IGI-DL在乳腺癌中空間基因表達(dá)的預(yù)測性能和可視化

對于乳腺癌,研究人員將 IGI-DL 預(yù)測的 187 個基因的 Pearson 相關(guān)性與之前的模型進行比較,IGI-DL 在 27 名保留患者中實現(xiàn)了 0.231 的平均相關(guān)性。如上圖所示,IGI-DL 模型優(yōu)于所有 SOTA 模型,平均提高了 0.142。

IGI-DL在cSCC中空間基因表達(dá)的預(yù)測性能和可視化

對于皮膚鱗狀細(xì)胞癌,研究人員將 IGI-DL 預(yù)測的 487 個基因的 Pearson 相關(guān)性與之前的模型進行了比較,IGI-DL 在 4 名保留患者中實現(xiàn)了 0.198 的平均相關(guān)性,在所有模型中具有最好的性能,比其他 SOTA 模型的平均性能提高了 0.131,如上圖所示。

在跨平臺和跨癌種性能方面,如上述實驗,對于不同癌癥類型的內(nèi)部驗證和外部測試集,最佳的 SOTA 模型并不固定,但 IGI-DL 模型的性能始終優(yōu)于其他模型,平均改進幅度為 0.171,展現(xiàn)出良好的跨平臺泛化能力。

更進一步,研究人員還調(diào)查了 IGI-DL 的跨癌種預(yù)測性能,其在結(jié)直腸癌上訓(xùn)練的模型在皮膚鱗狀細(xì)胞癌的內(nèi)部驗證和外部測試集上表現(xiàn)良好,平均相關(guān)性分別為 0.204 和 0.143。然而,大多數(shù)跨癌種預(yù)測性能較訓(xùn)練和測試單一癌癥類型時要低。這一結(jié)果表明,腫瘤區(qū)域的空間基因表達(dá)具有一定的癌癥特異性,跨癌種預(yù)測存在固有的困難。

TCGA 乳腺癌和結(jié)腸癌不同生存模型的預(yù)測性能

針對預(yù)后預(yù)測性能,在癌癥基因組圖譜乳腺癌 (TCGA-BRCA) 隊列中,基于以空間基因表達(dá)為節(jié)點特征的 super-patch graph 生存模型在 5 倍交叉驗證中可以達(dá)到 0.747 的平均一致性指數(shù) (C-index);在癌癥基因組圖譜結(jié)直腸癌 (TCGA-CRC) 隊列中,該生存模型在 5 倍交叉驗證 C-index 為 0.725,優(yōu)于其它預(yù)后模型,如上圖所示。

該生存預(yù)后模型對于早期患者 (I 期和 II 期) 的預(yù)后預(yù)測同樣保持精度優(yōu)勢,預(yù)測得到的風(fēng)險評分可以作為所有階段患者和早期患者的獨立預(yù)后指標(biāo)。在包含一千多名患者數(shù)據(jù)的外部測試集 MCO-CRC 中,生存預(yù)后模型保持穩(wěn)定的優(yōu)勢,具有泛化能力。

乳腺癌與胰腺癌先行:借力 AI 改善預(yù)后
在癌癥的診療過程中,癌癥預(yù)后分析可以有效避免過度治療及醫(yī)療資源的浪費,為醫(yī)務(wù)人員及家屬進行醫(yī)療決策提供科學(xué)依據(jù),已成為近年癌癥研究的熱門方向。

為了改善乳腺癌預(yù)后,2020 年,Salesforce 公司研究人員與南加州大學(xué) Lawrence J. Ellison 研究所的臨床醫(yī)生合作,推出了機器學(xué)習(xí)系統(tǒng) ReceptorNet,其算法可以通過低成本且易獲取的組織圖像來預(yù)測激素受體的狀態(tài)——這是臨床醫(yī)生在為乳腺癌患者決定合適的治療路徑時的一個重要的生物標(biāo)記。該系統(tǒng)的準(zhǔn)確率達(dá)到了 92%。

2024 年 2 月,來自美國肯塔基大學(xué)、澳門科技大學(xué)、澳門大學(xué)、廣州醫(yī)科大學(xué)第一附屬醫(yī)院的研究人員采用神經(jīng)網(wǎng)絡(luò)模型,建立了一個精準(zhǔn)的預(yù)后評分系統(tǒng)——MIRS (metastasis and immunogenomic risk score),用于腫瘤轉(zhuǎn)移與免疫基因組風(fēng)險評分,提供了一項幾乎普遍適用于乳腺癌患者的預(yù)測工具,為乳腺癌人群的治療選擇提供了新方向。(點擊查看詳細(xì)報道:劍指全球第一大癌癥,中國學(xué)者建立乳腺癌預(yù)后評分系統(tǒng) MIRS)

此外,胰腺癌作為消化道常見的惡性腫瘤之一,確診后的五年生存率不超過 10%。提高患者生存率的一個關(guān)鍵環(huán)節(jié)是準(zhǔn)確預(yù)測患者的預(yù)后風(fēng)險,以便設(shè)計針對性的治療方案。組織病理是腫瘤科的常規(guī)檢查,可在微觀層面解析腫瘤特性,是評估腫瘤進展風(fēng)險的重要方法。但由于切片尺寸極大、組織成分復(fù)雜,評估結(jié)果容易受主觀因素影響。

2023 年,來自南京信息工程大學(xué)、人工智能學(xué)院智慧醫(yī)療研究院的研究團隊,發(fā)布了題為「基于多任務(wù)和注意力的胰腺癌全切片圖像多組織分割模型」 的研究論文,研究了胰腺癌病理切片 8 種類別的組織分割,通過引入注意力機制并設(shè)計分層共享的多任務(wù)結(jié)構(gòu),利用相關(guān)輔助任務(wù)顯著提升模型性能。

該研究提出的模型在上海長海醫(yī)院的數(shù)據(jù)集上進行訓(xùn)練與測試,并在 TCGA 公開數(shù)據(jù)集上進行外部驗證,在內(nèi)部測試集上 F1 分?jǐn)?shù)均高于 0.97,在外部驗證集上 F1 分?jǐn)?shù)均高于 0.92,且泛化性能顯著優(yōu)于基線方法。

值得強調(diào)的是,AI 并不能替代病理學(xué)專家,而是作為一種輔助診斷技術(shù),為病理診斷帶來更多便利,進一步提高病理醫(yī)師工作效率。從長遠(yuǎn)趨勢來看,AI 在數(shù)字化生物標(biāo)志物檢測、醫(yī)療圖像分析、病程預(yù)測等方面,還有較大的發(fā)展空間。

參考資料:
1.https://news.un.org/zh/story/2018/09/1017602

2.https://mp.weixin.qq.com/s/VE68FKL6kwpO1IFsbR-LVA

3.https://ins.sjtu.edu.cn/articles/286

4.https://www.cdstm.cn/theme/khsj/khzx/khcb/202012/t20201214_1039028.html

評論
新風(fēng)科普????
學(xué)士級
中國科學(xué)家開發(fā)了一款深度學(xué)習(xí)系統(tǒng),專門針對三大實體瘤(可能指的是肺癌、乳腺癌和結(jié)直腸癌,這三種腫瘤通常被認(rèn)為是最常見的實體瘤)進行診斷和治療。這個系統(tǒng)的發(fā)布意味著在對抗全球頭號殺手——癌癥方面,中國科學(xué)家們有了更強大的工具和信心。通過利用人工智能技術(shù),他們能夠提高癌癥診斷的準(zhǔn)確性,優(yōu)化治療方案,從而有望提升患者的生存率和生活質(zhì)量。
2024-05-24
科普者勇
少傅級
AI 并不能替代病理學(xué)專家,而是作為一種輔助診斷技術(shù),為病理診斷帶來更多便利,進一步提高病理醫(yī)師工作效率。
2024-05-24
科普者勇
少傅級
世界衛(wèi)生組織 2022 年發(fā)布的報告指出,癌癥等非傳染性疾病 (NCDs)) 已超過傳染病,成為「全球頭號殺手」。
2024-05-24