撰文 | 馬雪薇
編審 | 學(xué)術(shù)君
前言
根據(jù)世界衛(wèi)生組織最新調(diào)查報(bào)告顯示,2022年,估計(jì)有 2000 萬新增癌癥病例和 970 萬死亡病例。癌癥確診后 5 年內(nèi)存活的估計(jì)人數(shù)為 5350 萬。大約五分之一的人在一生中罹患癌癥,大約九分之一的男性和十二分之一的女性死于癌癥。
2024 年 2 月 2 日,世界衛(wèi)生組織國際癌癥研究機(jī)構(gòu)(IARC)最新發(fā)布的 Global cancer burden growing, amidst mounting need for services,預(yù)計(jì) 2050 年將有超過 3500 萬新增癌癥病例,比 2022 年的估計(jì) 2000 萬例增加 77%。這再一次強(qiáng)調(diào)了目前日益加重的全球癌癥負(fù)擔(dān),值得世界范圍內(nèi)的重視。
組織病理學(xué)圖像評估是診斷癌癥的一種有效的方法。近日,來自哈佛醫(yī)學(xué)院的研究團(tuán)隊(duì)及其合作者提出了臨床組織病理學(xué)成像評估基礎(chǔ)(CHIEF)模型,用于提取病理成像特征以進(jìn)行系統(tǒng)的癌癥評估。
在包含 11 種癌癥類型的 15 個(gè)數(shù)據(jù)集上,CHIEF 在癌癥檢測方面實(shí)現(xiàn)了近 94% 的準(zhǔn)確率,顯著優(yōu)于當(dāng)前的人工智能方法。在從獨(dú)立隊(duì)列收集的 5 個(gè)活檢數(shù)據(jù)集中,CHIEF 在包括食道癌、胃癌、結(jié)腸癌和前列腺癌在內(nèi)的多種癌癥類型中達(dá)到了 96% 的準(zhǔn)確率。當(dāng)研究人員在以前從未見過的結(jié)腸、肺、乳腺、子宮內(nèi)膜和子宮頸手術(shù)切除腫瘤的切片上測試 CHIEF 時(shí),該模型的準(zhǔn)確率超過 90%。
相關(guān)研究論文以“A pathology foundation model for cancer diagnosis and prognosis prediction”為題,已發(fā)表在權(quán)威科學(xué)期刊 Nature 上。
該研究的共同通訊作者、哈佛醫(yī)學(xué)院助理教授 Kun-Hsing Yu 表示:“我們的目標(biāo)是創(chuàng)建一個(gè)靈活、多功能的類似 ChatGPT 的人工智能 (AI)平臺(tái),可以執(zhí)行廣泛的癌癥評估任務(wù),我們的模型在與多種癌癥的癌癥檢測、預(yù)后和治療反應(yīng)相關(guān)的多項(xiàng)任務(wù)中非常有用?!?/p>
研究人員指出,未來若對該方法進(jìn)行進(jìn)一步驗(yàn)證并廣泛推廣,將能夠辨識(shí)出早期癌癥患者。這些患者可能會(huì)從針對特定分子變異的實(shí)驗(yàn)性治療中獲益,這將有助于縮小全球范圍內(nèi)此類治療在研發(fā)和應(yīng)用方面的差距。
檢測癌癥的準(zhǔn)確率高達(dá) 94%
CHIEF 是一個(gè)適用于弱監(jiān)督組織病理學(xué)圖像分析的通用機(jī)器學(xué)習(xí)框架。CHIEF 提取對癌癥分類、腫瘤來源預(yù)測、基因組學(xué)預(yù)測和預(yù)后分析有用的病理成像表現(xiàn)。研究團(tuán)隊(duì)使用代表 19 個(gè)解剖部位的 60530 張全切片圖像以弱監(jiān)督的方式對 CHIEF 進(jìn)行了預(yù)訓(xùn)練。
在預(yù)訓(xùn)練過程中,他們將全切片圖像裁剪成不重疊的圖像瓦片,并使用對比語言-圖像預(yù)訓(xùn)練(CLIP)嵌入方法編碼每個(gè)全切片的解剖部位信息,以獲得每個(gè)解剖部位的特征向量。他們將文本和圖像嵌入合并,以表示來自訓(xùn)練數(shù)據(jù)的異質(zhì)病理信息。然后,使用 CHIEF 提取的病理成像特征直接推斷癌癥類型。在基因組學(xué)預(yù)測和預(yù)后預(yù)測任務(wù)中,CHIEF 特征作為為每個(gè)特定任務(wù)微調(diào)模型的基礎(chǔ)。
圖 | CHIEF 模型概述。
CHIEF 在這些任務(wù)中的表現(xiàn)比最先進(jìn)的深度學(xué)習(xí)方法高出多達(dá) 36.1%。平均來說,CHIEF 的表現(xiàn)比傳統(tǒng)方法高出 9%。
圖 | CHIEF 在癌癥分類、基因組學(xué)識(shí)別和生存預(yù)測任務(wù)中顯著優(yōu)于最先進(jìn)的方法。
CHIEF 模型在病理圖像分析中展現(xiàn)出強(qiáng)大的通用性和泛化能力,能夠在多種癌癥類型中應(yīng)用于多種病理評估任務(wù),其中包括癌癥檢測、腫瘤來源預(yù)測、基因組特征預(yù)測以及生存預(yù)測。
CHIEF 在代表 11 種癌癥類型的 15 個(gè)數(shù)據(jù)集上實(shí)現(xiàn)了 0.9397 的宏觀平均受試者操作特征曲線下面積(AUROC),比現(xiàn)有的三種深度學(xué)習(xí)方法均高出 10% 及以上。在從獨(dú)立隊(duì)列收集的所有五個(gè)活檢數(shù)據(jù)集中,CHIEF 在包括食管、胃、結(jié)腸和前列腺在內(nèi)的幾種癌癥類型中的 AUROCs 均大于 0.96。在使用涵蓋五種癌癥類型(即結(jié)腸、乳腺、子宮內(nèi)膜、肺和宮頸)的七個(gè)手術(shù)切除切片集進(jìn)行獨(dú)立驗(yàn)證時(shí),CHIEF 的 AUROCs 大于 0.90。這些結(jié)果證明了CHIEF在國際上不同來源的多樣化癌癥組織和樣本中的泛化能力。
圖 | CHIEF 的表現(xiàn)優(yōu)于最先進(jìn)的深度學(xué)習(xí)方法。
AI 正幫助人類攻破癌癥
在醫(yī)療健康領(lǐng)域, AI 正逐漸展現(xiàn)出其獨(dú)特的價(jià)值;特別是在癌癥的早期篩查和檢測方面,AI 技術(shù)的應(yīng)用正日益成為攻克這一難題的關(guān)鍵力量。層出不窮的研究成果不斷推動(dòng)著這一領(lǐng)域的快速發(fā)展。
今年 6 月,倫敦帝國理工學(xué)院與劍橋大學(xué)的研究團(tuán)隊(duì)聯(lián)合訓(xùn)練出一種新型 AI 模型——EMethylNET。該模型通過分析 DNA 甲基化模式,能夠在非癌變組織中準(zhǔn)確識(shí)別出 13 種不同類型的癌癥,包括乳腺癌、肝癌、肺癌和前列腺癌等,其檢測準(zhǔn)確率高達(dá) 98.2%,為早期癌癥的發(fā)現(xiàn)提供了強(qiáng)有力的技術(shù)支持。
7 月,哈佛醫(yī)學(xué)院的研究團(tuán)隊(duì)與合作伙伴共同開發(fā)了一款針對人類病理學(xué)領(lǐng)域的視覺語言通用 AI 助手——PathChat。該系統(tǒng)在處理活檢切片時(shí),能夠正確識(shí)別疾病的準(zhǔn)確率達(dá)到近 90%,其性能超越了當(dāng)前市場上的通用 AI 模型如 GPT-4V 以及專業(yè)醫(yī)療模型。相關(guān)研究論文已發(fā)表在科學(xué)期刊 Nature 上。
此外,有研究團(tuán)隊(duì)致力于利用 AI 技術(shù)操控細(xì)胞命運(yùn),實(shí)現(xiàn)了將癌細(xì)胞轉(zhuǎn)化為免疫細(xì)胞的突破。今年 8 月,南加州大學(xué)(USC)凱克醫(yī)學(xué)院的學(xué)者們在美國國立衛(wèi)生研究院(NIH)的資助下,開展了一項(xiàng)創(chuàng)新研究。他們利用 AI 識(shí)別并重新編程膠質(zhì)母細(xì)胞瘤細(xì)胞的基因,將其轉(zhuǎn)變?yōu)榫哂锌拱┠芰Φ臉渫粻罴?xì)胞,有效地瞄準(zhǔn)并摧毀周圍的癌細(xì)胞。在膠質(zhì)母細(xì)胞瘤小鼠模型中,這一方法顯著提高了 75% 的生存機(jī)會(huì),為癌癥治療提供了新的視角。
與此同時(shí),考慮到藥物耐受性問題,有研究團(tuán)隊(duì)將焦點(diǎn)轉(zhuǎn)向轉(zhuǎn)移性癌癥,利用 AI 技術(shù)開發(fā)出個(gè)性化的癌癥治療策略。今年 6 月,來自牛津大學(xué)等研究機(jī)構(gòu)的科學(xué)家們通過跨學(xué)科聯(lián)合研究,引入了一種新型框架,該框架能夠應(yīng)用深度強(qiáng)化學(xué)習(xí)為前列腺癌患者制定適應(yīng)性治療計(jì)劃。研究結(jié)果顯示,與依賴最大耐受劑量或非個(gè)性化間歇治療相比,這種新型適應(yīng)性方法能顯著延長患者無復(fù)發(fā)的時(shí)間,最長可達(dá)兩倍,為個(gè)性化癌癥治療開辟了新路徑。
或許在不遠(yuǎn)的將來,人類在 AI 的幫助下,從此不再談“癌癥”色變。