隨著 AI 技術(shù)在我們?nèi)粘I钪械膹V泛應(yīng)用,**模型的「可解釋性」逐漸成為一個(gè)亟待解決的問(wèn)題。**尤其是在涉及人類生命、財(cái)產(chǎn)安全等任務(wù)時(shí),這種「黑盒」算法不僅削弱了用戶對(duì) AI 系統(tǒng)的信任,還引發(fā)了一系列問(wèn)題,比如安全、歧視等。
在時(shí)間序列預(yù)測(cè)任務(wù)上,這一問(wèn)題尤為突出。**時(shí)間序列預(yù)測(cè)涉及多個(gè)關(guān)鍵行業(yè),包括但不限于股市預(yù)測(cè)、疾病預(yù)測(cè)、能源預(yù)測(cè)、天氣預(yù)報(bào)等,在這些領(lǐng)域的任務(wù)中,理解 AI 決策背后的原因至關(guān)重要。**以疾病預(yù)測(cè)為例,醫(yī)生和患者不僅需要知道 AI 的預(yù)測(cè)結(jié)果,還需要了解這些結(jié)果是如何得出的,若能夠清楚地指出哪些癥狀對(duì)診斷起關(guān)鍵作用,將會(huì)增強(qiáng)醫(yī)生和患者對(duì) AI 輔助醫(yī)療診斷的信任度。
為了讓時(shí)間序列預(yù)測(cè)不僅僅是一個(gè)精確的數(shù)字,而是一個(gè)可以「看得見(jiàn)」的過(guò)程,**華中科技大學(xué)陸楓團(tuán)隊(duì)聯(lián)合悉尼大學(xué) Zomaya 院士團(tuán)隊(duì)、同濟(jì)醫(yī)院,提出了一種新的方法——CGS-Mask,**通過(guò)將時(shí)間序列預(yù)測(cè)與可解釋性結(jié)合,該方法既能提高模型預(yù)測(cè)精度,又能使預(yù)測(cè)結(jié)果更加直觀和可解釋。
具體而言,通過(guò)引入掩膜機(jī)制,模型能夠突出顯示哪些時(shí)刻、哪些數(shù)據(jù)對(duì)最終結(jié)果影響最大,就像在開(kāi)車時(shí)為你清晰地標(biāo)出路上的重要標(biāo)志,讓你明白為何要做出某個(gè)轉(zhuǎn)彎或減速?zèng)Q策。這種方法在醫(yī)療保健、天文學(xué)、傳感器和能源等領(lǐng)域有廣泛的應(yīng)用潛力,在需要與用戶互動(dòng)的時(shí)間序列預(yù)測(cè)任務(wù)中更為顯著。
該成果以「CGS-Mask: Making Time Series Predictions Intuitive for All」為題,已被國(guó)際頂尖人工智能會(huì)議 Proceedings of the 38th AAAI Conference on Artificial Intelligence (AAAI’24) 接受發(fā)表。
研究亮點(diǎn):
* 相比傳統(tǒng)方法,CGS-Mask 能更清晰地顯示哪些時(shí)間段對(duì)預(yù)測(cè)結(jié)果最重要,哪些因素不重要,讓用戶更容易理解預(yù)測(cè)過(guò)程
* CGS-Mask 適用于各種時(shí)間序列預(yù)測(cè)任務(wù),尤其是那些需要與用戶互動(dòng)并解釋結(jié)果的場(chǎng)景,例如,股市預(yù)測(cè)、疾病預(yù)測(cè)和天氣預(yù)報(bào)等
* CGS-Mask 在精度、可解釋性和直觀性上都比其他方法更優(yōu)秀,它減少了「黑盒」問(wèn)題,提升了模型的透明度。通過(guò)該方法,非專業(yè)人士也能理解模型的預(yù)測(cè)結(jié)果,對(duì)用戶更友好,增強(qiáng)了模型的可應(yīng)用性和可信度
* 未來(lái),研究人員將積極增強(qiáng) CGS-Mask,致力于證明 CGS-Mask 在更多時(shí)間序列應(yīng)用中的適用性,特別是在醫(yī)療保健領(lǐng)域,將該方法用于從病歷中識(shí)別顯著特征,以揭示疾病的發(fā)生、發(fā)展和惡化
**數(shù)據(jù)集:合成數(shù)據(jù)+真實(shí)世界數(shù)據(jù),覆蓋醫(yī)療保健、天文學(xué)、傳感器和能源領(lǐng)域
研究人員選用的合成數(shù)據(jù)集有 4 個(gè),**分別是「rare features」、「rare time」、「mixture」和「random」。
* rare features 和 rare time 數(shù)據(jù)集分別包含一小部分顯著特征和一小部分顯著時(shí)間點(diǎn)
* mixture 數(shù)據(jù)集由 rare features 和 rare time 整合創(chuàng)建
* random 數(shù)據(jù)集的顯著輸入?yún)^(qū)域是隨機(jī)定位的
**研究人員選用的真實(shí)世界數(shù)據(jù)集分別是:MIMIC-III 數(shù)據(jù)集、LSST 數(shù)據(jù)集、NATOPS 數(shù)據(jù)集、AE 數(shù)據(jù)集。**這些數(shù)據(jù)集覆蓋了醫(yī)療保健、天文學(xué)、傳感器和能源等領(lǐng)域,用于評(píng)估 CGS-Mask 在不同領(lǐng)域的性能。
MIMIC-III 數(shù)據(jù)集:包含 4 萬(wàn)名重癥監(jiān)護(hù)室 (ICU) 患者的健康記錄,每個(gè)患者有 31 個(gè)特征,用于預(yù)測(cè)患者在接下來(lái) 48 小時(shí)內(nèi)的存活率。這是一個(gè)二分類任務(wù),目標(biāo)是區(qū)分患者是否會(huì)存活或死亡。
**LSST 數(shù)據(jù)集:**模擬天文時(shí)間序列數(shù)據(jù),為大型綜合巡天望遠(yuǎn)鏡 (Large Synoptic Survey Telescope) 的觀測(cè)做準(zhǔn)備。預(yù)測(cè)模型需要將這些數(shù)據(jù)分類為 14 個(gè)不同的天文類別。
**NATOPS 數(shù)據(jù)集:**由手勢(shì)識(shí)別傳感器生成,記錄了手、肘、腕和拇指的傳感器數(shù)據(jù)。這些數(shù)據(jù)需要被分類為 6 種不同的手勢(shì)。
**AE 數(shù)據(jù)集:**來(lái)源于 UCI 存儲(chǔ)庫(kù)的家用電器能源預(yù)測(cè)數(shù)據(jù)集,用于預(yù)測(cè)房屋的總能源使用量。這是一個(gè)回歸任務(wù),預(yù)測(cè)模型的輸出是一個(gè)能代表總能源使用量的數(shù)值。
模型架構(gòu):優(yōu)化條形掩碼,CGS-Mask 提供清晰、直觀的時(shí)間序列預(yù)測(cè)解釋
CGS-Mask 是一種基于細(xì)胞遺傳條形掩碼 (Cellular Genetic Strip Mask) 的顯著性方法,通過(guò)結(jié)合細(xì)胞遺傳算法來(lái)優(yōu)化條形掩碼,可以解決時(shí)間序列預(yù)測(cè)任務(wù)中的「黑盒」問(wèn)題,提高模型的可解釋性。
* 條形掩碼將連續(xù)的時(shí)間步驟視為一個(gè)整體來(lái)評(píng)估特征的影響,能夠有效地捕捉時(shí)間序列數(shù)據(jù)的時(shí)間依賴性;條形掩碼的二進(jìn)制值(0 或 1)增強(qiáng)了結(jié)果的可解釋性,使顯著性評(píng)分更加直觀。
優(yōu)化條形掩碼的具體步驟為,首先,創(chuàng)建一組條形掩碼并將它們映射到元胞自動(dòng)機(jī)中;隨后,通過(guò)使用遺傳操作(如交叉、變異和平移等)來(lái)優(yōu)化每個(gè)掩碼,使其進(jìn)化到下一代;經(jīng)過(guò) N 輪代之后,將選擇具有最高適應(yīng)度值的掩碼作為最優(yōu)掩碼。CGS-Mask 整體框架如下圖所示:
CGS-Mask 的整體框架圖
**初始化種群 (Population initialization):**隨機(jī)初始化一個(gè)條形掩碼的種群,將這些掩碼映射到一個(gè)二維的元胞自動(dòng)機(jī)中。
**適應(yīng)度評(píng)估:**計(jì)算每個(gè)條形掩碼的適應(yīng)度值 (fitness value),并通過(guò)定義的擾動(dòng)誤差進(jìn)行評(píng)估,該誤差衡量了掩碼對(duì)模型預(yù)測(cè)的影響。
遺傳算子優(yōu)化:使用交叉、變異和平移等遺傳算子優(yōu)化每個(gè)掩碼。
* 交叉 (Crossover):算法在鄰居掩碼之間執(zhí)行交叉操作,以生成新的掩碼。在 CGS-Mask 中,條帶是遺傳操作的基本單位。新掩碼的條帶可以從任一父代中繼承。
* 變異 (Mutation):通過(guò)一定概率替換掩碼中的條帶來(lái)增加遺傳多樣性,并防止算法過(guò)早收斂到局部最優(yōu)解。
* 平移 (Translation):調(diào)整條帶在時(shí)間線上的位置偏移,以優(yōu)化條形掩碼。這有助于微調(diào)條帶的位置,使其更準(zhǔn)確地對(duì)齊到輸入數(shù)據(jù)中的真實(shí)顯著區(qū)域。
**迭代進(jìn)化:**通過(guò)迭代應(yīng)用上述遺傳算子,種群中的掩碼不斷進(jìn)化,以尋找具有更高適應(yīng)度值的掩碼。
**選擇最優(yōu)掩碼:**經(jīng)過(guò) N 輪迭代后,選擇適應(yīng)度值最高的掩碼作為最優(yōu)掩碼(Optimal Mask M*)。
**CGS-Mask 結(jié)合細(xì)胞自動(dòng)機(jī)和遺傳算法,能夠有效地優(yōu)化條形掩碼,以提供清晰、直觀的時(shí)間序列預(yù)測(cè)解釋。這種方法不需要模型內(nèi)部信息,因此適用于各種黑盒模型,能夠快速地為用戶提供有意義的解釋。
實(shí)驗(yàn)結(jié)論:CGS-Mask 可有效識(shí)別隨時(shí)間變化的顯著特征,揭示疾病發(fā)展、惡化關(guān)鍵因素**
為評(píng)估 CGS-Mask 方法的性能,研究人員在合成數(shù)據(jù)集和真實(shí)世界數(shù)據(jù)集上將其與其他 8 種最先進(jìn)的顯著性方法進(jìn)行了比較。這些方法包括 Dynamask、DeepLIFT、RISE、FIT、Shapley Value Sampling (SVS)、Feature Occlusion (FO)、Feature Permutation (FP) 以及 Integrated Gradient (IG)。如下圖所示,實(shí)驗(yàn)結(jié)果表明,CGS-Mask 在確定顯著特征方面展現(xiàn)出了更高的準(zhǔn)確性,這表明它能夠更有效地識(shí)別那些隨時(shí)間變化的顯著特征。
真實(shí)世界數(shù)據(jù)集上的對(duì)比結(jié)果
以在醫(yī)療健康領(lǐng)域的應(yīng)用為例,研究人員選擇 MIMIC-III 數(shù)據(jù)集,預(yù)測(cè)患者在接下來(lái) 48 小時(shí)內(nèi)的存活率。不同方法對(duì)比如下圖所示,圖 f 為 CGS-Mask 預(yù)測(cè)結(jié)果,綠色條表明與患者結(jié)果相關(guān)的關(guān)鍵特征,**研究發(fā)現(xiàn),血壓下降、心率心動(dòng)過(guò)速、呼吸急促都預(yù)示著死亡風(fēng)險(xiǎn)迫在眉睫,醫(yī)生能夠根據(jù)這些特征及時(shí)進(jìn)行干預(yù)。**然而,其他對(duì)比方法沒(méi)有明確識(shí)別導(dǎo)致這一結(jié)果的時(shí)期和特征,如圖 (a)?(d) 所示。
為了評(píng)估生成的掩碼的易讀性,研究人員對(duì) 254 名不同年齡組(5-83 歲)、不同領(lǐng)域知識(shí)水平的參與者進(jìn)行了調(diào)查。結(jié)果顯示,超過(guò) 65% 的用戶將 CGS-Mask 評(píng)為最能幫助他們理解顯著特征及其時(shí)間相關(guān)性的方法,超 85% 的用戶將其排在前 3 名。
此外,研究人員還進(jìn)行了一項(xiàng)試點(diǎn)用戶研究,以評(píng)估使用 3 種顯著性掩碼(Q1、Q2 和 Q3)在 10 個(gè)時(shí)間步內(nèi)確定 4 個(gè)特征(A、B、C 和 D)時(shí)的特征重要性反應(yīng)時(shí)間和準(zhǔn)確性。如下圖所示,使用 CGS-Mask (Q2) 的用戶平均反應(yīng)時(shí)間為 6.26 秒,準(zhǔn)確率為 85.4 %,而使用數(shù)值掩碼 (Q1 和 Q3) 的用戶平均反應(yīng)時(shí)間為 19.22 秒,準(zhǔn)確率僅為 40.6%。這表明 CGS-Mask 能夠更快地幫助用戶識(shí)別特征重要性,并且具有更高的準(zhǔn)確性。
用戶響應(yīng)時(shí)間和選擇結(jié)果
綜上所述,CGS-Mask 作為一種與模型無(wú)關(guān)的顯著性方法,不僅直觀且用戶友好,能夠有效解釋時(shí)間序列預(yù)測(cè)。無(wú)論是在合成數(shù)據(jù)還是真實(shí)世界數(shù)據(jù)中,其表現(xiàn)均超越了現(xiàn)有解決方案。**特別是在醫(yī)療領(lǐng)域,CGS-Mask 在識(shí)別醫(yī)療記錄中的顯著特征方面展現(xiàn)出卓越能力,對(duì)于揭示疾病的發(fā)生、發(fā)展和惡化過(guò)程具有重要意義,具有巨大的應(yīng)用潛力。
時(shí)間序列預(yù)測(cè)模型在醫(yī)療領(lǐng)域的前沿應(yīng)用**
時(shí)間序列預(yù)測(cè)是對(duì)具有時(shí)間順序的數(shù)據(jù)進(jìn)行分析,旨在通過(guò)構(gòu)建模型來(lái)捕捉數(shù)據(jù)中的趨勢(shì)、季節(jié)性和周期性模式。這些模型不僅能夠預(yù)測(cè)歷史數(shù)據(jù)的變化規(guī)律,還能對(duì)未來(lái)的發(fā)展趨勢(shì)做出分析,其應(yīng)用十分廣泛,涵蓋了金融、氣象、醫(yī)療、交通和能源預(yù)測(cè)等多個(gè)領(lǐng)域。
**在醫(yī)療領(lǐng)域,本文的第一作者,華中科技大學(xué)的陸楓教授持續(xù)關(guān)注序列預(yù)測(cè)模型的應(yīng)用,**除了上述研究外,她還曾與悉尼大學(xué)團(tuán)隊(duì)合作,在 Proceedings of the 37 AAAI Conference on Artificial Intelligence (AAAI’23) 上發(fā)表論文「A Composite Multi-Attention Framework for Intraoperative Hypotension Early Warning」。
在這篇論文中,研究人員提出了一個(gè)基于多模態(tài)與注意力機(jī)制的術(shù)中低血壓跟隨性預(yù)警框架。在兩個(gè)大規(guī)模真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)表明,這種方法對(duì)于術(shù)中低血壓事件早期預(yù)警可以達(dá)到高達(dá) 94.1% 的準(zhǔn)確率,同時(shí)對(duì)信號(hào)采樣率的要求大幅降低 3,000 倍。此外,在最具挑戰(zhàn)性的 15 分鐘平均動(dòng)脈壓預(yù)測(cè)任務(wù)中,多模態(tài)框架實(shí)現(xiàn)了 4.48 毫米汞柱的平均絕對(duì)誤差,與現(xiàn)有解決方案相比,誤差降低了 42.9%。
同樣地,南京醫(yī)科大學(xué)的研究團(tuán)隊(duì)也曾開(kāi)發(fā)了一個(gè)時(shí)間序列模型,用于預(yù)測(cè)肝炎的發(fā)病情況。利用季節(jié)自回歸移動(dòng)平均模型和季節(jié)指數(shù)平滑模型,他們分析了不同類型肝炎的發(fā)病例數(shù)。
研究發(fā)現(xiàn),每年 3 月是各種肝炎的高發(fā)期。在過(guò)去 10 年,甲型肝炎的發(fā)病率整體呈下降趨勢(shì);乙型肝炎的發(fā)病率波動(dòng)不定,最近幾年有所增加;丙型肝炎的發(fā)病率持續(xù)上升;而戊型肝炎的發(fā)病率基本保持穩(wěn)定。這些發(fā)現(xiàn)為制定更有效的肝炎防控措施提供了重要的依據(jù)。該研究以「Time series analysis and forecasting of four hepatitis epidemic trends in China from 2012 to 2021」為題,發(fā)表于 Journal of Nanjing Medical University (Natural Sciences) 上。
綜上,時(shí)間序列預(yù)測(cè)技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用展現(xiàn)出了巨大的潛力,隨著科技的不斷進(jìn)步和數(shù)據(jù)的日益豐富,未來(lái),我們期待看到更多創(chuàng)新性的時(shí)間序列預(yù)測(cè)模型和方法,為人類的健康福祉貢獻(xiàn)更大的力量。