“耗時(shí)五年,這個心血管RWE研究項(xiàng)目終于發(fā)表了?!?/p>
“讀博的時(shí)候參與的項(xiàng)目,現(xiàn)在畢業(yè)2年了,項(xiàng)目終于發(fā)表了!”……
這些對于醫(yī)學(xué)研究人員及相關(guān)從業(yè)者,是最熟悉不過的場景。從臨床問題的確定、到數(shù)據(jù)情況評估、研究設(shè)計(jì)選擇,以及統(tǒng)計(jì)方法確定、數(shù)據(jù)管理、開始研究、結(jié)果解讀和評價(jià)、事后分析等等一系列環(huán)節(jié),為了提升項(xiàng)目結(jié)果價(jià)值,傳統(tǒng)做法上每個環(huán)節(jié)都需要耗費(fèi)大量人力物力。而在最新的一場醫(yī)藥行業(yè)相關(guān)發(fā)布會中,記者了解到行業(yè)前沿的研究團(tuán)隊(duì),已開始用“人工智能+”的大模型方式,“革新”了醫(yī)藥行業(yè)的研究全鏈路。
近日,一場屬于醫(yī)藥人的AI盛會在上海隆重舉行,該會議由CphMRA主辦,健交科技承辦,以"人工智能+醫(yī)藥,新質(zhì)生產(chǎn)力"為主題,會上同時(shí)宣布"CphMRA醫(yī)藥大模型專業(yè)組"正式成立,開啟醫(yī)藥研究AI時(shí)代。專業(yè)組組長單位健交科技,在此次會議上重磅發(fā)布由其自主研發(fā)的GPT Hybrid專利技術(shù)驅(qū)動的【PDS?人工智能醫(yī)藥研究平臺】。健交科技首席科學(xué)家湯子歐博士向記者介紹到:PDS?平臺可提供針對醫(yī)藥研究全流程的"數(shù)據(jù)治理-信息提取-知識發(fā)現(xiàn)-建模預(yù)測-擴(kuò)展應(yīng)用"一站式應(yīng)用,將一改過往耗時(shí)耗力的醫(yī)藥項(xiàng)目研究狀態(tài),"讓真理更快被發(fā)現(xiàn),讓醫(yī)藥人工作更高效"。
1**、一個“靈感”,造就比GPTs(Agent)早4個月誕生的領(lǐng)先技術(shù)**
采訪過程中,記者了解到,健交科技的GPT Hybrid專利算法架構(gòu)比GPTs(Agent)宣布時(shí)間還要早4個月申請專利,可以說是首個基于GPT Hybrid架構(gòu)并融匯LLM、神經(jīng)網(wǎng)絡(luò)、精算模型、矢量建模等聯(lián)合決策訓(xùn)練的人工智能自適應(yīng)、自學(xué)習(xí)算法體系(GPT-H)。而這一切都源自于健交科技首席科學(xué)家湯子歐博士的一個“靈感”——大語言模型(LLM)的“兩個天生BUG”,相關(guān)研究成果已刊登于科學(xué)中國。
湯子歐博士介紹到,科學(xué)層面上,LLM的工作原理是基于注意力機(jī)制進(jìn)行文本預(yù)測的算法模型,對于數(shù)值型預(yù)測工作,LLM仍然是把數(shù)字當(dāng)成文本進(jìn)行處理并運(yùn)用文本注意力機(jī)制進(jìn)行文本型數(shù)字的選取和產(chǎn)生,對于數(shù)值型預(yù)測工作結(jié)果的精度和可重復(fù)性不具備技術(shù)上的優(yōu)勢,其結(jié)果也就較差,甚至對于數(shù)值型預(yù)測工作無法回答問題;哲學(xué)層面上,“LLM威脅論”認(rèn)為LLM可能很快會通過學(xué)習(xí)全部人類語料后超越人類,然而,這個認(rèn)知存在邏輯悖論。
總結(jié)來看,大語言模型(LLM)的“兩個天生BUG”其一,LLM還不能很好的勝任數(shù)值型預(yù)測工作;其二,LLM難以超越人類語料,因此“LLM威脅論”的認(rèn)知目前無法成立。認(rèn)識到LLM的這“兩個天生BUG”,也為我們進(jìn)一步提升AI的能力找到了可行的路徑,健交科技的(GPT Hybrid)專利技術(shù)集群應(yīng)時(shí)而生。
然而,從靈感到技術(shù)群實(shí)現(xiàn),再到應(yīng)用落地,以及最終實(shí)現(xiàn)商業(yè)化,這條路并不好走。尤其是在如此火熱的市場環(huán)境下,各類新興的大模型正以肉眼可見的速度“席卷”大健康行業(yè)。但應(yīng)用過于分散、不成體系、深度不夠則是整個行業(yè)都在努力突破的痛點(diǎn)?!班孱^很多,變現(xiàn)很難”是一位行業(yè)資深專家對如今大模型產(chǎn)品的形容。針對這個現(xiàn)狀,湯子歐博士也早已進(jìn)行布局。
2**、走出“無人區(qū)”,要讓醫(yī)藥場景化應(yīng)用價(jià)值“遙遙領(lǐng)先”**
“我對自己的定位是一個研究人員,帶著研究團(tuán)隊(duì)經(jīng)常就是沒日沒夜在無人區(qū)進(jìn)行探索?!睖託W博士說到。作為最早一批EDA拓荒者,從20世紀(jì)90年代起,湯子歐博士便已開始大數(shù)據(jù)挖掘與研究工作?!耙苍S是因?yàn)閺臉I(yè)經(jīng)歷、又或者是巧合,在無人區(qū)默默耕耘十余載以后,我們研究團(tuán)隊(duì)的成果竟與醫(yī)療醫(yī)藥行業(yè)場景化應(yīng)用需求不謀而合?!?/p>
技術(shù)上實(shí)現(xiàn)多元融合,沒有天花板:從【PDS?人工智能醫(yī)藥研究平臺】發(fā)布這一時(shí)刻開始,宣告大語言模型和相關(guān)的AI技術(shù)正式形成合力,幫助醫(yī)藥人高效探究客觀世界的真理。場景上實(shí)現(xiàn)多維全覆蓋,【PDS?人工智能醫(yī)藥研究平臺】,一站式解決"數(shù)據(jù)治理-信息提取-知識發(fā)現(xiàn)-建模預(yù)測-擴(kuò)展應(yīng)用"醫(yī)藥研究全流程。
圖:健交科技首席科學(xué)家湯子歐博士現(xiàn)場展示【PDS?人工智能醫(yī)藥研究平臺】
湯子歐博士詳細(xì)介紹了PDS?平臺,其內(nèi)核包括:
人工智能數(shù)據(jù)預(yù)處理系統(tǒng)TM——首個基于GPT Hybrid架構(gòu)的智能自學(xué)習(xí)自進(jìn)化的數(shù)據(jù)質(zhì)量評價(jià)和清洗系統(tǒng),從過去的“規(guī)則窮舉驅(qū)動”向“Gen AI 自動進(jìn)化”的質(zhì)的飛躍。在數(shù)據(jù)預(yù)處理階段,實(shí)現(xiàn)自動進(jìn)化、流程簡化、高標(biāo)準(zhǔn)少誤差與靈活迭代,運(yùn)用自學(xué)習(xí)自適應(yīng)機(jī)制可以“越用越好用”。可用于某類適應(yīng)癥人群數(shù)據(jù)處理、某類藥品使用情況數(shù)據(jù)處理、某類手術(shù)數(shù)據(jù)處理等;
人工智能知識萃取系統(tǒng)TM——首個基于GPT Hybrid架構(gòu)的信息自動萃取問答系統(tǒng),從過去“關(guān)鍵詞檢索”向“智能化知識萃取”的飛躍,并能自動權(quán)衡類似知識的優(yōu)先級和權(quán)威性,內(nèi)容回答科學(xué)、準(zhǔn)確且全面。首個應(yīng)用場景已經(jīng)在醫(yī)學(xué)知識問答中落地,這個“醫(yī)問智答TM”智能助手能夠應(yīng)用于患者教育、醫(yī)生提升技能水平等;其他應(yīng)用場景還包括“出院小結(jié)解讀助手”,瞬時(shí)提取關(guān)鍵信息,提供知識點(diǎn)、綜述、參考資料等關(guān)鍵信息,可用于患者服務(wù)或住院相關(guān)研究;
人工智能數(shù)據(jù)挖掘系統(tǒng)TM——首個基于GPT Hybrid架構(gòu)的自動知識挖掘系統(tǒng),從過去“人工分析”向“大模型、神經(jīng)網(wǎng)絡(luò)和自研技術(shù)高效聯(lián)動,自動智能挖掘”的質(zhì)的飛躍。在數(shù)據(jù)挖掘知識發(fā)現(xiàn)工作中,支持海量大數(shù)據(jù)多表復(fù)雜邏輯關(guān)系解析,支持各種觀察視角,實(shí)時(shí)人機(jī)交互產(chǎn)生數(shù)據(jù)挖掘結(jié)果,并實(shí)時(shí)啟發(fā)進(jìn)一步挖掘方向等思路。首個應(yīng)用場景是用于醫(yī)藥真實(shí)世界研究的“人工智能醫(yī)學(xué)科研助手TM”,自適應(yīng)多元異構(gòu)大數(shù)據(jù)源,從適應(yīng)癥、藥品、行為等多個視角出發(fā),無邊界地進(jìn)行患者特征、化驗(yàn)、檢查、診斷、用藥、手術(shù)、趨勢、路徑、旅程等各種行為的分析、比較、建模、預(yù)測等的人工智能化挖掘分析。
人工智能矢量建模系統(tǒng)TM——首個基于GPT Hybrid架構(gòu)并融匯機(jī)器學(xué)習(xí)和精算模型多領(lǐng)域技術(shù)的建模和決策支持系統(tǒng),從過去“人工分析-篩選-再分析”向“人工智能自動跨范式建模和自動篩選并實(shí)時(shí)應(yīng)用生產(chǎn)”的飛躍。首個應(yīng)用場景已經(jīng)實(shí)現(xiàn)在“人工智能醫(yī)療行為風(fēng)控助手TM”,不同于傳統(tǒng)的幾個月甚至幾年的大人群大數(shù)據(jù)統(tǒng)計(jì)分析,可以在數(shù)天內(nèi)通過大規(guī)模計(jì)算自動產(chǎn)生和迭代最優(yōu)化的海量行為模式的海量模型,可用于疾病負(fù)擔(dān)分析、疾病負(fù)擔(dān)預(yù)測、重疾預(yù)測與特定疾病缺失值的預(yù)測、病種費(fèi)用合理性評估等等,更好地管理和優(yōu)化醫(yī)療服務(wù)的成效。
人工智能診斷系統(tǒng)TM——首個基于GPT Hybrid架構(gòu)的LLM與神經(jīng)網(wǎng)絡(luò)技術(shù)聯(lián)合決策訓(xùn)練的智能診斷系統(tǒng),從過去“專家經(jīng)驗(yàn)判斷或臨床路徑或診斷決策樹的封閉式選項(xiàng)”或“不嚴(yán)謹(jǐn)?shù)纳晌淖帧毕颉吧墒紸I不斷總結(jié)和逼近人類診斷經(jīng)驗(yàn)極限”的躍遷。在底層算料選用國際權(quán)威機(jī)構(gòu)金標(biāo)準(zhǔn)并輔以“人工智能數(shù)據(jù)挖掘系統(tǒng)TM”實(shí)證研究支持迭代進(jìn)化,一改以往固化的選擇題模式,用自然語言結(jié)合啟發(fā)式問答形式,幫助醫(yī)生或患者快速精準(zhǔn)發(fā)現(xiàn)診斷或備選診斷,提升診療效率和診斷科學(xué)性、一致性。
3**、GPT-Hybrid,可能是邁向通用人工智能****(AGI)**的“中國解”
用GPT Hybrid打造了【PDS?人工智能醫(yī)藥研究平臺】,在湯子歐博士看來還遠(yuǎn)遠(yuǎn)不夠?!跋乱徊接?jì)劃不斷加強(qiáng)PDS?的能力,尤其是通過其內(nèi)部知識萃取、數(shù)據(jù)挖掘、矢量建模等AI能力的相互加持和循環(huán)推動去逐步實(shí)現(xiàn)和強(qiáng)化“人工智能發(fā)現(xiàn)新知識”的能力。我們希望這是一條逐步逼近AGI的可行路徑。”在(GPT Hybrid, GPT-H)專利算法架構(gòu)、(Multi-order GPT, MO-GPT)專利計(jì)算架構(gòu)、(Real World Tracing Matrix, RWT)專利生產(chǎn)架構(gòu)等相關(guān)技術(shù)集群不斷進(jìn)化與迭代中,健交科技已邁入下一個無人區(qū)。
聯(lián)想到此前人民論壇與科學(xué)中國等相關(guān)權(quán)威媒體提到的大語言模型(LLM)的局限性等相關(guān)文章披露,GPT-Hybrid專利算法框架是否會成為邁向通用人工智能(AGI)的“中國解”?