版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

AGI離我們還有多遠(yuǎn)?大模型不是最終解,世界模型才是未來(lái)

學(xué)術(shù)頭條
一起見證人類探索征途上的每一個(gè)重大突破。
收藏

在科幻電影中,類似于賈維斯(J.A.R.V.I.S.)一般的 AI 系統(tǒng),幾乎無(wú)所不能,是幫助人類解決各種各樣難題的終極助手。

它們的背后,是一種人們追求最高級(jí) AI 的追求,而這一概念,被稱為通用人工智能(Artificial General Intelligence,AGI)。

圖片

AGI的概念可以追溯到20世紀(jì)中期,當(dāng)時(shí)許多計(jì)算機(jī)科學(xué)家和 AI 研究人員開始思考如何構(gòu)建具有人類智能的計(jì)算機(jī)程序,與狹義 AI(Narrow AI)系統(tǒng)專注于解決特定任務(wù)不同,AGI被賦予了更廣泛的認(rèn)知和推理能力,能夠在多個(gè)領(lǐng)域進(jìn)行學(xué)習(xí)、適應(yīng)和執(zhí)行任務(wù)。

然而,在很長(zhǎng)一段時(shí)間里,AI 的相關(guān)研究主要集中在解決特定問(wèn)題和任務(wù)上,而AGI的實(shí)現(xiàn)一直被認(rèn)為是一個(gè)更為復(fù)雜和遙遠(yuǎn)的目標(biāo)。

近日,花旗銀行數(shù)據(jù)科學(xué)副總裁 Valentino Zocca 博士在一篇題為《我們離AGI還有多遠(yuǎn)?》(How far are we from AGI?)的文章中,就 AGI 和其他有關(guān)的重要議題展開了深度分析。核心觀點(diǎn)如下:

與目前的狹義人工智能相比,AGI 需要能夠在多個(gè)認(rèn)知領(lǐng)域進(jìn)行推理和學(xué)習(xí)。然而,實(shí)現(xiàn) AGI 仍然存在許多挑戰(zhàn),如構(gòu)建世界模型、進(jìn)行因果推理等。

大型語(yǔ)言模型(如 GPT-4)在解決特定任務(wù)和提取因果關(guān)系方面表現(xiàn)出色,但缺乏抽象的因果推理能力。它們傾向于從數(shù)據(jù)中提取已知的因果模式,而無(wú)法生成新的因果見解。

一些研究者認(rèn)為,現(xiàn)有的大型語(yǔ)言模型(如 GPT-4)可能是邁向 AGI 的一步,但仍然存在許多未解決的問(wèn)題,如創(chuàng)建世界模型、實(shí)現(xiàn)自我探究和進(jìn)行因果演繹等。

大型語(yǔ)言模型善于從數(shù)據(jù)中識(shí)別和提取因果關(guān)系,但缺乏自己主動(dòng)推理新的因果場(chǎng)景的能力。它們具備通過(guò)觀察進(jìn)行因果歸納的能力,但不具備因果演繹的能力。

AI 可能無(wú)法真正“學(xué)習(xí)”,而只能提煉信息或經(jīng)驗(yàn)。AI 不是形成一個(gè)全面的世界模型,而是創(chuàng)建了一個(gè)概要。

將分?jǐn)?shù)當(dāng)作能力的標(biāo)志,AI 就好像只看到了世界的一個(gè)粗略概述,而沒(méi)有真正理解整個(gè)世界的本質(zhì)。

我們不應(yīng)將智能僅僅視為一種抽象的能力,即找到解決一般問(wèn)題的方法,而應(yīng)將其看作是一種具體的能力,即將從先前經(jīng)驗(yàn)中學(xué)習(xí)到的解決方案應(yīng)用于我們所處環(huán)境中可能出現(xiàn)的不同情況。

只有當(dāng)我們能夠創(chuàng)造出一個(gè)可以懷疑自身現(xiàn)實(shí)的系統(tǒng),進(jìn)行自我探索,至少能夠應(yīng)用因果演繹來(lái)建立一個(gè)合理的世界模型時(shí),我們才能真正實(shí)現(xiàn) AGI。學(xué)術(shù)頭條在不改變?cè)拇笠獾那闆r下,做了簡(jiǎn)單的編譯。內(nèi)容如下:

大約 20 萬(wàn)年前,我們?nèi)祟愰_始在地球上行走,同時(shí)也在思想和知識(shí)的領(lǐng)域中探索。人類歷史上的一系列發(fā)現(xiàn)和發(fā)明塑造了這段歷史。其中一部分不僅影響了我們的歷史走向,還潛移默化地影響了我們的生物學(xué)。例如,火的發(fā)現(xiàn)賦予我們祖先烹飪食物的能力,從而將熱量轉(zhuǎn)移到大腦的進(jìn)化上,而非僅用于消化道,這推動(dòng)了人類智力的進(jìn)步。

從車輪的發(fā)明到蒸汽機(jī)的誕生,人類迎來(lái)了工業(yè)革命。在這段變革的歷程中,電力大大催生了我們熟知的技術(shù)進(jìn)步。而印刷術(shù)則加速了新思想和新文化的廣泛傳播,進(jìn)一步推動(dòng)了創(chuàng)新的步伐。

然而,人類的進(jìn)步并不僅僅源于新的物質(zhì)發(fā)現(xiàn),它還源于新的思想。所謂西方世界的歷史,是從羅馬帝國(guó)滅亡到中世紀(jì),在文藝復(fù)興和啟蒙運(yùn)動(dòng)期間經(jīng)歷了一次重生,它強(qiáng)調(diào)人類思想的中心地位,而不是所謂萬(wàn)能的神靈。然而,隨著人類知識(shí)的進(jìn)步,人類這開始認(rèn)識(shí)到自身的渺小。在蘇格拉底之后的兩千多年里,人類開始“知道自己一無(wú)所知”,我們的地球不再被視為宇宙的中心。宇宙本身在擴(kuò)張,而我們只是其中的一粒微塵。

改變對(duì)現(xiàn)實(shí)的看法

然而,就重塑我們對(duì)世界的認(rèn)識(shí)而言,20 世紀(jì)可能是爭(zhēng)論最多的一百年。1931 年,哥德爾(Kurt G?del)發(fā)表了不完備定理。

僅僅四年后,愛(ài)因斯坦、波多爾斯基(Boris Podolsky)和羅森(Nathan Rosen)以“完備性”為主題,在題為“Can Quantum-Mechanical Description of Physical Reality Be Considered Complete?”的論文中提出了“EPR吊詭”。隨后,波爾(Niels Bohr)對(duì)這篇論文進(jìn)行了反駁,他證明了量子物理學(xué)的實(shí)際有效性。

哥德爾不完備定理表明,即使是數(shù)學(xué)也無(wú)法最終證明一切,我們總會(huì)面臨一些無(wú)法證明的事實(shí)存在的情況。而量子理論則認(rèn)為,我們的世界缺乏確定性,我們無(wú)法預(yù)測(cè)某些事件,如電子的速度和位置,盡管愛(ài)因斯坦曾說(shuō)“上帝不會(huì)擲骰子”這一著名的立場(chǎng)。從根本上講,我們的局限性已經(jīng)超越了僅僅預(yù)測(cè)或理解物理領(lǐng)域內(nèi)事件的范圍。即使我們努力構(gòu)建一個(gè)完全由我們所設(shè)想的規(guī)則支配的數(shù)學(xué)宇宙,這個(gè)抽象的宇宙仍然會(huì)存在不可否認(rèn)的事實(shí)。

然而,除了數(shù)學(xué)陳述之外,我們的世界還充滿了描述現(xiàn)實(shí)的哲學(xué)陳述,我們發(fā)現(xiàn)自己無(wú)法描述、完全表達(dá)、理解甚至只是定義這些現(xiàn)實(shí)。

類似于20世紀(jì)初“真理”概念的不確定性,其他諸如“藝術(shù)”“美”和“生命”等概念的定義同樣缺乏根本性的共識(shí)。然而,這些并非孤立的案例,“智慧”和“意識(shí)”等其他概念同樣處于這一困境之中。

智力的定義

為了彌補(bǔ)這一差距,Legg 和 Hutter 于 2017 年在“Universal Intelligence: A Definition of Machine Intelligence”中提出了智能(intelligence)的定義:認(rèn)為“智能衡量的是一個(gè)代理在各種環(huán)境中實(shí)現(xiàn)目標(biāo)的能力”。同樣,在“Problem-Solving and Intelligence”中,Hambrick、Burgoyne 和 Altmann 認(rèn)為,解決問(wèn)題的能力不僅是智能的一個(gè)方面或特征,而且是智能的本質(zhì)。這兩種說(shuō)法在字面上有相似之處,因?yàn)閷?shí)現(xiàn)目標(biāo)可以與解決問(wèn)題聯(lián)系起來(lái)。

Gottfredson 在“An Editorial with 52 Signatories”中總結(jié)了幾位研究者的觀點(diǎn):智能是一種非常普遍的心理能力,包括推理能力、計(jì)劃能力、解決問(wèn)題的能力、抽象思維能力、理解復(fù)雜思想的能力、快速學(xué)習(xí)的能力以及從經(jīng)驗(yàn)中學(xué)習(xí)的能力。它不僅僅是書本知識(shí)、狹隘的學(xué)術(shù)技能或應(yīng)試技巧。相反,它反映了一種更廣泛、更深層次的理解周圍環(huán)境的能力。一種“抓住”“理解”事物,或者“構(gòu)思”應(yīng)對(duì)方法的能力。

這一定義引入了兩個(gè)關(guān)鍵維度,即從經(jīng)驗(yàn)中學(xué)習(xí)和理解周圍環(huán)境的能力,從而使智能的概念超越了單純的“解決問(wèn)題的技能”。換句話說(shuō),我們不應(yīng)將智能僅僅視為一種抽象的能力,即找到解決一般問(wèn)題的方法,而應(yīng)將其看作是一種具體的能力,即將從先前經(jīng)驗(yàn)中學(xué)習(xí)到的解決方案應(yīng)用于我們所處環(huán)境中可能出現(xiàn)的不同情況。

這突出了智能與學(xué)習(xí)之間的內(nèi)在聯(lián)系。在“How we learn”中,Stanislas Dehaene將學(xué)習(xí)定義為“學(xué)習(xí)就是形成一個(gè)世界模型”,這意味著智能也需要理解我們周圍環(huán)境并建立一個(gè)內(nèi)部模型來(lái)描述它們的能力。因此,智能同樣需要具備創(chuàng)建世界模型的能力,即便這種能力可能并不全面。

當(dāng)前的機(jī)器有多智能?

在討論通用 AGI 與狹義 AI 時(shí),我們經(jīng)常會(huì)強(qiáng)調(diào)它們之間的區(qū)別。狹義 AI(或稱弱 AI)非常普遍,也很成功,在特定任務(wù)上的表現(xiàn)往往能超越人類。一個(gè)很好的例子是,2016 年,AlphaGo 以 4 比 1 的比分擊敗了當(dāng)時(shí)的圍棋世界冠軍李世石。然而,即便如此,2023 年的一個(gè)事件也凸顯了狹義 AI 的某些局限性。在圍棋比賽中,業(yè)余棋手 Kellin Perline 利用 AI 沒(méi)有發(fā)現(xiàn)的戰(zhàn)術(shù)獲勝。可見,AI 缺乏人類識(shí)別不常見策略并做出相應(yīng)調(diào)整的能力。

實(shí)際上,在最基本的層面上,即使是缺乏經(jīng)驗(yàn)的數(shù)據(jù)科學(xué)家也能明白,AI 所依賴的每個(gè)機(jī)器學(xué)習(xí)模型,甚至包括最簡(jiǎn)單的模型,都需要在偏差和方差(bias and variance)之間取得平衡。這意味著 AI 需要從數(shù)據(jù)中學(xué)習(xí),以便理解和歸納解決方案,而不是死記硬背。狹義 AI 利用計(jì)算機(jī)的計(jì)算能力和內(nèi)存容量,可以相對(duì)輕松地根據(jù)大量觀察到的數(shù)據(jù)生成復(fù)雜的模型。然而,一旦條件稍有變化,這些模型往往就無(wú)法通用。

這就好比我們根據(jù)觀測(cè)結(jié)果提出了一個(gè)只在地球上有效的引力理論,然后卻發(fā)現(xiàn)物體在月球上要輕得多。如果我們?cè)谝碚撝R(shí)的基礎(chǔ)上使用變量而不是數(shù)字,我們就會(huì)明白如何使用正確的數(shù)值快速預(yù)測(cè)每個(gè)行星或衛(wèi)星上的引力強(qiáng)度。但是,如果我們只使用沒(méi)有符號(hào)的數(shù)字方程,那么在不重寫這些方程的情況下,我們將無(wú)法正確地將這些方程推廣到其他天體。

換句話說(shuō),AI 可能無(wú)法真正“學(xué)習(xí)”,而只能提煉信息或經(jīng)驗(yàn)。AI 不是形成一個(gè)全面的世界模型,而是創(chuàng)建了一個(gè)概要。

我們真的實(shí)現(xiàn)了AGI嗎?

人們普遍理解的 AGI 定義是,AI 系統(tǒng)能夠以人類水平或更高水平在多個(gè)認(rèn)知領(lǐng)域進(jìn)行理解和推理。這與目前專門從事特定任務(wù)的狹義 AI 系統(tǒng)(如 AlphaGo)形成了鮮明對(duì)比。AGI 指的是一種 AI 系統(tǒng),具備全面的、人類水平的智能,能夠跨越不同的抽象思維領(lǐng)域。

如前所述,這就要求我們有能力創(chuàng)建一個(gè)與經(jīng)驗(yàn)相一致的世界模型,并允許對(duì)預(yù)測(cè)進(jìn)行準(zhǔn)確的假設(shè)。

與大多數(shù) AI 研究人員和權(quán)威人士的觀點(diǎn)一致,要實(shí)現(xiàn)真正的 AGI 還需要幾年時(shí)間,盡管大家對(duì)它何時(shí)出現(xiàn)的預(yù)測(cè)各不相同。在“AGI Safety Literature Review”一文中,Everitt、Lea、Hutter 提到:“我們問(wèn)了很多研究人員,他們認(rèn)為 AGI 可能會(huì)在 2040-2061 年之間出現(xiàn),但大家的猜測(cè)差異很大,有人覺(jué)得可能永遠(yuǎn)不會(huì)出現(xiàn),也有人覺(jué)得未來(lái)幾年可能就會(huì)出現(xiàn)”??傊?,可以肯定的是,AGI 還沒(méi)有出現(xiàn)在我們身邊。

微軟在最近發(fā)表的“Sparks of Artificial General Intelligence: Early experiments with GPT-4”論文中指出:

“我們認(rèn)為 GPT-4 是新一批 LLMs的一部分,它們比以前的 AI 模型表現(xiàn)出更多的通用智能。我們討論了這些模型不斷提升的能力和影響。我們證明了,除了精通語(yǔ)言之外,GPT-4 還能解決新穎而困難的任務(wù),這些任務(wù)涉及數(shù)學(xué)、編碼、視覺(jué)、醫(yī)學(xué)、法律、心理學(xué)等,而且不需要任何特殊提示。此外,在所有這些任務(wù)中,GPT-4 的表現(xiàn)都非常接近人類水平,而且往往遠(yuǎn)遠(yuǎn)超過(guò) ChatGPT 等先前的模型。鑒于 GPT-4 的強(qiáng)大能力,我們認(rèn)為有理由將其視為一個(gè)接近(但仍不完整)的通用人工智能(AGI)系統(tǒng)的版本”。

問(wèn)題是什么?微軟是 OpenAI 的合作伙伴。

《紐約時(shí)報(bào)》的一篇文章援引卡內(nèi)基梅隆大學(xué)教授 Maarten Sap 的話說(shuō):“這是其中一些大公司將研究論文格式用于公關(guān)宣傳的一個(gè)例子”。研究人員兼機(jī)器人企業(yè)家 Rodney Brooks 在接受 IEEE Spectrum 采訪時(shí)強(qiáng)調(diào),在評(píng)估 ChatGPT 等系統(tǒng)的能力時(shí),我們經(jīng)?!罢`把性能當(dāng)能力”。

換個(gè)方式來(lái)解釋,將分?jǐn)?shù)當(dāng)作能力的標(biāo)志,AI 就好像只看到了世界的一個(gè)粗略概述,而沒(méi)有真正理解整個(gè)世界的本質(zhì)。

AI 面臨一個(gè)重要問(wèn)題,就是它們的訓(xùn)練數(shù)據(jù)。大多數(shù)模型僅在文本基礎(chǔ)上進(jìn)行訓(xùn)練,不具備在現(xiàn)實(shí)世界中說(shuō)話、聽覺(jué)、嗅覺(jué)或生活的能力。正如我之前提出的,這種情況有點(diǎn)像柏拉圖的洞穴寓言。在那個(gè)故事里,人們只能看到洞穴墻上的影子,無(wú)法直接體驗(yàn)真實(shí)的世界。即使能夠創(chuàng)建一個(gè)世界模型,他們的世界也只是一個(gè)純文字的世界,句法上正確,但語(yǔ)義上并不全面。這種環(huán)境缺乏直接感知所產(chǎn)生的“常識(shí)”,所以顯得乏善可陳。

大語(yǔ)言模型有哪些主要局限性?

ChatGPT 或 GPT-4 等大型語(yǔ)言模型(LLMs)面臨的另一個(gè)最有爭(zhēng)議的挑戰(zhàn)是,它們?nèi)菀桩a(chǎn)生幻覺(jué)。所謂幻覺(jué),就是這些模型會(huì)編造出一些假的引用和事實(shí),有時(shí)甚至是毫無(wú)意義的內(nèi)容。出現(xiàn)幻覺(jué)的原因在于,它們?nèi)狈?duì)事件之間原因和結(jié)果的理解。

在“Is ChatGPT a Good Causal Reasoner? A Comprehensive Evaluation”一文中,作者得出結(jié)論:“ChatGPT 存在嚴(yán)重的因果幻覺(jué)問(wèn)題,它傾向于假設(shè)事件之間的因果關(guān)系,而不管這些關(guān)系是否實(shí)際存在”。他們進(jìn)一步指出:“ChatGPT 不是一個(gè)好的因果推理者,而是一個(gè)好的因果解釋者”,再次強(qiáng)調(diào)了它在解釋時(shí)提煉聯(lián)系的能力,但卻無(wú)法通過(guò)構(gòu)建一個(gè)現(xiàn)有的世界模型來(lái)推斷這些聯(lián)系,而這些聯(lián)系就自然而然地存在于這個(gè)世界模型中。雖然這篇文章的重點(diǎn)是 ChatGPT,但可以擴(kuò)展到任何 LLMs。

從根本上說(shuō),我們可以發(fā)現(xiàn),LLMs 善于從數(shù)據(jù)中識(shí)別和提取因果關(guān)系,但缺乏自己主動(dòng)推理新的因果場(chǎng)景的能力。它們具備通過(guò)觀察進(jìn)行因果歸納的能力,但不具備因果演繹的能力。

這種區(qū)別凸顯了一個(gè)局限性,系統(tǒng)可以識(shí)別因果模式,但缺乏抽象的因果推理能力。它并不能產(chǎn)生新的因果見解,而只是從數(shù)據(jù)中解釋因果聯(lián)系。

然而,如果智能需要從經(jīng)驗(yàn)中學(xué)習(xí),而學(xué)習(xí)又轉(zhuǎn)化為創(chuàng)建一個(gè)我們可以用來(lái)理解周圍環(huán)境的世界模型,那么因果演繹就構(gòu)成了學(xué)習(xí)的一個(gè)基本要素,從而也構(gòu)成了智能的一個(gè)基本要素,而這正是現(xiàn)有模型所缺少的一個(gè)方面。這是我們朝著 AGI 前進(jìn)的關(guān)鍵步驟之一。

結(jié)論

正如在20世紀(jì)初所展示的那樣,實(shí)際情況常常與我們?nèi)粘S^察所形成的直覺(jué)不同。就像20世紀(jì)初的物理學(xué)家因?yàn)榱孔恿W(xué)與人類直覺(jué)相悖而難以理解它一樣,我們現(xiàn)在構(gòu)建的 AI 系統(tǒng)也受限于現(xiàn)實(shí)的一小部分,甚至比我們?nèi)祟愃荏w驗(yàn)到的范圍還要窄。

就像我們最終理解了一個(gè)與我們?nèi)粘=?jīng)驗(yàn)相矛盾的真實(shí)世界一樣,只有當(dāng)我們能夠創(chuàng)造出一個(gè)可以懷疑自身現(xiàn)實(shí)的系統(tǒng),進(jìn)行自我探索,至少能夠應(yīng)用因果演繹來(lái)建立一個(gè)合理的世界模型時(shí),我們才能真正實(shí)現(xiàn) AGI。

這一展望可能是人類歷史邁向新階段的一個(gè)標(biāo)志,我們開始逐漸承認(rèn),人類在整個(gè)宇宙中的重要性正在減少。

原文作者:Valentino Zocca

原文鏈接:https://aisupremacy.substack.com/p/how-far-are-we-from-agi

編譯:云婧

評(píng)論
尖刀情懷永遠(yuǎn)跟黨走
大學(xué)士級(jí)
要真正意義上實(shí)現(xiàn)人工智能,可能要幾年或幾十年,即使實(shí)現(xiàn)了,它也只能說(shuō)是智能的提高、學(xué)習(xí)理解能力的提高。而要像人類那樣決策判斷,可能還是有一定的差距。很多人認(rèn)為,今后的人工智能會(huì)超過(guò)人類,這個(gè)想法是好的,要真正實(shí)現(xiàn)卻還是有相當(dāng)大的難度!
2023-08-22
521209zh
學(xué)士級(jí)
這一展望可能是人類歷史邁向新階段的一個(gè)標(biāo)志,我們開始逐漸承認(rèn),人類在整個(gè)宇宙中的重要性正在減少。
2023-08-22
回憶人生路
庶吉士級(jí)
是一種人們追求最高級(jí) AI 的追求,而這一概念,被稱為通用人工智能(Artificial General Intelligence,AGI)
2023-08-22