版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

物理 + 人工智能 = 2024年諾貝爾物理學(xué)獎(jiǎng)

星空計(jì)劃
原創(chuàng)
星空計(jì)劃運(yùn)營(yíng)團(tuán)隊(duì)賬號(hào):活動(dòng)信息發(fā)布、創(chuàng)作者培育計(jì)劃作品發(fā)布等
收藏

圖蟲(chóng)創(chuàng)意

在我們今天的生活中,人工智能可以說(shuō)是無(wú)處不在,從聊天機(jī)器人到自動(dòng)駕駛,再到人臉識(shí)別,它推動(dòng)著許多科技的創(chuàng)新。而這場(chǎng)人工智能革命的核心,是一種叫做人工神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)的技術(shù)。10月8日,2024年諾貝爾物理學(xué)獎(jiǎng)授予了該領(lǐng)域的兩位先驅(qū):約翰·霍普菲爾(John J. Hopfield)德和杰弗里·辛頓(Geoffrey E.Hinton)。

接下來(lái)就讓我們來(lái)聊聊神經(jīng)網(wǎng)絡(luò),以及這次諾獎(jiǎng)背后的物理學(xué)原理。

人工智能的神經(jīng)網(wǎng)絡(luò)技術(shù)最初是受到人腦結(jié)構(gòu)的啟發(fā)。人腦由數(shù)十億個(gè)神經(jīng)元組成,這些神經(jīng)元通過(guò)突觸相互發(fā)送信號(hào)。每個(gè)神經(jīng)元都與成千上萬(wàn)的其他神經(jīng)元相連,形成一個(gè)復(fù)雜的網(wǎng)絡(luò),構(gòu)成我們的思想、記憶和行動(dòng)的基礎(chǔ)。

人工神經(jīng)網(wǎng)絡(luò)則是基于計(jì)算機(jī)的模擬,來(lái)模仿這種生物結(jié)構(gòu)。在人工神經(jīng)網(wǎng)絡(luò)中,神經(jīng)元被“節(jié)點(diǎn)”所替代。節(jié)點(diǎn)是處理信息的基本單位,可以有不同的值,比如1或0。而突觸則由節(jié)點(diǎn)之間的“連接”表示,這些連接可以增強(qiáng)或減弱。

在1982年的時(shí)候,霍普菲爾德開(kāi)發(fā)了一種人工神經(jīng)網(wǎng)絡(luò),可以用來(lái)儲(chǔ)存和重建模式或圖像?;羝辗茽柕碌撵`感來(lái)自于他對(duì)磁性材料和原子自旋的理解。自旋是粒子的一個(gè)基本量子屬性,它使每個(gè)原子的行為像一塊小磁鐵,可以指向不同的方向,比如向上或向下。相鄰原子的自旋可以對(duì)齊(指向相同方向)或不對(duì)齊(指向相反方向)。這些自旋間的相互作用影響了整個(gè)系統(tǒng)的能量。在磁性材料中,如果相鄰原子的自旋對(duì)齊,系統(tǒng)就會(huì)達(dá)到較低的能量狀態(tài),這樣就會(huì)更加穩(wěn)定。相反,如果自旋不對(duì)齊,系統(tǒng)的能量就會(huì)增加,這樣的狀態(tài)則不太穩(wěn)定。在磁性材料中,形成自旋方向一致的區(qū)域,被稱(chēng)為磁疇。磁疇代表了系統(tǒng)試圖讓能量最小化的嘗試。

而霍普菲爾德神經(jīng)網(wǎng)絡(luò)的保存和檢索圖像的能力就依賴(lài)于能量最小化原理。在霍普菲爾德神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)的結(jié)構(gòu)類(lèi)似于一個(gè)由自旋組成的物理系統(tǒng),每個(gè)節(jié)點(diǎn)的行為就像一個(gè)原子的自旋——它可以處于兩種狀態(tài)中的一種,比如+1或-1,類(lèi)似于自旋向上或向下。節(jié)點(diǎn)之間的連接表示材料中自旋如何相互影響。

在這個(gè)網(wǎng)絡(luò)中,節(jié)點(diǎn)狀態(tài)的每種可能配置——無(wú)論是代表部分圖像還是完整圖片——都有一個(gè)與之相關(guān)的特定能級(jí)。當(dāng)我們訓(xùn)練網(wǎng)絡(luò)記住某些模式(或圖像)時(shí),網(wǎng)絡(luò)會(huì)調(diào)整節(jié)點(diǎn)之間的連接強(qiáng)度來(lái)“學(xué)習(xí)”這些模式。每個(gè)儲(chǔ)存的模式或圖像對(duì)應(yīng)于網(wǎng)絡(luò)的一個(gè)特定配置,也就是一個(gè)穩(wěn)定的、低能量的狀態(tài)。

所以,當(dāng)你給網(wǎng)絡(luò)一個(gè)扭曲或不完整的圖像時(shí),它會(huì)從一個(gè)更高的能量狀態(tài)開(kāi)始。然后網(wǎng)絡(luò)有條不紊地遍歷節(jié)點(diǎn)并逐個(gè)更新它們的值,每次更新的目的都是減少網(wǎng)絡(luò)的總能量,直到它進(jìn)入一個(gè)穩(wěn)定的低能量狀態(tài)。通過(guò)這種方式,網(wǎng)絡(luò)會(huì)“識(shí)別”并重建原始圖像。

這就好比當(dāng)我們看到一個(gè)朋友的照片時(shí),盡管照片可能很模糊,但還是能認(rèn)出來(lái)。因?yàn)槲覀兊拇竽X會(huì)根據(jù)儲(chǔ)存的記憶來(lái)填補(bǔ)缺失的細(xì)節(jié)。類(lèi)似地,霍普菲爾德神經(jīng)網(wǎng)絡(luò)可以通過(guò)進(jìn)入代表記憶的最低能量狀態(tài),從部分信息中回憶起完整的記憶。

然而,霍普菲爾德神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)更復(fù)雜的模式方面存在局限性。到了1985年,辛頓擴(kuò)展了霍普菲爾德的想法,他基于統(tǒng)計(jì)物理學(xué)的思想開(kāi)發(fā)了玻爾茲曼機(jī)(Boltzmann Machine)。

統(tǒng)計(jì)物理學(xué)是物理學(xué)的一個(gè)分支,它研究的是由大量粒子(比如氣體中的原子)組成的系統(tǒng)。在這樣的系統(tǒng)中,由于粒子的數(shù)量龐大且不斷在運(yùn)動(dòng),跟蹤每個(gè)單獨(dú)的粒子是不切實(shí)際的。所以,物理學(xué)家研究的是它們的集體行為,來(lái)了解系統(tǒng)的總體特性。統(tǒng)計(jì)物理學(xué)使用概率來(lái)理解不同的狀態(tài)是如何分布的,以及如何將能量最小化以達(dá)到穩(wěn)定的狀態(tài)。

那么玻爾茲曼機(jī)是怎么運(yùn)作的呢?讓我來(lái)舉一個(gè)例子。

當(dāng)你在刷朋友圈時(shí),你恰好看到了你的朋友發(fā)了一張全家福。即使你從未見(jiàn)過(guò)你朋友的家人,你仍然可以根據(jù)他們的共同特征,比如面部特征,立即分辨出你們是一家人。類(lèi)似的,玻爾茲曼機(jī)就像我們的腦,經(jīng)過(guò)訓(xùn)練它就可以識(shí)別人臉的模式。

在玻爾茲曼機(jī)中,神經(jīng)網(wǎng)絡(luò)有兩層節(jié)點(diǎn)。一層是由可見(jiàn)節(jié)點(diǎn)組成的“可見(jiàn)”層,用于輸入數(shù)據(jù),比如眼睛、鼻子或微笑等特征。另一層是由隱藏節(jié)點(diǎn)組成的“隱藏”層,它會(huì)試圖理解輸入中的潛在模式。

當(dāng)玻爾茲曼機(jī)得到一個(gè)新的輸入,比如你朋友的家人出現(xiàn)時(shí),它可能會(huì)以一個(gè)與之前學(xué)習(xí)過(guò)的任何模式都不完全匹配的配置開(kāi)始。這類(lèi)似你最初對(duì)你朋友和你朋友的家人的相似度的不確定。當(dāng)玻爾茲曼機(jī)處理輸入時(shí),它會(huì)更新其節(jié)點(diǎn),類(lèi)似于大腦接收到你朋友的家人的更多細(xì)節(jié)。這個(gè)更新過(guò)程涉及概率計(jì)算,機(jī)器評(píng)估每個(gè)節(jié)點(diǎn)狀態(tài)的可能性,比如某個(gè)特征是否與你朋友相似。

每次機(jī)器更新一個(gè)節(jié)點(diǎn)的狀態(tài),它的目標(biāo)是降低系統(tǒng)的整體能量。較低的能量狀態(tài)對(duì)應(yīng)于更接近學(xué)習(xí)模式的配置。比如你的大腦在處理更多細(xì)節(jié)后,就會(huì)減少對(duì)你朋友家人身份的不確定性,逐漸對(duì)自己的評(píng)估更有信心。玻爾茲曼機(jī)會(huì)逐步更新,直到它進(jìn)入一個(gè)低能量狀態(tài),這代表了一個(gè)與儲(chǔ)存模式密切一致的配置。

簡(jiǎn)而言之,玻爾茲曼機(jī)利用了能量最小化原理,通過(guò)迭代更新從較高的能量狀態(tài)過(guò)渡到較低的能量狀態(tài),使其能夠以類(lèi)似于我們自己的認(rèn)知過(guò)程的方式有效地學(xué)習(xí)和識(shí)別復(fù)雜模式。這種從例子中學(xué)習(xí)并生成新的類(lèi)似數(shù)據(jù)的獨(dú)特能力使玻爾茲曼機(jī)成為人工智能和神經(jīng)網(wǎng)絡(luò)發(fā)展的一個(gè)重要里程碑。

霍普菲爾德和辛頓的研究為今天的深度神經(jīng)網(wǎng)絡(luò)奠定了基礎(chǔ)。后來(lái)的研究者在他們的模型上進(jìn)行了優(yōu)化,比如辛頓等人引入了反向傳播算法,大幅提升了訓(xùn)練速度和精度。此外,網(wǎng)絡(luò)結(jié)構(gòu)變得更深、更復(fù)雜,能夠處理海量數(shù)據(jù)和高級(jí)模式識(shí)別,進(jìn)化成了今天的深度學(xué)習(xí)系統(tǒng)。這一轉(zhuǎn)變推動(dòng)了人工智能在圖像識(shí)別、自然語(yǔ)言處理等領(lǐng)域的巨大突破。

今天,基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)已經(jīng)帶來(lái)了巨大的影響,它不僅讓我們的生活變得更加智能,還被應(yīng)用在了許多科學(xué)領(lǐng)域。例如,它可以幫助我們尋找系外行星,分析來(lái)自粒子加速器產(chǎn)生的海量數(shù)據(jù),以及計(jì)算蛋白質(zhì)分子的結(jié)構(gòu)等等。

我們完全有理由期待,未來(lái)人工智能或?qū)⒃诳茖W(xué)領(lǐng)域掀起更大的革命。

本文為科普中國(guó)·創(chuàng)作培育計(jì)劃扶持作品
作者:原理

審核:高源 國(guó)家自然博物館 副研究館員

出品:中國(guó)科協(xié)科普部

監(jiān)制:中國(guó)科學(xué)技術(shù)出版社有限公司、北京中科星河文化傳媒有限公司

內(nèi)容資源由項(xiàng)目單位提供