版權歸原作者所有,如有侵權,請聯(lián)系我們

李德毅院士:智能時代的農(nóng)機駕駛 ——人工智能一百年

中國人工智能學會
我國智能科學技術領域唯一的國家級學會
收藏

2020年12月20日,由中國人工智能學會主辦,CAAI智能駕駛專委會、上海交通大學、上海人工智能研究院有限公司、江蘇南京生態(tài)科技島經(jīng)濟開發(fā)區(qū)管理委員會、中新南京生態(tài)科技島開發(fā)有限公司承辦的“2020智能網(wǎng)聯(lián)汽車高峰論壇”在江蘇南京中新生態(tài)科技島舉辦。主旨報告環(huán)節(jié),CAAI名譽理事長李德毅院士帶來了題為《智能時代的農(nóng)機駕駛 ——人工智能一百年》的精彩演講。

以下是李德毅院士的演講實錄:今天的報告主要講三個再認識——對當前時代的再認識,對人工智能的再認識,對農(nóng)業(yè)革命的再認識。

一、對當前時代的再認識

人類從智人發(fā)展到當代文明,經(jīng)歷了石器時代、新石器時代、農(nóng)業(yè)革命時代,工業(yè)革命時代。如今到了人工智能時代,是否可以換一個視角,看看人類經(jīng)歷了幾次認知革命。

人類的第一次認知革命大約發(fā)生5000年前,發(fā)明了語言,更為重要的是發(fā)明了文字和符號,讓人類的歷史得以記錄,從而使得人類智能可以作為知識而獨立存在,誕生了文化和文明,形成了智能的生態(tài)。

第一次認知革命之后,大約到了500年前,科技開始大發(fā)展,人類對客觀世界的認知大大地向前走了一步,產(chǎn)生了科學技術是第一生產(chǎn)力的共同理念。人類通過對物質(zhì)和能量的認知,發(fā)明了各種各樣強大的機械、動力工具,解放人類的體力。這是第二次認知革命——認知客觀世界,發(fā)明動力工具。

今天,我們身處在第三次認知革命中。大約從100多年前,我們開始研究人腦是怎么工作的。其實所有的科學歸根到底就是研究三件事——地球是怎么產(chǎn)生的,生命是怎么產(chǎn)生的,人腦是怎么工作的。人工智能工作者更多地希望用人工智能來解放人的智力,所以把它稱之為第三次認知革命——認識人類智能,發(fā)明人工智能。

現(xiàn)在有人希望看到人工生命,我個人認為生命是人類存在的底線,對待底線要謹慎再謹慎,在生命和意識都還沒研究清楚時,還是要讓人工智能脫離我們的生命體而獨立存在。但將來也許會有第四次認知革命——認知精神和意識,創(chuàng)造人工生命,成就智慧人類。

二、對人工智能的再認識

為什么要對人工智能再認識?因為早在1956年的達特茅斯會議上,就已經(jīng)提出了關于人工智能的7個議題,現(xiàn)在看這7個議題也不落后。

人腦在進化過程中,其中一個突出的進化就是讓人腦后天有更大的可塑性。人腦組織結(jié)構(gòu)的進化和后天學習成就了人類智能。這里的組織結(jié)構(gòu)主要表現(xiàn)在遺傳基因和可塑性,而人類的智能——知識、文化和文明主要是后天形成的。人類最偉大的智能是發(fā)明了教育,人的一生中有四分之一的時間在接受科學技術、接受群體智能,把別人的群體智能變成個人的智能。這種群體智能、個體智能的正向迭代,大大超過了人類自然進化的速度,才使得人類站到了生物鏈的頂端。所以說智能植根于教育,文明是智能的生態(tài)。

關于人工智能有23個權威的定義,其中一個是強調(diào)要像人一樣的智能,但什么是人的智能需要再定義。我認為,智能是學習的能力,以及解釋、解決問題的能力。這里的學習包括傳承學習和自主學習;解釋、解決問題的能力,就是利用已有的知識,把實際問題置于高一個階次或者高一個維度的框架下,通過演繹推理,自動獲得其解,當然也就可解釋了。有了智能的定義,我對人工智能就有了一個新的定義:脫離生命體的智能,是人類智能的體外延伸。

目前,所有的人工智能都是基于圖靈機模型和馮?諾依曼架構(gòu)可存儲程序的計算機智能,我把它叫做傳統(tǒng)人工智能。那么什么是新一代人工智能?既然是新一代,應該有一個躍升,而不是一個小小的增量,我認為是類腦智能,顯然這可以是一個“新一代”。傳統(tǒng)的人工智能和新一代人工智能的分界點又在哪?我覺得是機器碾壓人類圍棋高手,尤其是2016年人類所有的圍棋高手都被阿爾法狗打敗。

一般認為類腦智能是受腦科學啟發(fā)的人工智能,但我認為這還不夠全面。腦科學主要是關于生命科學和神經(jīng)科學,我主張還要加入認知科學,包括社會科學和行為科學。這樣類腦智能就是受腦科學和認知科學啟發(fā)的人工智能。啟發(fā)中重要的一點就是要剝離意識,不要糾結(jié)細節(jié),要從介觀結(jié)構(gòu)上去類腦,不要從基因、分子、蛋白質(zhì)這個結(jié)構(gòu)去類腦,在智能行為上類人,在物理裝置上重現(xiàn)人類智能。

除此以外,腦科學和認知科學還可以給AI什么樣的啟發(fā)?我們常說,飛機是受鳥啟發(fā),潛艇受魚啟發(fā),人工智能受腦科學和認知科學的啟發(fā),我列了五條和大家一同體會。

第一,沒有感知就不會有認知?,F(xiàn)在計算機沒有感知,只有鍵盤、顯示屏,輸入的是符號,而人腦和外界環(huán)境要不停交互,和外部客體之間一直存在著認知對應關系。比如,孩子怎么知道媽媽這個概念的?首先他知道自己有個媽媽,然后知道玩具小熊也可以有個媽媽,再后來知道媽媽也有媽媽,最后告訴他祖國也是我的母親。四個媽媽都非常對應、十分清晰,最后會形成一個抽象的概念。

第二,腦的不同區(qū)域各有分工,實現(xiàn)腦認知的逐層抽象。小腦和大腦分工不一樣,即使在大腦里各區(qū)域也不同。而現(xiàn)在計算機都是在內(nèi)存里“折騰”,沒有逐層。

第三,腦區(qū)大規(guī)模神經(jīng)元組成記憶網(wǎng)絡,對認知起決定性作用。它是個網(wǎng)絡行為,不是計算機的存儲。

第四,記憶認知導致注意力選擇。人在看一幅圖也好,一個景致也好,都是有選擇的。

第五,人腦總是處在學習的狀態(tài)。

以上第一、二、三、四條是來自腦科學的啟發(fā),一、三、四、五條是來自認知科學的啟發(fā)。

人工智能已經(jīng)發(fā)展了五六十年,它的優(yōu)秀成果我們要繼承下來,大致上講有行為主義、符號主義、連接主義三個學派的成果。行為主義,希望機器人有像人一樣的行為,產(chǎn)生了機器人的行為智能。符號主義希望機器有像人一樣的思維,通過計算、預測和推理形成了可解釋的AI。連接主義希望機器腦像人腦一樣連接,所以有了20世紀70年代的機器學習,有了2 000年左右的深度學習。如今,我們發(fā)展新一代人工智能,計算主義學派的計算仍然要發(fā)揮下去,可以將連接主義拓展為記憶智能,實現(xiàn)記憶的快提取。人類智能的進化是先低階后高階,低階認知產(chǎn)生感知智能和行為智能,高階認知產(chǎn)生記憶智能和計算智能;而人工智能的發(fā)展恰恰相反,誕生于符號處理,低階認知一直很弱,必須大大加強。怎么沖出當前傳統(tǒng)人工智能的困境?能不能走多邊主義的道路?能不能走“智智與共”的道路?我主張發(fā)揚計算智能,拓展感知智能、行為智能和記憶智能,用當前記憶把住計算的邊界,讓記憶認知成為新一代人工智能的突破口。

十幾年前我就提出駕駛腦的概念。當時,全球無人駕駛都在講感知、決策、控制,但僅有感知就能決策了嗎?頭腦里沒有地圖敢開車?我們提出一定要有瞬時記憶、工作記憶和長期記憶。工作記憶是當前的駕駛態(tài)勢圖,形成路權。一輛車要往前開,前面的空間越小,速度就越低,怎么把這么多的瞬時數(shù)據(jù)快速加到你的態(tài)勢中,形成要解決問題——控制油門、剎車和方向盤的判斷點。駕駛地圖在人腦中不是一次形成的,這個地方是軟地基,那個地方有個足球場,開到那里要慢一點,這些記憶都是靠長期積累的??偡结槕撌恰案兄?、認知、行為,再感知、再認知,再行為”。

最近幾年我想把駕駛腦進一步推廣到新一代人工智能普遍的通用架構(gòu)。這個通用架構(gòu),要能夠表達時序特征和時間的尺度特征,反映行為智能、感知智能和認知智能之間的層次性。采用情景數(shù)據(jù)和知識模型雙驅(qū)動,不是簡單地講數(shù)據(jù)和知識雙驅(qū)動,情境代表語境,數(shù)據(jù)代表語言,知識代表語義,模型代表算法,要能就地計算免搬移,自定時、自定位,時時刻刻都知道自己在哪里,自學習,自成長,用進廢退,厚積薄發(fā),與時俱進。

于是我開始設計一個新一代人工智能時空架構(gòu),包括一個外循環(huán)和兩個內(nèi)協(xié)同。即通過跨模態(tài)感知,實現(xiàn)感知行為的外循環(huán),瞬時、短時和長期記憶的協(xié)同,以及計算和記憶間的協(xié)同。我個人認為,做數(shù)據(jù)處理應該以DPU為核心,讓CPU和GPU作配角;在態(tài)勢方面,以GPU為核心,讓CPU和DPU作配角;只有在計算方面依然是CPU為核心,GPU和DPU作配角,而不是永遠CPU作主角。CPU、DPU、GPU在不同的方面,擔任不同的主角是很正常的事情。還有一個難點,是需要有一個知識庫機器。目前是用搜索引擎,我希望能變成一個硬機器,變成一個知識庫機,實現(xiàn)快搜索,以及記憶的快速提取,而通過計算的提取要慢一點。

在這個架構(gòu)中,學習是對知識的鞏固或者修改,這個過程我們把它叫做厚積薄發(fā)。當你遇到特定問題時,通過短時記憶觸發(fā)記憶場景尋找解決方案。比如到一個路口,在場景記憶里路口要慢行,就不能再加速了,這叫做觸發(fā)激活,激活你的有關知識。此外,短時記憶通過注意力選擇,關注感興趣的瞬時記憶,對數(shù)據(jù)進行選擇壓縮。

第二個再認識可以簡單總結(jié)下。新一代人工智能包括記憶智能、計算智能、交互智能。從馮架構(gòu)和新一代人工智能架構(gòu)來看,新架構(gòu)里包含馮架構(gòu),有了時間和交互。交互是同時發(fā)生的相互關聯(lián),兩個人握手你知道我的溫度、我知道你的力量,這和以前的先輸入后輸出是不一樣的。高速緩存可以用來作瞬時記憶,外存是個中長期記憶,CPU和DPU、GPU在不同階段作不同主角。感知能夠?qū)崿F(xiàn)時時刻刻外部世界和人腦概念的對應關系。

三、對農(nóng)業(yè)革命的再認識

現(xiàn)在的農(nóng)田作業(yè),機械化很好,自動化不夠,數(shù)字化基本沒有。當前網(wǎng)絡化和智能化正在倒逼自動化和數(shù)字化。智能時代農(nóng)業(yè)革命的硬核,是把人工智能滲透到各式各樣農(nóng)田作業(yè)的動力工具中,成為農(nóng)田作業(yè)機器人,發(fā)展智慧農(nóng)業(yè)。我個人認為,拖拉機的無人駕駛是智能時代農(nóng)業(yè)革命的起跑線。

農(nóng)機的自動化即使做到極致,但如果自動駕駛不能像人一樣具備學習能力,不能應對各種邊緣工況,不能對各種作業(yè)機具實現(xiàn)精準操控,也很難完全代替人工勞動。把人類智能通過人工智能滲透、物化到動力工具里,成為會學習的農(nóng)田作業(yè)機器人,正是我們的追求。

會學習的農(nóng)機學習駕駛的過程是這樣的:首先是標桿農(nóng)機手作業(yè)時,駕駛腦在拖拉機里通過傳感器開始向人悄悄的學習;拖拉機開了一段時間后,駕駛腦覺得學得差不多了,就可以要求進行操作;但你可能覺得駕駛腦干的還不夠好,于是再通過訓練指導一段時間;又一段時間過去了,你覺得駕駛腦確實挺好了,就開始批量生產(chǎn)其他的農(nóng)機。這樣反復迭代的有指導學習、半指導學習、無指導學習,就是從簡單的動力工具變成智力工具,滲透到動力工具里的一個自成長、自學習的過程。

人類是比較著急的,一旦有智能了就想趕快做出來,我把這些叫做正學習。其實人類學習更多的是試錯學習。我們遇到一次事故就永遠會記得住,所以試錯也很重要。我們可以通過深度學習或者生成對抗樣本的強化學習,在拖拉機上裝一個事故記憶棒,如果遇到特定的事故時,讓事故棒對待它。因此,我們不但要有正學習,還要有試錯的負學習。

未來種地是一種享受,田里只有無人拖拉機,人在家里通過智能網(wǎng)聯(lián)控制它們?;诒倍返母呔鹊孛鍯ORS系統(tǒng)和5G超高帶寬、超低延時和超大連接的能力,可極大減少拖拉機載的傳感器。目前在拖拉機上使用不太貴的激光雷達就是這個道理,因為拖拉機操縱速度畢竟沒那么高。發(fā)揮機、路、網(wǎng)、管協(xié)同優(yōu)勢,改善智能網(wǎng)聯(lián)生態(tài),形成垂直系統(tǒng)的農(nóng)業(yè)物聯(lián)網(wǎng),實現(xiàn)精準遙控。

可交互、會學習、自成長的農(nóng)田作業(yè)機器人,不但能徹底改變面朝黃土背朝天的農(nóng)民形象,而且可模擬農(nóng)業(yè)各類能工巧匠的智能,一專多能或多專多能;還可協(xié)同農(nóng)民探索農(nóng)業(yè)性問題,以潤物細無聲的柔軟極大地解放人的體力和智力。新一代農(nóng)民必將更加智慧,更加優(yōu)雅的生活。

評論
秋天的果子陳
少師級
飛機是受鳥啟發(fā),潛艇受魚啟發(fā),人工智能受腦科學和認知科學的啟發(fā)。
2024-12-09
秋天的果子陳
少師級
人類最偉大的智能是發(fā)明了教育,人的一生中有四分之一的時間在接受科學技術、接受群體智能,把別人的群體智能變成個人的智能。
2024-12-09
秋天的果子陳
少師級
人腦的組織結(jié)構(gòu)主要表現(xiàn)在遺傳基因和可塑性,而人類的智能——知識、文化和文明主要是后天形成的
2024-12-09