版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

演講實錄丨戴瓊海院士《人工智能:算法·算力·交互》

中國人工智能學會
我國智能科學技術(shù)領域唯一的國家級學會
收藏

8月29日至30日,由中國科學技術(shù)協(xié)會、中國科學院、南京市人民政府為指導單位,中國人工智能學會、南京市建鄴區(qū)人民政府、江蘇省科學技術(shù)協(xié)會主辦的主題為“智周萬物”的2020年中國人工智能大會(CCAI 2020)在江蘇南京新加坡·南京生態(tài)科技島舉辦。在大會上,國務院參事、CAAI理事長、中國工程院院士、清華大學信息學院院長、教授、CAAI Fellow戴瓊海做了主題為《人工智能:算法·算力·交互》的特邀報告,從算力、算法與人機交互三方面展開了分享。

戴瓊海

國務院參事、CAAI理事長、中國工程院院士

清華大學信息學院院長、教授、CAAI Fellow

以下是戴瓊海院士演講實錄:

人工智能是一個很交叉的學科,要關(guān)注的問題很多。大家看,圖靈獎獲得者有研究心理學的,有研究認知的,有研究人工智能的,還有做數(shù)學的。我聚焦算法、算力和交互這三個方面和大家討論。算力就需要有力量。說到力量,我們先回顧一下歷史。在人類歷史上中,從原始、農(nóng)耕到工業(yè)和電氣革命,最重要的是要把人的力量,人對資源環(huán)境的認識,用以改造自然,帶來更好的生活和工作;我們把我們的力量交給了機械、交給了電力,蒸汽機的發(fā)明,包括電力方面的工作,那是我們力量的發(fā)揮。直到信息時代,也是有一種載體,希望在這上面把力量給機器也好,電力、電氣也好。

到信息時代就發(fā)生一些變化,很多人很幸運,在信息時代享受到了計算機、芯片、互聯(lián)網(wǎng)的力量。在這個時代里,實際上人工智能也在不斷地發(fā)展。在這個發(fā)展中最大的特點是,我們把大腦一部分的力量也交給了計算機,比如一些解析和計算于是推動了更多的自然科學和工程科學的發(fā)展。比如大家看原子能技術(shù)、空間科技、生物工程和基因技術(shù)都在發(fā)展,使得我們?nèi)烁诱J識到自己。

現(xiàn)在往人工智能發(fā)展,這個時期正在這樣往前推進。到人工智能時代以后,大家發(fā)現(xiàn)學科的概念好像更加模糊了,更加是一種交叉的概念在這里面討論。這個里面也有力量,剛才楊強老師說的,機器學習模型,包括周志華老師也是在做機器學習,包括我們的算法,這個時候我們想解析的問題更多,想把更多大腦的思考和不可解析的問題交給機器來做。這個時候我們才發(fā)現(xiàn)我們的腦力和機器的腦力是不一樣的,機器的腦力不夠,我們的腦力是夠的。但是在那些固定的算法上面,我們的腦力是不夠的,這個時候怎么辦呢?包括量子計算、納米科技、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、無人系統(tǒng),發(fā)現(xiàn)我們要交給機器的時候,機器的力量還有點不夠。因為什么呢?我們很多的模型算法也沒有達到它所需要的特點,于是楊強老師發(fā)現(xiàn)用聯(lián)邦的學習方法、遷移學習的方法,把數(shù)據(jù)從大數(shù)據(jù)怎么摘一個小數(shù)據(jù)進行工作,這個時候人工智能發(fā)展更需要機器學習模型,我們大腦交給機器的算法是什么,怎么樣提高它的算力,這是人工智能時代要考慮的問題。

大家都知道,人工智能時代發(fā)展得非???,快在哪兒呢?大家可以看到現(xiàn)在是邏輯推理,推理的這個功能能不能交給機器來做?另外,視覺,包括自然語言處理,大家看周圍的應用非常多。比如說機器人,有了機器人就存在人和機器人怎么去交互?機器人和環(huán)境怎么交互?又出現(xiàn)了很多的新的問題需要我們?nèi)ヌ接憽?/p>

另外,比如自動駕駛,我們突然發(fā)現(xiàn)我們的學習算法模型在車路協(xié)同,在車全天候全天時駕駛的時候,你的機器學習模型應該是什么?如果強大的復雜模型出來以后,你的算力夠不夠?這都是我們需要探討的問題。

我今天給大家匯報一下在算力、算法和交互方面,這上面我們應該怎么去一些什么工作,我們也做了一些工作,在這上面發(fā)力發(fā)現(xiàn)。

算力和人工智能是相輔相成的,大家都知道,最早Rosenblatt發(fā)明了512個計算單元。但是如果做更復雜的數(shù)據(jù)算法和分類的話,做不到,算力不夠。于是人工智能第一步存在什么根本問題呢?一個是模型不夠,就是這個數(shù)學模型存在問題。第二個是算力不夠,實際上算力里面就體現(xiàn)在軟件和硬件的結(jié)合怎么發(fā)展。

第二個是摩爾定律出現(xiàn),每單位面積18個月晶體管的數(shù)量要翻一番,為的是提高算力,提高算法可實現(xiàn)性,變成一個芯片,這是信息時代最偉大的貢獻,計算機、芯片加上互聯(lián)網(wǎng)。

大家都知道,到了1999年,英偉達為了提升算力的能力,他提出了GPU,為我們的算力做貢獻,因此我們的力量從體力已經(jīng)到腦力這個方面移植了,這個算力體現(xiàn)在腦力上面。大家可以看到AlphaGo用176個GPU,1000多個CPU。包括AlexNet GPU加速開啟了深度學習的黃金時代。人工智能要繼續(xù)發(fā)展,一定要在算力上有所保障才行。

大家可以看到這個,我們要想把我們的算法和機器學習模型用上去,無人系統(tǒng)、無人駕駛、智能醫(yī)療和智能制造,算法是越來越復雜。我們知道,無人系統(tǒng)、自我感知的視覺系統(tǒng),4節(jié)電池支持不到25分鐘,怎么去工作?這是一個很大的問題。

視頻在全世界的播放量,大家可以看到58%是我們的下行流量,還有包括每月超過20億的注冊訪問量,因此人工智能的蓬勃發(fā)展帶來了算力需求的指數(shù)增長。

科學家在研究在硬件和軟件上如何提高算力,如果這個提不高,就限制了人工智能的發(fā)展和應用,所以它是一個非常大的問題。

最近MIT專家發(fā)了一篇文章,對1500篇文章關(guān)于算力方面的問題做了仔細的分析。這個算力的分析結(jié)果是什么呢?深度學習正在逼近現(xiàn)有芯片的算力極限,計算能力提高10倍相當于三年算法的改進。算力提高的硬件、環(huán)境和金錢成本接下來將無法承受。因為人們對于人工智能的期望越來越高,希望它能做更大舞臺上的事,在這上面承受的壓力很大。

最后是底層技術(shù)(半導體物理與硅制造),在人工智能已經(jīng)大規(guī)模應用和發(fā)展的時候,這個空間比較小了。這個方面我們專門和清華微電子系的吳華強老師也專門討論過,這個PPT是我們和吳華強老師一塊來討論的。大家知道,摩爾定律近五年已經(jīng)逐步放緩了,已經(jīng)達不到每18個月翻一番。

這個里面大家都提出不同的路徑來做:

第一個是量子計算,最近Google、IBM紛紛發(fā)起了量子計算的能力。這個量子計算未來給我們帶來到底是什么?要做一個特殊任務大規(guī)模的計算,用別的很難算,我們要搭一塊量子計算。而這個量子計算要搭起來,至少100平方米的大房子,為什么呢?因為要保證那個時間段所捕獲量子的相關(guān)性要強,而且在持續(xù)工作當中,穩(wěn)定性要高。所以這種是屬于特種計算應用的方面,因此對我們現(xiàn)在十年二十年人工智能算法算力的提升是有難度的,因為我們需要用到各個方面,而不光是特殊計算。

第二個就是存算一體的架構(gòu),這個是用一體機陣列來做這個東西,使得它的算力能夠大大提升。

第三個就是類腦計算,希望能夠逼近人腦的計算力,這樣以來也能夠提升一定的算力。

還有一種就是光電智能計算,用光來計算。這是不是一種很好的算力提升的方面呢?

接下來我們討論一下如果用光電智能計算和存算一體,包括再和類腦結(jié)合起來,這個算力的提升,這個做成了保證十年二十年的算力能夠滿足人工智能發(fā)展的需求,這個時候才能保證人工智能不像有些人說的人工智能到泡沫了,不是泡沫,是我們的技術(shù)、算力遇到了瓶頸。

光電智能計算,大家可以看到這是一個物理學家,他專門對光電智能計算基本理論做了一個推導,推導的結(jié)果是如果用這個光計算的話,算力能提升3個數(shù)量級,功耗下降6個數(shù)量級。有了這個理論的保障,大家才說再去做光電計算,用光和電,就是有硅基和光基,這樣做的話是不是能更好地解決問題。

于是我們就討論光計算,這個是我們所說的光計算的發(fā)展路徑,這是1956年提出光計算,大家都在做。1964年光計算出現(xiàn)下坡,因為那個時候根本不需要那么高的算力,于是光計算就跌下來。到1990年,貝爾實驗室采用了砷化鎵,到1990年英偉達發(fā)展非常快,受到市場的沖擊,又沒有完成,直到2017年、2018年突飛猛進,這個和人工智能2010年開始起來,剛好滯后近10年。為什么滯后近10年?因為人工智能發(fā)展起來當時還不需要那么大的算力,但是2015年以后對算力需求很強,于是光計算馬上在這個時候發(fā)展,所以我說光計算比人工智能發(fā)展慢半拍,就是接近5年的樣子。

大家可以看,這個是三維可控的光傳輸實現(xiàn)并行光速計算,大家知道光里面的維度很高,有光射、折射、反射,還有其他方面,維度高帶來大量的并行計算。而我們的硅計算是電,一維計算、二維計算,大規(guī)模計算比較難,因此可以提供很強的計算能力。

第二,如果做全相位調(diào)制通光率帶來損耗,大家知道用電耗電能量很強。

第三,高維光場信號帶來通量帶寬很大。

第四,感存算一體是光的特點。大家知道拿一個手機照個相光進來了,轉(zhuǎn)成電才能計算,如果是光計算的話,直接計算了。存算一體是大家都在做的,能不能實現(xiàn)感存算一體,要找到好的材料,以可控高維光場傳播實現(xiàn)高速高效并行計算。

這里面最重要的特點是什么?

第一、范式顛覆了傳統(tǒng),采集與計算無縫銜接,突破存算分離、感存算機制。

第二、速度提升了3個數(shù)量級,功耗能下降6個數(shù)量級。

對比一下國際上三個重要的機構(gòu)做的,第一個是MIT,麻省理工2017年發(fā)到《Nature》上的,是計算能效顯著提升,最重要的是做光學矩陣的乘法,算力非??臁?/p>

第二個是牛津大學和劍橋大學,用相陣材料做脈沖網(wǎng)絡,這里面光學相陣材料能夠起到很大的作用。

清華大學是2019年做衍射的神經(jīng)網(wǎng)絡,在這里面可以做到大規(guī)模光學、神經(jīng)元的光學并行計算,現(xiàn)在清華大學在國家研究中心組織一個團隊,包括材料、芯片、架構(gòu)和范式、機器學習與算法,有一個大的團隊,也開展了這個方面的研究。

如果說把光計算這個做好了以后,大家看智能仿真機器人、微型修理機器人都能做,如果功能做好了,云計算的服務器功耗會大大下降。光電計算機在自動駕駛上面速度可以不斷提升。

如果說3個數(shù)量級達不到,1個數(shù)量級、2個數(shù)量級至少能夠支持現(xiàn)在人工智能的大規(guī)模應用。

光電智能芯片,使龐大的計算中心小型化,而且可以做到納秒級目標感知與識別,這種無人系統(tǒng)都能夠用得上。再一個是工業(yè)互聯(lián)網(wǎng)、計算機視覺、大數(shù)據(jù)分析、光通信能夠帶來大規(guī)模提升。

第二部分要講到算法,大家一說算法都很敏感,應該是怎么去討論,怎么去做?這張圖大家都知道,從達特茅斯會議走出來,一直走到這兒,2012年、2013年深度學習掀起了人工智能熱潮,實際上就是我們做的算法。

但是這些算法,我們現(xiàn)在去分析分析,存在幾個方面的問題。

第一個問題是魯棒性的問題,大家用機器學習的算法,在汽車的后世,大家可以看到尾燈,我們通過提升亮度來檢測,我們的檢測就失敗。輸入這種小的變化,引起輸出大的變化,魯棒性差,怎么改進這個算法?

我們先分析問題,不是說做得不好,在應用當中存在這個問題。

第二個,就是剛才楊強老師講的遷移性。大家可以看到在這個場景里面,特殊場景效果欠佳,沒有遷移性。

這里面就存在一個問題,無人駕駛要全天時全天候開這個車,可是這個數(shù)據(jù)不夠,難學到這些東西,因此這種遷移性就比較差。

能效比,大家都知道我們的大腦所能理解的場景,所能分析的場景,所能解決的場景,都是功耗在20W左右,而我們現(xiàn)在要用GPU的話,這是英偉達GPU250—300W,這個功耗還是比較大的。相對生物神經(jīng)網(wǎng)絡,能效比較低。

自適應性,我們有6萬條腦的數(shù)據(jù),在做的過程當中,就發(fā)現(xiàn)不同類型不同癥狀,最后要做成自適應性是非常難的一件事情,因此在這里面也存在它的問題。

最后一個問題,大家都非常清楚,不可解釋性,通過這個場景,通過計算、深度學習以后,到輸出,怎么解釋是一個問題。

這三個圖靈獎都表達了深度學習有嚴重的缺陷,欠魯棒性、難解釋,人腦在無監(jiān)督學習方面遠遠優(yōu)于深度學習,因此怎么做算法上的創(chuàng)新,我們要思考這樣的問題。

實際上大家可以看看非常簡單的一個問題,就是機器把東西放到桌子上的問題都做不好。在初級感知、信息處理與高級認知過程當中遠不如人腦。借鑒神經(jīng)系統(tǒng)的多模數(shù)據(jù)表示、變換和學習規(guī)律及反饋方式,能不能通過魯棒性進行改進?

深度學習路在哪里?這是人工智能誕生、人工智能初步產(chǎn)業(yè)化、人工智能變革迎來了爆發(fā),各個地方都在用,但是大家想到不可解釋性就限制使用,魯棒性差、自適應性差限制了自動駕駛的應用,所以很多方面沒有辦法做。

深度學習的來源,是優(yōu)化控制論在這里面。大家可以看到這個公式是深度學習使用最廣泛的一個東西,也是卷積神經(jīng)網(wǎng)絡、語言和注意力模型、生成對抗網(wǎng)絡,包括深度強化學習,能不能從根本上解決深度學習里的問題,我們要討論能不能構(gòu)成一個認知計算模型。

在這里面大家會看到,我們以前的做法也是從這里面做的,也是從神經(jīng)科學家里面來的。第一個是什么呢?發(fā)現(xiàn)簡單和復雜細胞,發(fā)現(xiàn)視覺系統(tǒng)的卷積特性這里面來的。包括日本的科學家借鑒簡單復雜細胞概念提出新認知機,在這里面一系列的工作,包括提出卷積神經(jīng)網(wǎng)絡、認知計算模型,2015年開始做這個方面的工作。

所以能不能再反過頭來重新認識腦科學,再到我們的深度學習算法,來討論這個問題。

當然還有一個類腦的方向,大家可以看,從1907年開始做,到1989、2013、2018、2019年,中國的兩位科學家,這是從類腦角度去做。

還有腦觀測到啟發(fā),我們以前觀察腦觀測通過什么呢?通過核磁共振,通過CT。但是大家都知道,我們那時候探討的腦,包括現(xiàn)在看不到神經(jīng)元細胞,只能看腦功能區(qū),因此我們說這些模型來的特點是從腦功能到深度算法,到卷積算法,這么一個算法層面的工作。能不能到神經(jīng)元角度來?這是一個非常重要的特點。神經(jīng)元是通過軸突與樹突建立關(guān)系,人腦有860億個神經(jīng)元,這些神經(jīng)元要通過構(gòu)建環(huán)路,不同的環(huán)路解決不同的問題。還包括我們的記憶。大家看突觸尺寸有26類,我們神經(jīng)元的細胞10個微米左右,我們的軸突和樹突500納米,現(xiàn)在用核磁共振都看不到,因此極其希望研究界觀尺度的腦科學成像,看神經(jīng)元的環(huán)路怎么樣,把軸突和樹突的尺寸看清楚,因此我們覺得應該是這么一個架構(gòu)。

這邊是腦科學,那邊是人工智能。我記得五年前聽李德毅老師的報告,說腦科學和人工智能是兩條平行線,不相交,我們就搞了兩個堡壘,它們都是平行的。

多模態(tài)回路觀測,就是包括宏觀、微觀、界觀,能不能做得到?那邊提出多層次認知模型,能不能構(gòu)建這樣一個橋梁,使得在認知計算情況下達到這么一個算法的特征。

這是兩條平行線,這都是腦科學的諾貝爾獎,從1906年以來,我們調(diào)研了一下,到現(xiàn)在獲得腦科學的諾貝爾獎有23項。到現(xiàn)在我們主要和神經(jīng)信息傳遞機制,和人工智能相關(guān)的,梳理出來,人類如何思考,那邊是機器如何思考,是圖靈獎提出和解決的一些問題。這兩條平行線建立起來了,如何從腦思考到機器思考,建立一個路徑。

2016年美國阿波羅項目1億美金獎勵給三位科學家,這三位科學家做什么呢?這三個是神經(jīng)元計算模型到下面機器學習算法模型,這兩個能不能打通,10萬個神經(jīng)元之間的連接關(guān)系要找到,就是研究這套機制。嚙齒動物就是神經(jīng)小鼠,能不能來做?第一位叫Tai Sing Lee,是腦神經(jīng)科的專家;第二位叫David Cox,是生物學家、計算科學家;第三位叫Andreas Tolias,是神經(jīng)科學家。

在這里面我們就探討從記憶角度看,能不能從記憶的角度研究算法,第一個記憶痕跡假設,包括海馬體與記憶、記憶多腦區(qū)的協(xié)同。這里面和它的算法有什么關(guān)系?我們要建立這種關(guān)聯(lián)關(guān)系,就比較容易打通這個通路。這就是尖波漣漪等記憶曲線,這是脈沖的。清華大學課題組通過三年的努力,已經(jīng)開始構(gòu)建這么一個模型架構(gòu),當然還正在研究,供大家一塊討論,共同研究。

這是生物機制,那邊希望做到物理原理的平衡,就是短期記憶和長期記憶。在研究這樣一套機制以后,我們能不能建立一套新型的網(wǎng)絡模型。這個模型正在架構(gòu)當中,也有一個組專門討論。給大家共享,也是看看各位老師各位同學們能不能在這個上面做出更新的一個算法模型的貢獻?

全腦觀測,大家可以看到上面是介觀,我們現(xiàn)在有這個儀器,小鼠全腦的連接,這個是宏觀觀測,我們能夠看到神經(jīng)元的結(jié)構(gòu)加這個功能,和機器學習深度學習算法的關(guān)聯(lián)關(guān)系是什么。大家都知道一個系統(tǒng)有什么樣的結(jié)構(gòu),就能表達什么樣的功能,所以結(jié)構(gòu)是主體。因此從微觀、宏觀到介觀,三個層面目前架構(gòu)都有了,怎么樣從結(jié)構(gòu)到功能,來研究機器學習的算法、人工智能算法的模型。在這里面主要打通這個。

大家可以看到,這是知識驅(qū)動模型和腦科學驅(qū)動,包括數(shù)據(jù)的驅(qū)動。最后能不能有一個認知的驅(qū)動?提出一個問題。這個問題也是可以在人工智能學界,大家可以關(guān)注和研究,能夠產(chǎn)生一些顛覆性的算法和應用,給我們的算力算法上都能夠往前走的這么一個架構(gòu),才能得到更好的東西。

第三個,有人工智能了,有機器人了,人類的發(fā)展就是不斷地和環(huán)境交互,不斷地把自己的能力提升。

AI賦能人類,而不是成為人類,更不是取代人類。

這里面講的問題,我們能不能開發(fā)用于模擬、延伸和擴展人類智慧能力的理論方法、技術(shù)及應用系統(tǒng),從而解決復雜問題的基礎科學并服務于人類。

通過這樣一來,我們就想到剛才楊老師專門講聯(lián)邦學習里面隱私的問題,這是非常重要的問題。

以人為本、服務于人,包括協(xié)同性、安全性、公平性和隱私,這里面怎么樣搭開一個架構(gòu),人工智能整個算法和算力應用的架構(gòu)。

因此這里面需要做到人工智能和AI怎么交互,AI和物理世界怎么交互?我們要教AI和物理世界交互。什么意思?我們?nèi)搜勰芸吹?,看不見的交給機器去看,看不清的聽不見的聽不清的都能交給AI,人和AI的交互。

這里面體現(xiàn)很多的東西,大家知道AI里面的交互,包括汽車,包括多足機器人、人形機器人、服務機器人,這是不同AI的實體有不同的接口,因此把它定為AI的專用接口。

還有一種,信息時代,十年前就在說AR/VR,一直起不來,到了人工智能時代,AI通用接口希望能成型、能起來、能應用,因為人工智能算法、算力足以支持它們的應用。包括眼鏡、虛擬主播、數(shù)字化AI的形象就可以建立起來。

目前AI通用接口驅(qū)動AI與AR的融合。北航趙老師一直在搞AR,都應用到數(shù)字虛擬手術(shù)上去。通用接口能做什么?

第一,拓展人類的能力。

第二,改變產(chǎn)品的形態(tài)和服務模式。

第三,推動認知、智能與文化藝術(shù)的變革。

第四,促進未來人-AI-物融合社會發(fā)展。

這是AI的通用交互接口能帶來非常大的變革。

以前要做AI對人體行為的理解,要理解人的行為,才能跟你交互。因此對人的行為怎么樣建設好,視覺三維重建是重中之重。對視覺怎么樣三維重建,包括人的屬性怎么樣去做,AI怎么樣去理解?這是大的方面。

其次,疫情時代,基本上是線上,線上上課,中小學,包括大學,上課質(zhì)量受到影響,據(jù)統(tǒng)計大一、大二的授課存在30%的知識獲取下降。因此能否做一個新的虛擬線下的工作?這個發(fā)展也有歷史,最早以前是寫郵件,第二是電報,第三個語音電話,然后是視頻電話,未來是全息投影,這些人都不在會場,戴上AR眼鏡就可以看到他們在線上開會,這個demo在清華已經(jīng)做成了,這個系統(tǒng)一旦做完,清華大學首先要試用。

從三維重建里來做,目前做到單相機的三維重建。三維重建是AI和人接口的一個重要關(guān)鍵,三維重建是核心關(guān)鍵技術(shù)。

影創(chuàng)、谷歌AR眼鏡只有50克,非常輕,使得我們教育、教學、醫(yī)療都可以引用。包括301提出虛擬手術(shù)問題怎么做?用這樣的東西,包括講課中的PPT,人書寫的demo,包括上面的東西,都可以放到虛擬線下環(huán)境當中,能夠提高各方面AI和人交互的能力。

混合現(xiàn)實虛擬手術(shù),包括中關(guān)村一條街上可以虛擬看到人在走過的場景,還有教學平臺等都可以用AI來做,人和AI的交互變得直接可以討論。

AI和物理世界的交互。把人和AI的交互傳遞給AI和物理世界的交互,這方面工作清華大學孫老師團隊做得很好,人類以前進化是不斷和自然環(huán)境打交道,三維重建是人和AI的交互,人和環(huán)境交互是AI認識環(huán)境。所以智能是在智能體與環(huán)境的相互作用中逐步產(chǎn)生和發(fā)展的。所以在這里我們要做包括觸覺、視覺、聽覺多模態(tài)的感知能力能否結(jié)合起來,AI才能對自然界能夠有認知能力。

要讓電腦如何像人一樣下棋是相對容易的,但要讓電腦有如一歲小孩般的感知和行動能力卻是相當困難的。它做復雜的行為、牽涉感情方面的東西還不如一歲小孩,我們要學習靈巧的手能抓取東西,抓取操作對機器來說是非常困難的事情。所以要一步一步去操作,讓AI去感知這種環(huán)境和理解這里面的東西。這是國際上非常大的研究熱點,操作的三大重要因素是感知、學習和多模態(tài),利用視覺和觸覺多模態(tài)融合,實現(xiàn)AI和環(huán)境的學習能力和復雜的交互能力的提升。

我們要想AI能夠感知到各方面。人手具有上百億個觸感神經(jīng)元,有哪一種材料做出來能放到AI上,使得人體動態(tài)觸覺可以區(qū)分出不超過十幾納米的凸凹的感覺,我們手能感覺到,機器能否感覺到?我們考察人的特征,把這些東西賦予AI,它對場景的獲取能力、感知能力就會變得非常強。

觸覺感知是非常難的問題,也是非常重要的問題,在國際上,歐盟、美國學術(shù)界都開展了這方面研究,包括歐盟的new touch,包括機器人領域著名的國際會議都在考慮觸覺的問題,機器人具身觸覺智能引起廣泛關(guān)注和高度重視,我們國家多個團隊都在研究這方面工作。

視覺與觸覺能夠結(jié)合,眼見為實,但是感覺為真,有時候看到和摸到的東西不一樣。所以觸覺先于視覺也先于語言,既是第一語言也是最后的語言,所以觸覺在AI感知自然場景當中起著非常重要的作用。視覺幫助我們了解全貌,觸覺使我們了解細節(jié)。

觸覺里面包括很多細節(jié),包括指尖、指掌、軀干等等,因此觸覺傳感器是機器人的核心部件?!犊萍既請蟆返橇?5項“卡脖子”技術(shù)問題之一,觸覺是很難的一個問題,大家也都在這方面開展應用。

包括空間視覺敏銳度和時間視覺敏銳度方面,孫老師團隊在國際智能機器人大會上抓取操作比賽獲得冠軍,說明我們在這上面也有向上走的趨勢,未來能夠做得更好。

清華做的一件事情,能飛的機器人,當感知到前面有障礙時,路被擋住時,能飛著跳躍過去,這也是視覺和觸覺整個感知功能在這里體現(xiàn)的一個特長。

人-AI-環(huán)境的協(xié)同交互能夠給我們帶來更多人工智能的應用,也給我們?nèi)藥砀喟l(fā)展,包括人工智能像人一樣思考以后,人工智能像人一樣能夠去做事,能達到多少量級,這是我們現(xiàn)在要分析和研究的問題。人工智能怎樣去發(fā)展、怎樣去應用?視覺、觸覺、聽覺都能體現(xiàn)非常重要的特征。

發(fā)揮多智能體的群體效應是未來重要了發(fā)展方向,包括群體協(xié)同交互問題,一群機器人怎么樣交互也是很重要的一個研究。群體協(xié)同交互是構(gòu)筑智能通天塔的必由之路,也是有望挑戰(zhàn)莫拉維克悖論的重要途徑。

我們希望能夠有更靈巧的手,有更明亮的眼睛,更靈敏的耳朵,把這些東西交給AI,交給機器人,它們能夠?qū)Νh(huán)境有更加深刻的認識。

智能光電芯片、知識驅(qū)動、數(shù)據(jù)驅(qū)動、認知驅(qū)動使得未來的AI能夠發(fā)展的更好,能夠更有效地發(fā)展。

算力有很多提升方法,大家在做光電計算架構(gòu),能不能先行把這個做出來,這也是國際上競爭的制高點。

在算法上能夠更加逼近本源的認知計算理論與方法,做的過程中需要做新的認知機理測試的范式出來。

更高的工作效率、生活質(zhì)量和安全保障。這是我們強調(diào)的交互問題,交互給我們帶來人工智能更加重要的特點。

信息時代,計算機強調(diào)人機交互,人和機器交互,那個交互完全是機器被動式,人主動式,未來人和AI的交互就是互相都有主動式,AI和環(huán)境交互,AI是主動式,和我們信息時代的人機交互有著不同的理解和相關(guān)方面的工作。