版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

科技云報(bào)道:造完“大模型”,“具身智能”將引領(lǐng)AI下一個(gè)浪潮?

科技云報(bào)到
深度原創(chuàng)企業(yè)級(jí)IT內(nèi)容行家
收藏

科技云報(bào)道原創(chuàng)。

資深機(jī)器人專家Eric Jang不久前曾預(yù)言:“ChatGPT 曾在一夜之間出現(xiàn)。我認(rèn)為,有智慧的機(jī)器人技術(shù)也將如此?!?/p>

3月13日深夜,一段人形機(jī)器人的視頻開始熱傳。

在視頻中,F(xiàn)igure的人形機(jī)器人,可以完全與人類流暢對(duì)話,理解人類的意圖,同時(shí)還能理解人的自然語言指令進(jìn)行抓取和放置,并解釋自己為什么這么做。

而其背后,就是OpenAI為其配置的大型語言模型。由于OpenAI模型還支持多模態(tài)輸入,因此可為Figure提供高級(jí)視覺和語言智能。

而Figure本身,成立于2022年。從OpenAI 宣布介入與之合作,到今天它們共同推出一個(gè)能夠自主對(duì)話和決策的機(jī)器人,只有13天。

具身智能的發(fā)展,顯然正在加速。

具身智能進(jìn)化速度超越想象

在去年的ITF World 2023半導(dǎo)體大會(huì)上,英偉達(dá)創(chuàng)始人兼CEO黃仁勛表示,人工智能下一個(gè)浪潮將是“具身智能”(Embodied Intelligence),是能理解、推理、并與物理世界互動(dòng)的智能系統(tǒng),AI與機(jī)器人的融合,具有很好的想象空間。

他還介紹了英偉達(dá)的多模態(tài)具身智能系統(tǒng)Nvidia-VIMA,能在視覺文本提示的指導(dǎo)下,執(zhí)行復(fù)雜任務(wù)、獲取概念、理解邊界、甚至模擬物理學(xué),標(biāo)志著AI能力的顯著進(jìn)步。

此外,在特斯拉召開2023年年度股東大會(huì)上,馬斯克展示了人形機(jī)器人Optimus的全新型號(hào),和具身智能機(jī)器人幾乎劃等。

馬斯克表示,人形機(jī)器人將是今后特斯拉主要的長期價(jià)值來源,他也認(rèn)為,以具身智能機(jī)器人為代表的產(chǎn)品有望成為AI的下一浪潮。

1950年,圖靈在他的論文——《Computing Machinery and Intelligence》中首次提出了具身智能的概念。

具身智能(Embodied AI)指的是,有身體并支持物理交互的智能體,如智能服務(wù)機(jī)器人、自動(dòng)駕駛汽車等,具身智能機(jī)器人指的是,像人一樣能夠與環(huán)境交互感知、自助規(guī)劃、決策、行動(dòng)、執(zhí)行任務(wù)的機(jī)器人。

它包含人工智能領(lǐng)域幾乎所有的技術(shù),包括機(jī)器視覺、自然語言理解、認(rèn)知和推理、機(jī)器人學(xué)、博弈倫理、機(jī)器學(xué)習(xí)等,橫跨多個(gè)學(xué)科方向,是AI的集大成者。

2023年是生成式AI的爆發(fā)之年,也被業(yè)內(nèi)人士稱為“機(jī)器人覺醒之年”。ChatGPT等生成式AI與人形機(jī)器人行業(yè)結(jié)合,開啟了具身智能的時(shí)代。

今天,在大語言模型的普及和GPT-4等前沿模型的推動(dòng)下,我們似乎見證了人工智能領(lǐng)域的一個(gè)新時(shí)代,人機(jī)交流也變得前所未有的流暢和無縫。

據(jù)2023年5月GGII發(fā)布的報(bào)告預(yù)測,預(yù)計(jì)到2026年,人形機(jī)器人在全球服務(wù)機(jī)器人市場中的滲透率預(yù)計(jì)將達(dá)到3.5%,市場規(guī)模超過20億美元。

各大科技公司和學(xué)術(shù)界的頂尖學(xué)者也不斷涌入這一領(lǐng)域的研究與產(chǎn)品開發(fā)當(dāng)中。

然而,在繁榮熱潮的背后,潛在的困境卻也如影隨形。盡管ChatGPT等模式革命性地變革了AI領(lǐng)域,但它們?cè)诶斫饬?、?lián)想力和交互能力等方面,仍然未能完全滿足公眾的期望。

這促使我們對(duì)看似毫無阻礙的進(jìn)步進(jìn)行重新評(píng)估,同時(shí)希望經(jīng)過不懈努力,人們能攻克實(shí)現(xiàn)真正的具身智能所面臨的復(fù)雜挑戰(zhàn)。

當(dāng)機(jī)器人遇上大模型

近年來,國內(nèi)多家企業(yè)發(fā)布了自主研發(fā)的人形機(jī)器人。人形機(jī)器人是所有機(jī)器人里最復(fù)雜的一類,“具身智能”對(duì)機(jī)器人來說意味著什么?當(dāng)大模型和機(jī)器人相結(jié)合,會(huì)發(fā)生哪些變化?

在“具身智能”的狀態(tài)下,機(jī)器人具備自主學(xué)習(xí)和計(jì)劃能力,遇到障礙和困難可以自主反應(yīng)、快速解決。

目前國內(nèi)已有200多個(gè)大模型,實(shí)際上人形機(jī)器人是一個(gè)載體,當(dāng)大模型和人形機(jī)器人相結(jié)合時(shí),機(jī)器人可以幫助AI大模型感知物理世界,操作環(huán)境上下文;機(jī)器人利用多模態(tài)感知控制自己的身體,完成復(fù)雜的任務(wù)。

2023年上半年,以ChatGPT為代表的大語言模型爆炸式“出圈”,大語言模型以及結(jié)合視覺等多種傳感器的復(fù)雜多模態(tài)模型的成熟,是實(shí)現(xiàn)機(jī)器人完成具身智能的關(guān)鍵先決條件。

最為關(guān)鍵的一點(diǎn)是,成熟的“AI大模型”使機(jī)器人可以從程序執(zhí)行導(dǎo)向轉(zhuǎn)向任務(wù)目標(biāo)導(dǎo)向,向通用機(jī)器人的發(fā)展邁出堅(jiān)實(shí)步伐。

通俗點(diǎn)來說,“大模型”與機(jī)器人的融合,讓發(fā)展已久的機(jī)器人能真正地長出“腦子”。

機(jī)器人的“云大腦”通過在云、邊、端分布式算法、算力和大數(shù)據(jù)形成機(jī)器人智能,通過 5G等無線安全高速網(wǎng)絡(luò)連接云端大腦和機(jī)器人本體:機(jī)器人本體在“端”側(cè)完成各種任務(wù)。

云端大腦通過人工增強(qiáng)、多模態(tài)融合AI和數(shù)字生成等先進(jìn)技術(shù),實(shí)現(xiàn)機(jī)器人智能地自我學(xué)習(xí)、不斷進(jìn)化與成長。

AI真正賦能到各行各業(yè)、智能機(jī)器人走進(jìn)千家萬戶的時(shí)代正在到來,伴隨著技術(shù)的突破帶來性價(jià)比提高,在未來,具身智能滲透率將有望加速提升。

根據(jù)高盛預(yù)測,在理想狀態(tài)下,若機(jī)器人軟硬件在短期內(nèi)產(chǎn)生重大技術(shù)突破,實(shí)現(xiàn)具身智能的同時(shí)年均降本達(dá)到20%,人形機(jī)器人全球市場空間 有望在2035年達(dá)到1540億美元,接近2021年智能汽車的市場空間,2025-2035年復(fù)合增長率達(dá)到94%。

若是在樂觀情況下,人形機(jī)器人的出貨量有望在2035年達(dá)到100萬臺(tái),市場空間2025-2035年復(fù)合增長率有望達(dá)到59%。

人形機(jī)器人的時(shí)代正在到來

2023年11月2日,工信部印發(fā)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》(以下簡稱《意見》)為人形機(jī)器人發(fā)展指明方向?!兑庖姟分兄赋?,到2025年,人形機(jī)器人創(chuàng)新體系初步建立,“大腦、小腦、肢體”等一批關(guān)鍵技術(shù)取得突破,確保核心部組件安全有效供給。整機(jī)產(chǎn)品達(dá)到國際先進(jìn)水平,并實(shí)現(xiàn)批量生產(chǎn)。

2024年1月17日,AI研究實(shí)驗(yàn)室Midjourney創(chuàng)始人大衛(wèi)·霍爾茨(David Holz)在社交媒體的一篇帖子寫道:“我們有理由期待,到2040年,地球上將有10億個(gè)人形機(jī)器人。到2060年,世界上將會(huì)有1000億人形機(jī)器人?!边@預(yù)示著人形機(jī)器人的新時(shí)代正在到來。

近年來,具身智能在學(xué)術(shù)界的關(guān)注度持續(xù)升溫,在CoRL(機(jī)器人學(xué)習(xí)大會(huì))上,具身智能領(lǐng)域的論文數(shù)量呈現(xiàn)出快速增長的趨勢。

而在2023年初舉行的 IROS(智能機(jī)器人及系統(tǒng)國際會(huì)議)上,具身智能也被作為一個(gè)極為重要的議題進(jìn)行了深入探討。

在2023年8月18日的世界機(jī)器人大會(huì)人形機(jī)器人技術(shù)與產(chǎn)業(yè)發(fā)展論壇上,2000年圖靈獎(jiǎng)獲得者、中國科學(xué)院院士、清華大學(xué)交叉信息研究院院長姚期智指出,通用人工智能(AGI)的未來發(fā)展需要具備具身實(shí)體,與真實(shí)物理世界交互以完成各種任務(wù)。

只有這樣,才能為產(chǎn)業(yè)帶來更大的價(jià)值。

隨著中國社會(huì)老齡化程度將逐漸加深,勞動(dòng)力短缺問題日益凸顯,同時(shí)中國制造業(yè)勞動(dòng)力總量下降,人工成本上升,因此“機(jī)器替代人”成為了重要趨勢。

目前,全球工業(yè)機(jī)器人部署量穩(wěn)定增長,中國已成為世界最大的機(jī)器人市場。人形機(jī)器人在結(jié)構(gòu)上與人類相似,未來有望覆蓋、替換所有原本需要人類勞動(dòng)力的作業(yè)場景。

根據(jù)賽迪顧問的報(bào)告,盡管目前各家人形機(jī)器人仍處于原型機(jī)研發(fā)的早期階段,但是其帶來的潛在技術(shù)變革以及對(duì)某些生產(chǎn)生活場景的改變值得高度關(guān)注。

人形機(jī)器人在制造業(yè)、航天探索、生活服務(wù)業(yè)、高??蒲械阮I(lǐng)域具有較大的發(fā)展?jié)摿?,預(yù)計(jì)到2025年,人形機(jī)器人將有望實(shí)現(xiàn)在制造業(yè)場景應(yīng)用的突破,小批量應(yīng)用于電子、汽車等生產(chǎn)制造環(huán)境。

在中國,智能制造領(lǐng)域?qū)⒊蔀槿诵螜C(jī)器人首個(gè)實(shí)現(xiàn)大規(guī)模應(yīng)用的領(lǐng)域。人形機(jī)器人將圍繞工業(yè)制造、商用服務(wù)和家庭陪伴三大場景,重新定義人工智能時(shí)代的工人,把人類從重復(fù)性勞動(dòng)中解放出來。

商用服務(wù)場景是人形機(jī)器人最快應(yīng)用的市場,而家庭落地場景則是人形機(jī)器人最具潛力的應(yīng)用市場。

近日,美國科技公司英偉達(dá)宣布成立通用具身智能體研究實(shí)驗(yàn)室GEAR。

去年以來,包括中國電科21所、智元機(jī)器人、科大訊飛、小鵬汽車、傅利葉智能在內(nèi)的多家國內(nèi)企業(yè)相繼發(fā)布了自主研發(fā)的具身智能機(jī)器人,并有多家企業(yè)擬在今年實(shí)現(xiàn)具身智能的商業(yè)化落地。

業(yè)界普遍認(rèn)為,2024年有望成為具身智能商業(yè)落地元年。

虛擬世界,與現(xiàn)實(shí)世界形成鮮明對(duì)比,提供了一個(gè)更為精密和可控的環(huán)境,使得智能體能夠進(jìn)行更加大膽和創(chuàng)新的行為。

這不僅是對(duì)人類智能的延伸,更是一個(gè)通用人工智能誕生和發(fā)展的舞臺(tái),為超越人類智能水平的AI提供了理想的試驗(yàn)場和成長空間。

或許,這也是各大科技公司對(duì)具身智能與虛擬世界寄予厚望的深層次原因。

這預(yù)示著,一個(gè)更加智能、更加互聯(lián)的未來正向我們走來。

【關(guān)于科技云報(bào)道】

專注于原創(chuàng)的企業(yè)級(jí)內(nèi)容行家——科技云報(bào)道。成立于2015年,是前沿企業(yè)級(jí)IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計(jì)算大會(huì)官方指定傳播媒體之一。深入原創(chuàng)報(bào)道云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

評(píng)論
飛馬騰空
太師級(jí)
閱讀理解
2024-04-17
科普~~平
少師級(jí)
2024-04-16