版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

未來新科技巨頭?AI智能體技術(shù)應(yīng)用及展望

中移科協(xié)
原創(chuàng)
有用的科技知識又增加了
收藏

智能體(AI Agent)是一種能夠自主行動、感知環(huán)境、做出決策并與環(huán)境交互的計算機系統(tǒng)或?qū)嶓w,通常依賴大型語言模型作為其核心決策和處理單元,具備獨立思考、調(diào)用工具去逐步完成給定目標的能力。作為未來大模型最主流的使用方式,智能體備受業(yè)界關(guān)注。2024年智能體技術(shù)被納入《國家人工智能產(chǎn)業(yè)綜合標準化體系建設(shè)指南(征求意見稿)》,在標準引領(lǐng)下未來智能體技術(shù)將高質(zhì)量發(fā)展并助推大模型加速賦能千行百業(yè)。本文通過闡述智能體技術(shù)、應(yīng)用現(xiàn)狀及產(chǎn)品演進,分析了智能體技術(shù)未來發(fā)展方向和面臨的挑戰(zhàn)。

1、智能體技術(shù)

1.1 智能體工作原理

大腦(Brain):大腦主要由一個大型語言模型LLM組成,不僅存儲知識和記憶,還承擔(dān)著信息處理和決策等功能,并可以呈現(xiàn)推理和規(guī)劃的過程,能很好地應(yīng)對未知任務(wù)。感知(Perception):感知模塊的核心目的是將智能體的感知空間從純文字領(lǐng)域擴展到包括文字、聽覺和視覺模式在內(nèi)的多模態(tài)領(lǐng)域。

行動(Action):在智能體的構(gòu)建過程中,行動模塊接收大腦模塊發(fā)送的行動序列,并執(zhí)行與環(huán)境互動的行動。

1.2 智能體技術(shù)特點

大模型通常通過Prompt(提示)與用戶進行交互,輸出效果受限于用戶提問的清晰度。信息處理方面,僅處理靜態(tài)或流式數(shù)據(jù)輸入,不涉及直接的環(huán)境交互,不能自主地采取行動。技術(shù)應(yīng)用方面,行業(yè)知識缺乏、易出現(xiàn)幻覺、提示詞工程學(xué)習(xí)門檻高成為大模型破圈的阻礙。而基于大模型的智能體,其設(shè)計目標是實現(xiàn)對環(huán)境的有效互動,通過感知模塊收集環(huán)境信息,并通過行動模塊來改變環(huán)境狀態(tài),整合了感知、決策、行動等多個環(huán)節(jié),因而智能體在自主能力、決策能力、協(xié)作交互等方面展現(xiàn)出優(yōu)勢,彌補了大模型的不足,成為人工智能界的“行動派”。

2、智能體技術(shù)應(yīng)用

根據(jù)面向的對象、流程不同,智能體主要應(yīng)用在三種場景:

2.1 單智能體應(yīng)用

一個特定的環(huán)境中,僅有一個智能體進行感知、學(xué)習(xí)和行動,需要獨立地與環(huán)境進行交互,并根據(jù)環(huán)境的反饋來優(yōu)化其行為策略,以實現(xiàn)預(yù)設(shè)的目標。可應(yīng)用在交互性質(zhì)場景,如游戲AI(如圍棋、電子游戲等)、自動駕駛汽車、機器人控制等。單智能體系統(tǒng)的復(fù)雜性相對較低,某些任務(wù)中更容易實現(xiàn)和部署。

2.2 多智能體系統(tǒng)

由多個智能體(軟件程序、機器人或其他具有自治性的實體)組成的復(fù)雜的分布式系統(tǒng),每個智能體都具有自己的感知、決策和行動能力,并且可以與其他智能體進行通信、信息共享、交互和協(xié)作,以實現(xiàn)共同的目標或任務(wù)。通常后端設(shè)定不同角色的智能體,前端通過對話鏈協(xié)同工作,能夠完成單個智能體難以完成或無法完成的任務(wù),具有更高的靈活性、可擴展性和魯棒性??蓱?yīng)用在分布式控制、智能交通、智能制造、自然語言處理等領(lǐng)域。

2.3 智能體平臺

構(gòu)建智能體系統(tǒng)的集成化平臺,用戶在平臺上定義并部署各類智能體,平臺通過策略性流程,優(yōu)化智能體組合以適應(yīng)特定任務(wù)需求,各智能體可扮演不同專業(yè)角色,在任務(wù)協(xié)商和角色分配后,協(xié)同執(zhí)行任務(wù)并完成結(jié)果整合。適用于智能體開發(fā)、企業(yè)定制化解決方案場景。

3、智能體產(chǎn)品演進從時間維度智能體主流產(chǎn)品的演進大致可劃分為三個階段:

3.1 構(gòu)建智能體框架階段

內(nèi)2023年3月AutoGPT框架項目發(fā)布,包括需求下發(fā)、自主運行、結(jié)果輸出三個核心模塊。功能上主要是通過Prompt向ChatGPT下發(fā)任務(wù),ChatGPT通過大模型對語義內(nèi)容理解,輸出詳細的解決方案,經(jīng)過邏輯判斷選擇優(yōu)先執(zhí)行的步驟,生成可執(zhí)行的操作或指令,并調(diào)用外部資源或工具完成指令操作。AutoGPT框架把大模型的自然語言理解、內(nèi)容生成、邏輯推理等核心能力外推到具體場景,輔以感知與行動技術(shù),有端到端解決問題的潛力,被認為是大模型落地的重要模式。

3.2 GPTs智能體雛形階段

2023年11月OpenAI推出Assistant API,后續(xù)發(fā)布GPTs服務(wù),允許用戶構(gòu)建個人自定義GPT助手,無需編碼,用戶通過上傳個人數(shù)據(jù)以及自定義訓(xùn)練,能實現(xiàn)垂類模型的快速搭建,大幅度降低AI應(yīng)用的創(chuàng)作門檻,進一步推高智能體的熱潮。

3.3 個人智能體孵化階段

2023年12月聯(lián)想公布了個人智能體“小樂同學(xué)”的進展。個人智能體,基于內(nèi)嵌于終端的本地大模型打造,精準理解用戶意圖,并將意圖轉(zhuǎn)換為相應(yīng)的任務(wù)組合,分解任務(wù)并識別任務(wù)完成的路徑,通過查詢本地知識庫、調(diào)用設(shè)備API以及合適的模型或應(yīng)用來執(zhí)行相應(yīng)的任務(wù),并將相應(yīng)的結(jié)果返回給智能體,智能體完成整合后反饋給用戶。與云端模型能力相比,整個過程完全不用上云,不侵犯用戶個人隱私,并對硬件有很強的控制能力。

4、發(fā)展方向和面臨的挑戰(zhàn)

在不久的將來,智能體將成為AI OS系統(tǒng)的最小工作單元,嵌入自主智能體的軟件極有可能改變現(xiàn)有的使用方式,從用戶適應(yīng)軟件變成軟件適應(yīng)用戶習(xí)慣,真正成為個人助理。進而系統(tǒng)級別的智能體有望直接操作App或者子智能體,在PC、手機、自動駕駛領(lǐng)域預(yù)計有廣泛的應(yīng)用場景。盡管大語言模型智能體已經(jīng)取得了重要的進展,但是在實際應(yīng)用中仍然面臨安全、倫理、計算資源消耗、復(fù)雜工具使用、多智能體交互機制、模型適配方法、面向真實世界的智能體模擬等一系列技術(shù)挑戰(zhàn)。

【參考文獻】

[1] 《國家人工智能產(chǎn)業(yè)綜合標準化體系建設(shè)指南(征求意見稿)》, 工信部,2024

[2] 《2023年人工智能體(AI Agent)開發(fā)與應(yīng)用全面調(diào)研:概念、原理、開發(fā)、應(yīng)用、挑戰(zhàn)、展望》,AI前沿,2023

[3] 《什么是Agent智能體?Agent智能體和大模型有什么區(qū)別?|商派》,商派,2024,https://www.shopex.cn/news/archives/17685.html

[4] 《成果|大模型驅(qū)動的自主智能體與群體智能》,AIGC最前線,2024

[5] 《單智能體(Single Agent)是指什么》,行業(yè)百科,2024

[6] 《多智能體系統(tǒng)是指什么》,行業(yè)百科,2024

[7] 《AI Agent發(fā)展現(xiàn)狀、行業(yè)結(jié)構(gòu)與趨勢分析》,天翼智庫,2024

[8] 《AutoGPT:自動化GPT原理及應(yīng)用實踐》,學(xué)習(xí)猿地,2023

[9] 《AI 時代,為什么「智能體」將成為第一入口》,極客公園,2024

[10] 《2023年度十大前沿科技趨勢報告》,量子位智庫,2023

[11] 《大語言模型》,AIBOX,2024

作者:高靜

單位:中國移動研究院業(yè)務(wù)研究所

評論
科普lyjzgf
庶吉士級
AI智能體技術(shù)的應(yīng)用前景廣闊,未來新科技巨頭的崛起將依賴于對這些前沿技術(shù)的深度整合與創(chuàng)新應(yīng)用,以及對社會需求的敏銳洞察。在這個過程中,技術(shù)、倫理、法律和社會責(zé)任將是共同成長的重要維度。
2024-05-06
科普中國●yling
進士級
AI智能體作為AI技術(shù)的一種重要應(yīng)用形式,雖然目前仍處于快速發(fā)展階段,存在一些不成熟之處,但其未來的發(fā)展前景無疑是非常廣闊的。隨著技術(shù)的不斷進步和市場的不斷擴大,AI智能體將在未來的生活和工作中扮演越來越重要的角色。
2024-05-06
臭皮匠心
學(xué)士級
智能體在自主能力、決策能力、協(xié)作交互等方面展現(xiàn)出優(yōu)勢,彌補了大模型的不足,成為人工智能界的“行動派”。應(yīng)該加大智能體的研究,發(fā)揮它更大作用。
2024-05-06