亚洲乱亚洲乱无码,中文字幕一区二区5566

智能體（AI Agent）是一種能夠自主行動、感知環(huán)境、做出決策并與環(huán)境交互的計算機系統(tǒng)或?qū)嶓w，通常依賴大型語言模型作為其核心決策和處理單元，具備獨立思考、調(diào)用工具去逐步完成給定目標的能力。作為未來大模型最主流的使用方式，智能體備受業(yè)界關(guān)注。2024年智能體技術(shù)被納入《國家人工智能產(chǎn)業(yè)綜合標準化體系建設(shè)指南（征求意見稿）》，在標準引領(lǐng)下未來智能體技術(shù)將高質(zhì)量發(fā)展并助推大模型加速賦能千行百業(yè)。本文通過闡述智能體技術(shù)、應(yīng)用現(xiàn)狀及產(chǎn)品演進，分析了智能體技術(shù)未來發(fā)展方向和面臨的挑戰(zhàn)。

1、智能體技術(shù)

1.1 智能體工作原理

大腦(Brain)：大腦主要由一個大型語言模型LLM組成，不僅存儲知識和記憶，還承擔(dān)著信息處理和決策等功能，并可以呈現(xiàn)推理和規(guī)劃的過程，能很好地應(yīng)對未知任務(wù)。感知(Perception)：感知模塊的核心目的是將智能體的感知空間從純文字領(lǐng)域擴展到包括文字、聽覺和視覺模式在內(nèi)的多模態(tài)領(lǐng)域。

行動(Action)：在智能體的構(gòu)建過程中，行動模塊接收大腦模塊發(fā)送的行動序列，并執(zhí)行與環(huán)境互動的行動。

1.2 智能體技術(shù)特點

大模型通常通過Prompt（提示）與用戶進行交互，輸出效果受限于用戶提問的清晰度。信息處理方面，僅處理靜態(tài)或流式數(shù)據(jù)輸入，不涉及直接的環(huán)境交互，不能自主地采取行動。技術(shù)應(yīng)用方面，行業(yè)知識缺乏、易出現(xiàn)幻覺、提示詞工程學(xué)習(xí)門檻高成為大模型破圈的阻礙。而基于大模型的智能體，其設(shè)計目標是實現(xiàn)對環(huán)境的有效互動，通過感知模塊收集環(huán)境信息，并通過行動模塊來改變環(huán)境狀態(tài)，整合了感知、決策、行動等多個環(huán)節(jié)，因而智能體在自主能力、決策能力、協(xié)作交互等方面展現(xiàn)出優(yōu)勢，彌補了大模型的不足，成為人工智能界的“行動派”。

2、智能體技術(shù)應(yīng)用

根據(jù)面向的對象、流程不同，智能體主要應(yīng)用在三種場景：

2.1 單智能體應(yīng)用

一個特定的環(huán)境中，僅有一個智能體進行感知、學(xué)習(xí)和行動，需要獨立地與環(huán)境進行交互，并根據(jù)環(huán)境的反饋來優(yōu)化其行為策略，以實現(xiàn)預(yù)設(shè)的目標。可應(yīng)用在交互性質(zhì)場景，如游戲AI（如圍棋、電子游戲等）、自動駕駛汽車、機器人控制等。單智能體系統(tǒng)的復(fù)雜性相對較低，某些任務(wù)中更容易實現(xiàn)和部署。

2.2 多智能體系統(tǒng)

由多個智能體（軟件程序、機器人或其他具有自治性的實體）組成的復(fù)雜的分布式系統(tǒng)，每個智能體都具有自己的感知、決策和行動能力，并且可以與其他智能體進行通信、信息共享、交互和協(xié)作，以實現(xiàn)共同的目標或任務(wù)。通常后端設(shè)定不同角色的智能體，前端通過對話鏈協(xié)同工作，能夠完成單個智能體難以完成或無法完成的任務(wù)，具有更高的靈活性、可擴展性和魯棒性?？蓱?yīng)用在分布式控制、智能交通、智能制造、自然語言處理等領(lǐng)域。

2.3 智能體平臺

構(gòu)建智能體系統(tǒng)的集成化平臺，用戶在平臺上定義并部署各類智能體，平臺通過策略性流程，優(yōu)化智能體組合以適應(yīng)特定任務(wù)需求，各智能體可扮演不同專業(yè)角色，在任務(wù)協(xié)商和角色分配后，協(xié)同執(zhí)行任務(wù)并完成結(jié)果整合。適用于智能體開發(fā)、企業(yè)定制化解決方案場景。

3、智能體產(chǎn)品演進從時間維度智能體主流產(chǎn)品的演進大致可劃分為三個階段：

3.1 構(gòu)建智能體框架階段

內(nèi)2023年3月AutoGPT框架項目發(fā)布，包括需求下發(fā)、自主運行、結(jié)果輸出三個核心模塊。功能上主要是通過Prompt向ChatGPT下發(fā)任務(wù)，ChatGPT通過大模型對語義內(nèi)容理解，輸出詳細的解決方案，經(jīng)過邏輯判斷選擇優(yōu)先執(zhí)行的步驟，生成可執(zhí)行的操作或指令，并調(diào)用外部資源或工具完成指令操作。AutoGPT框架把大模型的自然語言理解、內(nèi)容生成、邏輯推理等核心能力外推到具體場景，輔以感知與行動技術(shù)，有端到端解決問題的潛力，被認為是大模型落地的重要模式。

3.2 GPTs智能體雛形階段

2023年11月OpenAI推出Assistant API，后續(xù)發(fā)布GPTs服務(wù)，允許用戶構(gòu)建個人自定義GPT助手，無需編碼，用戶通過上傳個人數(shù)據(jù)以及自定義訓(xùn)練，能實現(xiàn)垂類模型的快速搭建，大幅度降低AI應(yīng)用的創(chuàng)作門檻，進一步推高智能體的熱潮。

3.3 個人智能體孵化階段

2023年12月聯(lián)想公布了個人智能體“小樂同學(xué)”的進展。個人智能體,基于內(nèi)嵌于終端的本地大模型打造，精準理解用戶意圖，并將意圖轉(zhuǎn)換為相應(yīng)的任務(wù)組合，分解任務(wù)并識別任務(wù)完成的路徑，通過查詢本地知識庫、調(diào)用設(shè)備API以及合適的模型或應(yīng)用來執(zhí)行相應(yīng)的任務(wù)，并將相應(yīng)的結(jié)果返回給智能體，智能體完成整合后反饋給用戶。與云端模型能力相比，整個過程完全不用上云，不侵犯用戶個人隱私，并對硬件有很強的控制能力。

4、發(fā)展方向和面臨的挑戰(zhàn)

在不久的將來，智能體將成為AI OS系統(tǒng)的最小工作單元，嵌入自主智能體的軟件極有可能改變現(xiàn)有的使用方式，從用戶適應(yīng)軟件變成軟件適應(yīng)用戶習(xí)慣，真正成為個人助理。進而系統(tǒng)級別的智能體有望直接操作App或者子智能體，在PC、手機、自動駕駛領(lǐng)域預(yù)計有廣泛的應(yīng)用場景。盡管大語言模型智能體已經(jīng)取得了重要的進展，但是在實際應(yīng)用中仍然面臨安全、倫理、計算資源消耗、復(fù)雜工具使用、多智能體交互機制、模型適配方法、面向真實世界的智能體模擬等一系列技術(shù)挑戰(zhàn)。

【參考文獻】

[1] 《國家人工智能產(chǎn)業(yè)綜合標準化體系建設(shè)指南（征求意見稿）》, 工信部,2024

[2] 《2023年人工智能體(AI Agent)開發(fā)與應(yīng)用全面調(diào)研：概念、原理、開發(fā)、應(yīng)用、挑戰(zhàn)、展望》,AI前沿,2023

[3] 《什么是Agent智能體？Agent智能體和大模型有什么區(qū)別？｜商派》,商派,2024,https://www.shopex.cn/news/archives/17685.html

[4] 《成果｜大模型驅(qū)動的自主智能體與群體智能》,AIGC最前線,2024

[5] 《單智能體（Single Agent）是指什么》,行業(yè)百科,2024

[6] 《多智能體系統(tǒng)是指什么》,行業(yè)百科,2024

[7] 《AI Agent發(fā)展現(xiàn)狀、行業(yè)結(jié)構(gòu)與趨勢分析》,天翼智庫,2024

[8] 《AutoGPT：自動化GPT原理及應(yīng)用實踐》,學(xué)習(xí)猿地,2023

[9] 《AI 時代,為什么「智能體」將成為第一入口》,極客公園，2024

[10] 《2023年度十大前沿科技趨勢報告》,量子位智庫,2023

[11] 《大語言模型》,AIBOX,2024

作者：高靜

單位：中國移動研究院業(yè)務(wù)研究所

未來新科技巨頭？AI智能體技術(shù)應(yīng)用及展望