這是美國開放人工智能研究中心(OpenAI)發(fā)布GPT-4o的直播視頻截圖
新華社北京5月15日電 美國開放人工智能研究中心(OpenAI)13日展示最新版本ChatGPT:與使用者展開語音對(duì)話、識(shí)別圖像并展開討論、翻譯……相比先前版本,它與使用者對(duì)話基本無延遲,會(huì)傾聽,能嘮嗑,還善于察言觀色,讓人驚呼新版本ChatGPT“更像人”了。
新版本ChatGPT取得了哪些突破?能在哪些領(lǐng)域?qū)崿F(xiàn)應(yīng)用?它對(duì)人工智能領(lǐng)域的影響有多大?新華社記者為您解局——
有哪些“進(jìn)化”?
開放人工智能研究中心13日發(fā)布的人工智能模型名為GPT-4o,編號(hào)中的字母“o”代表“omni”(全能),既能接受文本、音頻和圖像的任意組合輸入,還能生成文本、音頻和圖像的相關(guān)回應(yīng)。
這一中心不僅圍繞GPT-4o做了直播演示,還在社交媒體發(fā)布更多視頻“炫技”。
在發(fā)布的視頻中,GPT-4o聽起來明顯“更會(huì)聊天了”,還時(shí)不時(shí)拋出幾個(gè)笑話。它的音調(diào)有些許變化,言語間帶著笑意,與它聊天更像與真人交談。
實(shí)時(shí)聊天是ChatGPT的關(guān)鍵技能。相比先前版本,GPT-4o的不同主要表現(xiàn)在:一是使用者可以隨時(shí)打斷聊天機(jī)器人,無需像從前那樣等它把話說完;二是它會(huì)實(shí)時(shí)對(duì)問題作出回應(yīng),不再有兩到三秒的時(shí)滯;第三,它能感知人的情緒,比如演示者呼吸急促,它會(huì)詢問對(duì)方是否需要稍稍穩(wěn)定下情緒。另外,GPT-4o可以生成不同風(fēng)格的聲音。
演示中,GPT-4o利用其視覺和語音能力,指導(dǎo)演示者在紙上逐步解出一道方程題,而不是直接給出答案。它還展示了英語與意大利語互譯、用自拍照片識(shí)別情緒等能力。當(dāng)一名演示者告訴它,自己正展示它是“多么有用和不可思議”時(shí),它回答道:“哦,快別說了,怪害臊的?!?/p>
開放人工智能研究中心首席執(zhí)行官薩姆·奧爾特曼當(dāng)天在博客中寫道,GPT-4o就像電影中的人工智能技術(shù)?!芭c電腦交談一直讓我感覺不自然,現(xiàn)在自然了?!?/p>
應(yīng)用潛力如何?
北京郵電大學(xué)人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉說,無論是在文本生成、做題、問答系統(tǒng)還是情感分析等任務(wù)中,GPT-4o都表現(xiàn)出很好的能力。這種技術(shù)的突破,無疑將對(duì)國內(nèi)外的相關(guān)企業(yè)產(chǎn)生重大影響,它不僅推動(dòng)了自然語言處理技術(shù)的發(fā)展,也讓人工智能在多個(gè)領(lǐng)域的應(yīng)用變得更加廣泛和深入。
他認(rèn)為,GPT-4o將推動(dòng)人工智能在金融服務(wù)、教育、醫(yī)療、無人駕駛汽車等領(lǐng)域的應(yīng)用,有望引領(lǐng)人工智能技術(shù)全面發(fā)展。
4月23日,在德國漢諾威工博會(huì)上,參觀者與一款智能機(jī)器人進(jìn)行“石頭剪子布”游戲。新華社記者任鵬飛攝
近年來,開發(fā)更人性化、功能更強(qiáng)大的生成式人工智能工具競(jìng)爭(zhēng)激烈。就在開放人工智能研究中心發(fā)布GPT-4o的第二天,谷歌母公司字母表公司召開谷歌開發(fā)者年度會(huì)議,人工智能是重頭戲。硅谷企業(yè)家埃隆·馬斯克、技術(shù)企業(yè)“深層思維”創(chuàng)始人之一穆斯塔法·蘇萊曼也分別投資開發(fā)了聊天機(jī)器人Grok和Pi,將擬人化特點(diǎn)作為產(chǎn)品主攻方向。
英國廣播公司評(píng)論,GPT-4o能夠結(jié)合文本、音頻和圖像內(nèi)容瞬間做出反應(yīng),目前在競(jìng)爭(zhēng)中處于領(lǐng)先地位。
開放人工智能研究中心首席技術(shù)官米拉·穆拉蒂說,GPT-4o定于幾周內(nèi)上線,用戶可免費(fèi)試用。ChatGPT原有付費(fèi)用戶將獲得新版本更多使用權(quán)限。
需要擔(dān)憂什么?
在開放人工智能研究中心公布的一段演示視頻中,GPT-4o一步步引導(dǎo)一名男孩解答出數(shù)學(xué)題。一些網(wǎng)友直呼,再也不用輔導(dǎo)孩子寫作業(yè)了。一些人卻擔(dān)心,教師這一職業(yè)會(huì)不會(huì)被人工智能取代。
一些人工智能專家認(rèn)為,新版ChatGPT雖然可能比競(jìng)爭(zhēng)對(duì)手水平更高且更易使用,但不太可能很快讓一些職業(yè)徹底消失,從事教學(xué)或翻譯工作的人更有可能會(huì)使用這些工具,而不是被它們?nèi)〈?/p>
新加坡人工智能計(jì)劃人工智能產(chǎn)品高級(jí)總監(jiān)萊斯利·特奧說,教學(xué)工作涉及到人類的同理心,“教師自己經(jīng)歷了學(xué)習(xí)過程并且了解人如何克服困難,而人工智能不同”。他認(rèn)為,教學(xué)、翻譯和客戶服務(wù)等工作不可能因GPT-4o的出現(xiàn)而消失。
也有一些專家認(rèn)為,技術(shù)演示能在大多數(shù)人中引起反響,它通常是精心打造的,未必能反映產(chǎn)品的真實(shí)功能。
劉偉說,GPT-4o的語音功能改變了對(duì)話式人工智能的游戲規(guī)則,但依然沒有實(shí)現(xiàn)聊天機(jī)器人的深度態(tài)勢(shì)感知能力,比如意圖理解、動(dòng)機(jī)分析等。此外,GPT-4o的進(jìn)步在人工智能倫理和安全方面帶來了新的挑戰(zhàn),需要我們?cè)跀?shù)據(jù)隱私、信息可信性、潛在偏見、惡意使用、意識(shí)和責(zé)任等方面開展新的思考。(記者:陳丹、袁原;剪輯:韓婧伊(實(shí)習(xí)生);編輯:王豐豐、魯豫、程大雨、沈浩洋)