2020年5月,1750 億參數(shù)級別的萬能語言模型GPT-3誕生,一躍成為AI界的流量巨星。有人高呼“通用人工智能”的破冰而出,也有人質(zhì)疑這不過是一場嚴(yán)重依賴數(shù)據(jù)和算力資源的氪金游戲。
人類語言錯綜復(fù)雜,機器以假亂真的“模仿游戲”絕非易事。作為人工智能皇冠上的耀眼明珠,自然語言處理會成為黃金時代的寵兒,還是誤入歧途的悲情英雄?學(xué)術(shù)界與產(chǎn)業(yè)界的革故鼎新,又路在何方?
2020年中國科技峰會系列活動青年科學(xué)家沙龍上,第20期AI Time圓桌會議邀請了百度人工智能技術(shù)委員會主席何中軍、清華大學(xué)計算機系副教授劉知遠(yuǎn)、北京彩智科技有限公司CEO徐劍軍、中國科學(xué)院計算所研究員蘭艷艷,由北京交通大學(xué)副教授萬懷宇和AI Time負(fù)責(zé)人何蕓主持,共話自然語言處理的研究瓶頸與未來曙光!
1. 算法的瓶頸與突破
機器:“無知”的文盲
過去大家經(jīng)常聽到一個段子:在翻譯外文著作中把把中國的哲學(xué)家Mencius(孟子)錯譯為門修斯,這是由于缺乏相關(guān)背景知識造成的。作為領(lǐng)域?qū)<疑星視高@種錯誤,可見融合知識對于人類而言也是非常具有挑戰(zhàn)性的。而不懂運用知識和常識,機器很多時候只是在一本正經(jīng)地胡言亂語。
即便是目前臨近數(shù)據(jù)驅(qū)動和計算的極限狀態(tài)的GPT-3,也會在執(zhí)行文本生成任務(wù)時答非所問,連基本的常識和簡單的邏輯推理都不過關(guān)。非常典型的例子就是:
How many eyes does my foot have?
我的腳有多少只眼睛?
Your foot has two eyes.
你的腳有兩只眼睛。
因此,單純基于現(xiàn)有數(shù)學(xué)模型計算的方式,對理解自然語言的語義仍有著極大的局限性。打破語義解析和建模的瓶頸,結(jié)合知識和常識是一個非常關(guān)鍵的方向。
知識和常識如何定義和獲取?
常識是難以界定的、寬泛抽象的東西。從統(tǒng)計時代到深度學(xué)習(xí),機器從數(shù)據(jù)中捕捉和學(xué)習(xí)共現(xiàn)規(guī)律。然而,人類很多常識并不以明確可見的數(shù)據(jù)形式存在,即便搜刮互聯(lián)網(wǎng)的邊邊角角,也很難挖掘到這樣的數(shù)據(jù)。機器能否學(xué)到常識?如何描述、存儲和積累常識?這條路是否行得通,語言理解真的需要跨越常識這座大山么?
最近知識圖譜在NLP中的融合取得了巨大進(jìn)展,然而現(xiàn)在很多知識圖譜是利用手工自建的方式,能否自動構(gòu)建大規(guī)模知識,仍待攻克。
跨模態(tài)的自然語言理解
實現(xiàn)從感知到認(rèn)知、從NLP到NLU,蘭艷艷強調(diào)也可以引入多模態(tài)。語用學(xué)證明,語言的真正含義不一定在字面意義上體現(xiàn),需要結(jié)合特殊場景挖掘其隱含意圖。例如小朋友們微信聊天:
問:你要玩游戲嗎?
答:我媽媽在家。
很多時候,融入視覺聽覺、活動歷程、主體與環(huán)境的交互等多模態(tài)信息,才能達(dá)到更準(zhǔn)確的語言理解。要捕捉弦外之音,需利用外部知識的支持。
“舉一反三”的抽象學(xué)習(xí)
目前人工智能數(shù)據(jù)驅(qū)動的方法,更多是舉十反一:學(xué)習(xí)“十”分?jǐn)?shù)據(jù)、達(dá)到“一點”泛化的能力。反觀人類,則擁有舉一反三的智慧。人的大腦是有可塑性和變通性的,能利用極少的數(shù)據(jù)學(xué)到知識并擴展運用到其他領(lǐng)域。
因此,盡管GPT-3能夠激活現(xiàn)實世界中極大規(guī)模的無監(jiān)督數(shù)據(jù),但絕非終點。在利用現(xiàn)實世界數(shù)據(jù)的基礎(chǔ)上,我們還需要突破當(dāng)前深度學(xué)習(xí)中數(shù)學(xué)建模、函數(shù)學(xué)習(xí)的研究范式,嘗試構(gòu)建世界認(rèn)知模型,讓機器具備抽象學(xué)習(xí)的能力。
術(shù)業(yè)有專攻:小而精的行業(yè)數(shù)據(jù)
目前,大規(guī)模預(yù)訓(xùn)練模型在很多NLP任務(wù)上拔高了層次。但術(shù)業(yè)有專攻,拿體量巨大的通用模型GPT-3應(yīng)用到極小的細(xì)分領(lǐng)域,仍是行不通的,并且無異于大炮打蚊子?;蛟S在某些特定任務(wù)上收集更高質(zhì)量數(shù)據(jù)并融入知識進(jìn)行訓(xùn)練,能夠更精準(zhǔn)高效地解決問題。
之前我們青睞大數(shù)據(jù),其實比起依賴數(shù)據(jù)擴充,一個很有意思的研究方向是知識遷移,譬如小樣本( few-shot )甚至零樣本學(xué)習(xí)( one-shot learning )。
2. 人才培養(yǎng)與產(chǎn)業(yè)落地
頂天立地:產(chǎn)學(xué)研的結(jié)合
在何中軍看來,百度一貫追求“頂天立地”的理念,一方面腳踏實地做基礎(chǔ)研究,另一方面立足于用戶和產(chǎn)業(yè)的需求。這也是一種軟硬實力的結(jié)合,將學(xué)校的基礎(chǔ)知識和工程能力快速應(yīng)用到產(chǎn)品、服務(wù)和不同場景中去。
從學(xué)術(shù)角度,研究者應(yīng)當(dāng)破除深度學(xué)習(xí)的假象,不滿足于跑跑模型達(dá)到效果就萬事大吉的走捷徑心態(tài),而是深入探究底層原理。從產(chǎn)業(yè)角度,尤其需要知其所以然、懂得算法原理,同時又能深入到場景和具體領(lǐng)域、掌握其數(shù)據(jù)資源和知識結(jié)構(gòu)的關(guān)鍵人才,然而這種人才無法通過傳統(tǒng)的學(xué)校教育方式培養(yǎng)。在產(chǎn)業(yè)鏈中,我們會被各種持續(xù)不斷的問題困擾,現(xiàn)階段技術(shù)遠(yuǎn)遠(yuǎn)難以滿足用戶的終極需求。
學(xué)術(shù)界和產(chǎn)業(yè)界應(yīng)當(dāng)形成一個互動互惠的生態(tài)圈。學(xué)術(shù)圈不應(yīng)過分崇尚論文為王的競爭法則,學(xué)術(shù)成果固然重要,但創(chuàng)造社會價值、解決實際問題才是根本目的。同時,技術(shù)產(chǎn)業(yè)應(yīng)用也受限于科學(xué)問題的變革與突破,因此急需沉心靜氣的基礎(chǔ)研究者。徐劍軍坦言,背負(fù)盈利壓力、講求快速增長迭代的企業(yè),要面向一個NLP產(chǎn)業(yè)問題持續(xù)數(shù)十年踏踏實實埋頭耕耘,會面臨業(yè)界過高的期望值、人才受到太多誘惑等外界干擾。
針對高校研究與工業(yè)脫節(jié)的現(xiàn)象,如何各取所長、攜手并進(jìn),劉知遠(yuǎn)指出,我們需要探索出一種新型的人才培養(yǎng)與科研模式,例如業(yè)界對學(xué)術(shù)界的算力支援、提供類似維基百科這樣開放共建的公益平臺等。對知識產(chǎn)權(quán)的尊重與保護(hù)、避免創(chuàng)新思想被大公司竊取侵吞也是亟待解決的問題。
NLP為何難出獨角獸?
計算機視覺領(lǐng)域有以包括商湯、曠視在內(nèi)的“CV 四小龍”為首的獨角獸公司。然而,盡管NLP研究近年來突飛猛進(jìn)、甚至在ACL 2020中投稿數(shù)量高達(dá)3429篇,該領(lǐng)域卻似乎難以涌現(xiàn)出獨角獸。
這或許是因為一方面,單純?nèi)四樧R別或者安防系統(tǒng),就可以構(gòu)成很大的場景,成就一家專門的公司。然而NLP中的文本分析等任務(wù),似乎還局限于小范圍場景。另一方面,產(chǎn)業(yè)落地受到技術(shù)限制,例如智能音箱仍無法做到真正的語言理解,機器同傳也出現(xiàn)層出不窮的錯誤。NLP本身的復(fù)雜性,決定了它離產(chǎn)業(yè)爆發(fā)還有一定距離。
另外,NLP的落地在于與不同場景融合,尤其是法律、醫(yī)療等以語言或文本為重要載體和工具的領(lǐng)域。隨著技術(shù)進(jìn)步,在智能個人信息助理、智能問答方面,NLP技術(shù)或許會徹底改變搜索引擎這種獲取信息的方式,針對你提出的問題實現(xiàn)音視頻結(jié)合的精準(zhǔn)回答,逐漸成為日?;A(chǔ)設(shè)施!
3. 人與機器,路在何方?
深度學(xué)習(xí)時代,自然語言處理似乎勝利在望,卻又迷霧茫茫。從知識融合到認(rèn)知推理甚至情感表達(dá),實現(xiàn)可解釋的、去偽存真的語言理解,依舊道阻且長。
可以預(yù)見,未來必定是人機共存的世界。機器消費著人類積累的信息,同時產(chǎn)出信息,從新聞、網(wǎng)聊到小說無處不在。計算機會通過信息間接控制人類社會嗎?人的主體地位在哪里?如今出行都離不開導(dǎo)航的我們,未來又會對機器產(chǎn)生怎樣的依賴?
盡管現(xiàn)在的語言智能時常懵懂如孩童,然而在保險、銀行、證券或政府部門等具體行業(yè),通過實現(xiàn)自然語言的輸入輸出、培養(yǎng)出一個堪比三十歲人類的智能職員,是大有可為的。非創(chuàng)造性、機械重復(fù)的勞動,終將被取代!
在知識的記憶和提取上,AI或許會超越人類。曾經(jīng)勤學(xué)苦練數(shù)年才掌握一門外語的你,或許已經(jīng)面對機器翻譯的出色表現(xiàn)啞口無言。未來教育中,“知識就是力量”還會是至理名言嗎?怎樣的知識才值得人類去學(xué)習(xí)與創(chuàng)造呢?
主持人最后的話讓人一愣:所以學(xué)就應(yīng)該學(xué)人工智能是嗎?