這段時間,ChatGPT成了全球科技企業(yè)“群起而攻之”的風(fēng)口,幾乎打開每一個社交媒體平臺、每一個微信群,都在激情討論ChatGPT。
不過我發(fā)現(xiàn),經(jīng)過一段時間的發(fā)酵,大家的情緒不再只是獵奇和興奮,一部分AI業(yè)內(nèi)人士,已經(jīng)率先進(jìn)入了ChatGPT冷靜期。
一位長期從事NLP/AI的研究人士告訴我,NLP本來屬于長期坐冷板凳的領(lǐng)域,ChatGPT對話中錯誤隨處可見,LLM大語言模型的商業(yè)模式還不清晰,認(rèn)知智能剛剛劃過了冰山一角,對目前ChatGPT的一波波信息轟炸已經(jīng)審美疲勞了,是時候給ChatGPT降降溫了。
降溫是不可能降溫的,但找回常識和理性是必須的。
大膽預(yù)測,今年會是一個ChatGPT大年。
國產(chǎn)化的必然選擇,股市與投資者的熱捧,大量中國科技企業(yè)已經(jīng)切實在跟進(jìn)類ChatGPT,而且“chat”問答天然的低門檻和娛樂性,確實會吸引大量原本不關(guān)心技術(shù)的人開始玩AI。所以,盡管圍繞ChatGPT,有很多瘋狂炒作和無稽之談,但熱度勢必還會持續(xù)一段時間。
當(dāng)然,如果你已經(jīng)對ChatGPT資訊有點審美疲勞了,好消息是,大部分人在“調(diào)戲”ChatGPT之后,獵奇心理也會消失。加上ChatGPT在應(yīng)用和體驗上還需要迭代,個人關(guān)注度會下降,而能夠用ChatGPT帶來業(yè)務(wù)價值的產(chǎn)業(yè)關(guān)注度,還會持續(xù)保溫。
所以,ChatGPT接下來的發(fā)展,不是“要么火要么涼”那么兩極分化,而是會經(jīng)歷一個恒溫培育孵化的發(fā)展期。
擔(dān)心中國做不好ChatGPT的,不用急,一切才只是剛剛開始;認(rèn)為中國ChatGPT可以彎道超車的,不用嗨,新技術(shù)還是要按照規(guī)律按部就班地發(fā)展進(jìn)步。
從第一代生成式預(yù)訓(xùn)練模型GPT-1到GPT-4,這條路OpenAI走了五年??梢哉f,沒有對大模型的長期投入與探索,是不可能一步登天,做出ChatGPT這樣的產(chǎn)品的。
那么,中國有沒有類似的AI企業(yè),擁有支撐起類 ChatGPT的綜合實力呢?
通過國際權(quán)威咨詢機構(gòu)IDC新近發(fā)布的《2022 中國大模型發(fā)展白皮書》,我們可以一窺國內(nèi)大模型實力分布。
評估結(jié)果顯示,百度旗下的文心大模型表現(xiàn)非常突出,在市場格局中處于第一梯隊,產(chǎn)品能力、生態(tài)能力、應(yīng)用能力全面領(lǐng)先,給百度即將發(fā)布的生成式對話產(chǎn)品文心一言,提供了強大的技術(shù)支持。
讓我們暫時排除“支持國貨”的民族情緒,帶著理性和常識去探究一下,文心大模型的水平到底怎么樣?文心一言等類ChatGPT產(chǎn)品,究竟能為用戶和市場提供什么樣的價值?
拆解ChatGPT:一匹以大模型為骨架的“特洛伊木馬”
ChatGPT的出現(xiàn),代表了大語言模型的突破,將對話式AI與NLP技術(shù)帶到了一個全新的高度,展現(xiàn)了AI的更多可能性和商用潛力。
上個世紀(jì),信息哲學(xué)領(lǐng)軍人盧西亞諾?弗洛里迪就說過,“人工智能就像特洛伊木馬, 把一種更具包容性的計算/信息的范式引入哲學(xué)的城堡。”而ChatGPT就是一匹看起來極其神奇的特洛伊木馬,令人類嘖嘖稱奇,擔(dān)心自己不再是城堡中唯一的萬物之靈。
當(dāng)然,歸根結(jié)底,AI也好,ChatGPT也好,都是一匹人造的木馬,由人類創(chuàng)造,也為人類所驅(qū)使。
ChatGPT這匹“特洛伊木馬”的出現(xiàn),更大的意義在于,它代表了一個標(biāo)志——通過大模型這種方式,人工智能的知識瓶頸,是可以被打破的。
我們知道,算力、算法、數(shù)據(jù),這AI三要素在當(dāng)下基本得到了滿足,帶來了AI技術(shù)應(yīng)用化的突破。但許多自然語言處理NLP任務(wù),如機器翻譯、情感分析、問答系統(tǒng)、語言生成等,需要模型具有一定的語言知識和理解能力。張鈸院士曾提出:AI最重要的能力是知識。但知識,始終是AI的一個瓶頸。
ChatGPT的出現(xiàn),標(biāo)志著知識瓶頸是可以被打破的。通過大模型,學(xué)習(xí)海量的語料庫,可以獲取豐富的語言知識,對語言中的復(fù)雜結(jié)構(gòu)、語義和邏輯,進(jìn)行識別和處理。
大家感覺ChatGPT特別神奇,好像真的有自主思維一樣,正是源自知識能力融入大模型后,在泛化性、通用性、遷移性上的強大表現(xiàn)。
它是一個標(biāo)志,也只是一個標(biāo)志。
因為ChatGPT也并沒有徹底解決知識瓶頸,還存在一些局限性。比如由于中文語料不夠多,獲取的深度中文知識少,所以對中文的理解和問答效果都不如英文,經(jīng)常出現(xiàn)常識性錯誤。
那么,問題來了。OpenAI又不向中國大陸開放服務(wù),對于優(yōu)化ChatGPT的中文能力顯然不會投入太多資源。同時,AI又廣泛應(yīng)用在安防、識別、智慧城市等重要領(lǐng)域,安全性和可靠性也決定了,發(fā)展國產(chǎn)化ChatGPT,成為了必然的選擇。
好消息是,機會總是留給有準(zhǔn)備的人,中國AI過去多年間不斷積累升級,并沒有在大模型時代令我們失望。
自2018年預(yù)訓(xùn)練大模型成為風(fēng)潮后,中國AI領(lǐng)域快速跟進(jìn),已經(jīng)積累了大模型所需要的全產(chǎn)業(yè)鏈要素,包括算力基礎(chǔ)設(shè)施、數(shù)據(jù)集、算子庫、深度學(xué)習(xí)開發(fā)框架、AI開發(fā)工具,以及多個領(lǐng)域的大模型產(chǎn)品。
人家牽出了盤亮條順的“特洛伊木馬”,中國科技企業(yè)將自家拉磨的驢包裝成汗血寶馬,顯然就不太合適了。國產(chǎn)大模型必須足夠優(yōu)秀,才能讓國人和企業(yè)放心支持。
IDC此時發(fā)布《2022中國大模型發(fā)展白皮書—— 元能力引擎筑基智能底座》,首提大模型評估框架,是一個大模型比武的好契機,讓我們可以綜合評估國產(chǎn)大模型的實力。
從文心的三輪驅(qū)動,稱稱國產(chǎn)大模型的重量
投資市場有句話,“在短期,市場是個投票器;在長期,市場是個稱重器?!庇龅蕉唐陲L(fēng)口“豬也能在天上飛”,但長期來看,任何公司和概念都要靠扎扎實實的核心能力,長出翅膀,才能穿越風(fēng)雨,持續(xù)騰飛。
放到ChatGPT概念上也一樣,各種國產(chǎn)類ChatGPT產(chǎn)品出現(xiàn),到底是騾子是馬,得拉出來遛遛。
此次《白皮書》中,IDC搭建了大模型評估框架V1.0,選取國內(nèi)主流廠商(N=9),從模型能力、工具平臺能力、開放性、應(yīng)用廣度、應(yīng)用深度、應(yīng)用生態(tài)共6大維度的11項指標(biāo),進(jìn)行打分評估。結(jié)果顯示,百度文心大模型的產(chǎn)品能力、生態(tài)能力達(dá)到L4水平,應(yīng)用能力達(dá)到L3水平,處于第一梯隊。IDC中國副總裁兼首席分析師武連峰認(rèn)為,百度文心大模型是其打造文心一言的堅實基礎(chǔ)。
現(xiàn)實進(jìn)展來看,百度率先打開局面,即將推出類ChatGPT的生成式對話產(chǎn)品文心一言。
《白皮書》中提到,“模型+工具平臺+生態(tài)” 三級協(xié)同,是OpenAI在開發(fā)GPT大模型過程中的核心思路,經(jīng)過長期的積累,也更容易形成競爭壁壘。
我們不妨從這三個角度出發(fā),去稱稱百度文心大模型的重量,究竟與OpenAI有何差距?
第一,大模型的產(chǎn)品能力。
模型層,是大模型的核心引擎,也是相關(guān)產(chǎn)品的主要優(yōu)勢和競爭賽點。
ChatGPT的成功,得益于大規(guī)模的數(shù)據(jù)集,較強的模型開發(fā)和算法調(diào)優(yōu)能力,在NLP領(lǐng)域的長期積累,以及來自微軟的計算資源支撐等。總的來說,打造一個像ChatGPT這樣的大模型產(chǎn)品,需要對算法和技術(shù)有深入的理解,以及數(shù)據(jù)、算力等支持。
這方面,我們可以看到,百度要打造類ChatGPT產(chǎn)品,不是從零開始,而是有著長期積累和綜合優(yōu)勢。
百度自2019年開始深入研發(fā)預(yù)訓(xùn)練模型,發(fā)布了知識增強的產(chǎn)業(yè)級大模型文心ERNIE1.0。在深度學(xué)習(xí)的基礎(chǔ)上融入知識,將海量的知識積淀和自研的多源異構(gòu)知識圖譜,投入到文心大模型的預(yù)訓(xùn)練中,在知識的指導(dǎo)下,文心大模型的效率更高、效果更好,可解釋性更強。用于訓(xùn)練的數(shù)據(jù)量級也有顯著優(yōu)勢,模型參數(shù)達(dá)到萬億級別。2020年開始將文心大模型應(yīng)用到搜索業(yè)務(wù),可以說,百度在破解AI知識瓶頸這一問題上的探索,并不比OpenAI落后,更比國內(nèi)很多科技企業(yè)要早得多。
目前,困擾國產(chǎn)ChatGPT的算力資源和成本問題,百度也在開發(fā)文心大模型的過程當(dāng)中,與國內(nèi)外硬件伙伴合作尋找解決方案,百度飛槳深度學(xué)習(xí)平臺向下適配各種硬件,以支持文心大模型的開發(fā)、高性能訓(xùn)練、模型壓縮、服務(wù)部署的各種能力。
可以說,百度在大模型方面有著貫通全產(chǎn)業(yè)鏈的積累,能夠滿足類ChatGPT產(chǎn)品的開發(fā)需求,具有較強的先發(fā)優(yōu)勢。
第二,應(yīng)用工具平臺。
大模型的落地應(yīng)用,是海外AI研究機構(gòu)很少提及,卻是產(chǎn)業(yè)智能化不可規(guī)避的問題。真實的產(chǎn)業(yè)應(yīng)用場景中,企業(yè)和開發(fā)者接入大模型的方式多種多樣,有的需要產(chǎn)品級的API接口,有的希望能夠開放深度定制,有的則對成本非常敏感。
所以,要讓大模型廣泛應(yīng)用,就必須平臺提供完善的成體系的全棧工具鏈,包括深度學(xué)習(xí)框架、基礎(chǔ)模型庫、數(shù)據(jù)集、端到端開發(fā)套件、API接口等,才能讓更多行業(yè)人員或開發(fā)者,能夠低門檻甚至零門檻的將大模型應(yīng)用于自己的業(yè)務(wù)中。
目前,ChatGPT還是沒有開源的,想要基于ChatGPT打造集成化的行業(yè)應(yīng)用產(chǎn)品,還不現(xiàn)實。這一點上,和飛槳深度學(xué)習(xí)平臺生態(tài)共享的文心大模型,可以借助飛槳龐大且豐富的工具平臺,以及AI開發(fā)社區(qū),加速大模型的產(chǎn)業(yè)化應(yīng)用,更快建立起商業(yè)閉環(huán)。
第三,行業(yè)生態(tài)。
正如OpenAI的首席執(zhí)行官山姆·奧特曼所說,ChatGPT的技術(shù)不應(yīng)該被保留在科技行業(yè)的狹小范圍內(nèi),而應(yīng)該擁抱真實世界。
但是,大模型與千行百業(yè)的融合,充滿了未知的領(lǐng)域,要一個行業(yè)、一個行業(yè)去探索,與開發(fā)者、行業(yè)用戶、上下游產(chǎn)業(yè)共創(chuàng),這是一個苦活重活,確實大模型走向產(chǎn)業(yè)、擁抱真實世界的更優(yōu)解。
生態(tài)建設(shè)上,百度文心大模型與飛槳深度學(xué)習(xí)平臺生態(tài)共享,前期已經(jīng)做了大量的工作?!栋灼凤@示,百度飛槳生態(tài)已經(jīng)凝聚了535萬開發(fā)者、服務(wù)20萬家企事業(yè)單位,與12家硬件伙伴聯(lián)合發(fā)布飛槳生態(tài)發(fā)行版、推動深度學(xué)習(xí)平臺與更多硬件適配,還與國內(nèi)科研院所、實驗室以及高校強強聯(lián)手,一同攻克AI技術(shù)難關(guān),目前賦能了389所高校,服務(wù)747名教師,學(xué)分課培養(yǎng)10萬余名AI學(xué)子 。
在此基礎(chǔ)上,文心大模型與眾多頭部企業(yè)合作,融合了通用數(shù)據(jù)和行業(yè)特有知識,推出行業(yè)大模型系列,比如能源行業(yè)NLP大模型國網(wǎng)-百度·文心、金融行業(yè)NLP大模型浦發(fā)-百度·文心等,顯著提升了大模型在行業(yè)任務(wù)上的應(yīng)用效果,也在重點行業(yè)形成了大模型落地應(yīng)用的參考路徑,給全球大模型走向商業(yè)化,起到一定的示范作用。
“模型+工具平臺+生態(tài)”,三輪驅(qū)動下,一點點將大模型推向廣闊的產(chǎn)業(yè)天地。
化解中國AI焦慮的另一種思路:大模型的產(chǎn)業(yè)突圍
ChatGPT火爆之后,大家可能聽到了類似的聲音,認(rèn)為中國科技企業(yè)不像OpenAI這樣長期投入,中國AI缺乏元創(chuàng)新、底層創(chuàng)新,中國在ChatGPT上已經(jīng)落后了追趕要花很多錢……
其實梳理百度文心大模型的進(jìn)化史會發(fā)現(xiàn),這些都是一種科技自立焦慮心理的“暈輪效應(yīng)”,即因為某個細(xì)分領(lǐng)域、垂直領(lǐng)域的短板,而放大到對中國AI整體能力的質(zhì)疑和虛無論,這顯然是不客觀的。至少在大模型這個領(lǐng)域,中國技術(shù)自信是很真實的。
ChatGPT熱潮也體現(xiàn)出,大模型成為發(fā)展AI技術(shù)的必然選擇。這也為化解中國AI焦慮,提供了另一種思路,那就是大模型的產(chǎn)業(yè)突圍。
IDC認(rèn)為,大模型將會助推數(shù)字經(jīng)濟,為智能化升級帶來新范式。對行業(yè)用戶而言,大模型已表現(xiàn)出巨大的潛力,企業(yè)應(yīng)該盡早關(guān)注,在業(yè)務(wù)中布局。
但ChatGPT雖好,這類新技術(shù)在與行業(yè)融合時,實際中還會面對一系列適配問題,比如:
1.原始模型太大,難以在產(chǎn)線、礦山、園區(qū)等終端側(cè)部署。
2.需要與行業(yè)專精知識相結(jié)合,開發(fā)定制程度更高、更安全可靠的垂直應(yīng)用。
3.服務(wù)商自行開發(fā)類ChatGPT成本太高,難度很大,商業(yè)效益難保障。
所以,要打通ChatGPT等新AI技術(shù)向產(chǎn)業(yè)釋放的一系列關(guān)節(jié),真是“尋龍分金看纏山,一重山是一重關(guān)”,有著千山萬水要過。這時候,圍繞文心大模型這樣的產(chǎn)業(yè)級平臺,去撬動新技術(shù)的可能,或許才是真正的機遇所在。
在這個過程中,百度這樣的AI頭部玩家,接下來還需要做好三件事:
1.夯實AI基礎(chǔ)設(shè)施。通過文心大模型與飛槳深度學(xué)習(xí)平臺,夯實AI基礎(chǔ)設(shè)施底座,加速類ChatGPT產(chǎn)品的開發(fā),持續(xù)技術(shù)創(chuàng)新的同時,提供基礎(chǔ)模型、豐富工具棧、API接口等必要資源,成為各行業(yè)都可以低門檻引入AI的創(chuàng)新底座。
2.進(jìn)一步加強生態(tài)開放。有活力的創(chuàng)新開發(fā)環(huán)境,才有中國AI應(yīng)用的百花齊放,頭部企業(yè)有責(zé)任為生態(tài)賦能,不斷向開發(fā)者釋放資源和支持。近日來,愛奇藝、集度汽車(通過Apollo)、小度、宇信科技、漢得信息、金蝶軟件、寶寶巴士、智聯(lián)招聘、太平洋汽車網(wǎng)等知名企業(yè),都已經(jīng)加入了百度文心一言生態(tài)圈,獲得該AI技術(shù)的“加持”。據(jù)說,文心一言還將會推出生態(tài)伙伴計劃,全面支持伙伴,共同發(fā)展商業(yè)市場。
3.探索無人區(qū),不斷推動新技術(shù)與行業(yè)問題的結(jié)合。盡管每次AI領(lǐng)域的技術(shù)突破都會引發(fā)很大的輿論關(guān)注,但AI在行業(yè)當(dāng)中的滲透率只有10%左右,還有大量空白地帶是可以與AI相結(jié)合的,需要頭部企業(yè)去引導(dǎo)和探索,形成示范案例。
總之,中美AI或許在頂級科研、底層技術(shù)上有差距,但中國科技企業(yè)、從業(yè)者、開發(fā)者以及無數(shù)行業(yè)和企業(yè),從來沒有“躺平”過,一直在追逐著新技術(shù)的腳步。這些要素疊加在一起,是文心大模型的重量,也是中國AI的重量。