圖1頭圖 | 圖源百度百科
從0到1
這是計(jì)算機(jī)語言的飛躍
ChatGPT的出現(xiàn)
會(huì)成為AI跨越圖靈測(cè)試的飛躍嗎?
1
ChatGPT為何這么厲害?
ChatGPT是OpenAI推出的一款人工智能語言處理工具.
簡(jiǎn)單來說,ChatGPT是一款聊天機(jī)器人程序.
往深了說,ChatGPT能夠通過特定的神經(jīng)網(wǎng)絡(luò)架構(gòu)來學(xué)習(xí)和理解人類的語言,并在此基礎(chǔ)上和人類進(jìn)行互動(dòng),也就是一款可以像真人一樣聊天交流的AI。
更有甚者,可以在特定方式下使用ChatGPT完成文案撰寫、腳本編程、文本翻譯、代碼編寫等任務(wù)。
圖2 | 圖源新京報(bào)
得益于Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)(GPT-3.5模型),ChatGPT擁有專用的數(shù)據(jù)處理和理解模型,在此基礎(chǔ)上形成了ChatGPT的交流和理解能力。
換言之,ChatGPT能夠通過連接大量的語料庫來學(xué)習(xí)和訓(xùn)練自身的應(yīng)答模型。
因此我們?cè)谑褂肅hatGPT時(shí),可以看作是在同一個(gè)會(huì)說話的搜索引擎交流。
圖3 | 圖源新京報(bào)
2
顛覆性的AI
七十多年前,科學(xué)家艾倫·圖靈針對(duì)AI技術(shù)提出了著名的“圖靈測(cè)試”。
“測(cè)試者與被測(cè)試者(一個(gè)人和一臺(tái)機(jī)器)隔開的情況下,通過一些裝置(如鍵盤)向被測(cè)試者隨意提問。進(jìn)行多次測(cè)試后,如果機(jī)器讓平均每個(gè)參與者做出超過30%的誤判,那么這臺(tái)機(jī)器就通過了測(cè)試,并被認(rèn)為具有人類智能。”
30%的標(biāo)準(zhǔn),來自于圖靈對(duì)未來機(jī)器思考能力的一個(gè)預(yù)測(cè),而如今看來,ChatGPT的出現(xiàn)無疑是加快了AI通過圖靈測(cè)試的進(jìn)程。
上知天文、下知地理的ChatGPT,既能回答現(xiàn)實(shí)問題,又能穿越時(shí)空為名家代筆寫詩。
如此具有顛覆性的技術(shù)也不禁讓人們思考,它會(huì)不會(huì)讓人們失業(yè)?
如果會(huì),又會(huì)讓什么人失業(yè)?
無論如何,人們對(duì)于ChatGPT最大的疑問與爭(zhēng)議依舊在于,它能否真的實(shí)現(xiàn)或代替人類的思考。
圖4 | 圖源CSDN
在過去,當(dāng)你把問題拋給搜索引擎或AI時(shí),它們往往只會(huì)通過生成模型尋找一個(gè)現(xiàn)有的答案或模板來回答你,因此常常答非所問。
ChatGPT則采用“生成模型+獎(jiǎng)勵(lì)模型”的結(jié)構(gòu)。ChatGPT在回答后會(huì)將問答結(jié)果反饋給獎(jiǎng)勵(lì)模型。
換言之,ChatGPT具備一個(gè)內(nèi)在的評(píng)分(獎(jiǎng)懲)機(jī)制,假如ChatGPT面對(duì)同一個(gè)問題可以給出ABC三個(gè)回答,那么獎(jiǎng)勵(lì)模型會(huì)根據(jù)邏輯是否自洽等因素分別給三個(gè)回答分別打分,并以分?jǐn)?shù)高低為獎(jiǎng)懲的依據(jù)來優(yōu)化自身的回答方式。
“生成模型+獎(jiǎng)勵(lì)模型”組成了ChatGPT的自回歸特性。
即ChatGPT可以自行完成問答、獎(jiǎng)懲、迭代的循環(huán)。于是ChatGPT就可以在漢字或字母中匹配到最高得分的組合,隨后組合成句子或段落提交給用戶。
圖5 | 圖源openai官網(wǎng)
盡管“生成模型+獎(jiǎng)勵(lì)模型”的結(jié)構(gòu)已經(jīng)優(yōu)于目前大部分AI,但這并不意味著ChatGPT在生成回答的過程中真正理解問答的含義,ChatGPT始終只是在尋找模型計(jì)算出的最優(yōu)解,只不過在路徑選擇和反饋接收上做得更好。
ChatGPT的自動(dòng)獎(jiǎng)懲機(jī)制減少了人工修正量,于是它能越學(xué)越快,并在同其他AI的激烈競(jìng)爭(zhēng)中勝出。
3
再?gòu)?qiáng)的人工智能也離不開“人工”
三年前谷歌的MT5擁有130億參數(shù)。
彼時(shí)ChatGPT的前輩——GPT-3模型已經(jīng)擁有了1750億參數(shù)。
如今ChatGPT橫空出世,參數(shù)相比GPT-3并無改變,卻已經(jīng)達(dá)到了性能爆炸的奇點(diǎn)。
由此可見,參數(shù)的堆積未必是AI進(jìn)步的關(guān)鍵,優(yōu)化模型和計(jì)算方式或許才是提升AI技術(shù)的關(guān)鍵。
然而再?gòu)?qiáng)力的AI也離不開人工的支撐,AI世界的基礎(chǔ)依然是現(xiàn)實(shí)世界。
圖6 | 圖源鳳凰網(wǎng)科技
即使強(qiáng)如ChatGPT,其語料庫依然停滯在2021年第四季度,它對(duì)世界的認(rèn)知凍結(jié)于2021年,對(duì)它詢問當(dāng)下任何新鮮事,恐怕都無法得到有效的回答。
此外,ChatGPT的回答并不穩(wěn)定,ChatGPT會(huì)在多輪問答后開始“說胡話”。
這是因?yàn)殡S著對(duì)話的增加,模型計(jì)算的復(fù)雜度越會(huì)指數(shù)級(jí)提高,ChatGPT為了減少計(jì)算時(shí)間,需要裁切文本,于是就導(dǎo)致回答失真。
現(xiàn)階段ChatGPT在AI領(lǐng)域取得了重大成功不假,但是以ChatGPT為代表的AI技術(shù)依然離不開人工的引導(dǎo)。
本質(zhì)上,依然是人類在指引著AI的探索和問答。我們距離AI真正實(shí)現(xiàn)獨(dú)立思考,仍然有著一段距離。
END
作者:唐雨 中國(guó)傳媒大學(xué)
資料來源:維基百科、科技頭條
CSDN、中國(guó)新聞網(wǎng)
責(zé)編:咕嚕