AI繪畫(huà)最近火了,它的水平不亞于厲害的畫(huà)師。而最近,AI開(kāi)始學(xué)會(huì)寫(xiě)文章了,陪你聊天、學(xué)習(xí),當(dāng)你的生活和工作的“百科全書(shū)”,它就是ChatGPT。
今天我們就來(lái)一起認(rèn)識(shí)一下,仿佛擁有自己的邏輯思維能力的ChatGPT,是怎樣做到對(duì)答自如,寫(xiě)出優(yōu)秀的文章的。ChatGPT是一款由美國(guó)人工智能研究公司OpenAI公司打造的聊天軟件,目前還在測(cè)試階段,向大眾免費(fèi)開(kāi)放,鋼鐵俠馬斯克也是OpenAI的投資人之一。ChatGPT是一種自然語(yǔ)言處理技術(shù),它可以進(jìn)行自然語(yǔ)言理解和生成,能夠和我們?nèi)祟?lèi)進(jìn)行有意義的對(duì)話(huà)。它的出現(xiàn),意味著我們可以使用自然語(yǔ)言交互來(lái)做更多的事情,比如ChatGPT可以幫助我們完成復(fù)雜的任務(wù)、進(jìn)行自然語(yǔ)言處理、以及讓計(jì)算機(jī)與人類(lèi)更好地溝通。
什么意思呢?就是說(shuō)這種技術(shù)可以為我們答疑解惑,而且這個(gè)答案并非是預(yù)定輸入的,是它根據(jù)已有的知識(shí)和邏輯思維“想”出來(lái)的,就像一個(gè)會(huì)思考動(dòng)腦子的人一樣。更進(jìn)一步來(lái)說(shuō),你可以讓ChatGPT為你出主意、整理某個(gè)人的生平資料,介紹他甚至把他寫(xiě)成一篇文章。
如此智慧的一款軟件,它是怎么被打造出來(lái)的?簡(jiǎn)單地說(shuō),它是被訓(xùn)練出來(lái)的。
首先呢,開(kāi)發(fā)團(tuán)隊(duì)使用了一種叫做“人類(lèi)反饋強(qiáng)化學(xué)習(xí)”(RLHF)的機(jī)器學(xué)習(xí)技術(shù)對(duì)ChatGPT進(jìn)行了訓(xùn)練。什么叫做訓(xùn)練?我們簡(jiǎn)單來(lái)了解一下AI領(lǐng)域中,一款軟件是怎么被訓(xùn)練出來(lái)的。我給大家舉一個(gè)經(jīng)典的例子:要讓AI分析出一張圖片上是人還是動(dòng)物,AI會(huì)將圖片上的每一個(gè)像素點(diǎn)作為輸入的一個(gè)信息,這些信息在經(jīng)過(guò)AI的迭代計(jì)算后形成一個(gè)算法,最后輸出一個(gè)“是人”或者“是動(dòng)物”的結(jié)果。在識(shí)別了大量人或動(dòng)物的圖片后,AI就經(jīng)過(guò)了“訓(xùn)練”,就能從中學(xué)習(xí)到人和動(dòng)物的關(guān)鍵信息,從而對(duì)新照片是人還是動(dòng)物做出判斷?;谶@種方法,OpenAI的開(kāi)發(fā)團(tuán)隊(duì)訓(xùn)練出了ChatGPT的初始模型。
接下來(lái)就是優(yōu)化了。他們讓AI訓(xùn)練人員模擬用戶(hù)端,與人工智能進(jìn)行對(duì)話(huà),在不斷的對(duì)話(huà)過(guò)程中對(duì)ChatGPT的代碼進(jìn)行調(diào)試和優(yōu)化。
這個(gè)時(shí)候,研究人員開(kāi)始思考一個(gè)問(wèn)題——怎么讓它學(xué)得更快、更加接近我們所尋求的結(jié)果?他們想到了一個(gè)好辦法,把ChatGPT當(dāng)做一個(gè)正在學(xué)習(xí)的小孩,告訴他“考試考得好,我就給你糖吃?!痹贏(yíng)I領(lǐng)域,這種辦法有個(gè)專(zhuān)業(yè)名稱(chēng),叫做強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)模型(reward modeling)。獎(jiǎng)勵(lì)模型雖然不是真的給AI吃的糖,而是一個(gè)編程函數(shù),但是它能讓AI的算法“明白”什么情況下的回答才是更好的。通過(guò)這種策略,讓ChatGPT越來(lái)越優(yōu)秀和智能。
經(jīng)過(guò)層層打造的ChatGPT現(xiàn)在能用來(lái)干嘛呢?
咱們來(lái)簡(jiǎn)單舉個(gè)例子,如果我問(wèn)ChatGPT,你能為我寫(xiě)一篇介紹ChatGPT的科普文章嗎? 它就會(huì)根據(jù)我不同的要求,進(jìn)行不同的“思考”,從而給出不同的答案。無(wú)論是什么領(lǐng)域的問(wèn)題,ChatGPT都能給出一番見(jiàn)解。比如,我們對(duì)生物醫(yī)藥領(lǐng)域和電力系統(tǒng)控制領(lǐng)域兩個(gè)方面都提個(gè)問(wèn)題,它也能很好地回答,甚至還能幫程序員找出代碼中的BUG。
怎么樣,是不是非常地神奇?實(shí)際上它會(huì)的比你想象的更多。
最近,在德國(guó)一家咨詢(xún)公司的托拜厄斯·茨溫(Tobias Zwingmann)經(jīng)常用ChatGPT生成講義,讓它解釋一種被稱(chēng)為DBSCAN的機(jī)器學(xué)習(xí)技術(shù)的機(jī)制和工作原理,因?yàn)榇臏亍皯械冒阉繉?xiě)下來(lái)?!睙o(wú)獨(dú)有偶,Ironclad公司的首席技術(shù)官Cai GoGwilt表示,他的公司正在探索如何使用ChatGPT來(lái)總結(jié)法律條文的變化。GoGwilt認(rèn)為“這個(gè)功能對(duì)我們的客戶(hù)很有幫助”??梢?jiàn),ChatGPT并不只是一款簡(jiǎn)單的智能聊天軟件,它還能用來(lái)做更高級(jí)的事——解釋技術(shù)原理、總結(jié)法律條文的變化等。當(dāng)然啦,目前ChatGPT還在測(cè)試階段,而發(fā)團(tuán)隊(duì)也指出了它現(xiàn)在還有一定的局限性。
第一,ChatGPT有時(shí)候會(huì)給出似是而非的答案,不一定是我們想要的答案,這一點(diǎn)解決起來(lái)還是比較有挑戰(zhàn)性的。
第二,有的時(shí)候,我們用某種措辭向GhatGPT提問(wèn)時(shí),它可能會(huì)說(shuō)自己不知道答案是什么,但是如果你稍微換一下描述的方法,它就可以正確地回答出來(lái)。這一點(diǎn)上GhatGPT還有點(diǎn)“不夠聰明”。
第三,理想情況下,當(dāng)我們提出的問(wèn)題不夠明確時(shí),AI應(yīng)該會(huì)向我們?cè)俅未_認(rèn)問(wèn)題是什么,避免產(chǎn)生歧義,但是ChatGPT做不到,它通常會(huì)自己去猜測(cè)用戶(hù)的意圖,然后給出答案。
但優(yōu)秀的技術(shù)和產(chǎn)品往往需要時(shí)間去驗(yàn)證。相信經(jīng)過(guò)時(shí)間的淬煉和科學(xué)家的努力,ChatGPT會(huì)越來(lái)越好,我們也期待它的上市能給人們的生活帶來(lái)新的精彩。
本文為科普中國(guó)·星空計(jì)劃扶持作品
團(tuán)隊(duì)名稱(chēng):深究科學(xué)
審核:李永華
出品:中國(guó)科協(xié)科普部
監(jiān)制:中國(guó)科學(xué)技術(shù)出版社有限公司、北京中科星河文化傳媒有限公司