版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

“超人”降生

醫(yī)用生物力學(xué)
原創(chuàng)
宣傳醫(yī)用生物力學(xué)的科普知識、學(xué)科發(fā)展、研究開發(fā)和臨床問題。
收藏

1. “超人”是誰?

最近,ChatGPT在地球村里爆發(fā)啦!沖擊波不小,很“炸”。一時(shí)間,ChatGPT成了各類網(wǎng)民追捧的明星。很多小伙伴、特別是像我之流的“科研民工”都在想著體驗(yàn)一下這個(gè)新鮮事物,看看他能不能替自己把科研論文和項(xiàng)目標(biāo)書給寫嘍。個(gè)中原因是ChatGPT太能干啦,簡直就像是一個(gè)“超人”!

ChatGPT是英文“Chat Generative Pre-trained Transformer”的簡稱,直接翻譯過來的意思是“聊天生成型預(yù)訓(xùn)練變換模型”。乍一看,不像是“人”。其實(shí),ChatGPT是由人工智能公司OpenAI基于谷歌開發(fā)和訓(xùn)練的變換語言模型,目的是使用人工智能算法中的深度學(xué)習(xí)方法,生成人類可以理解的自然語言,并以對話的方式與真人進(jìn)行交互。簡單而言,他就是一個(gè)“無事不通、無事不曉”的聊天機(jī)器人,就像我們說的“萬事通”。

所以,我把他叫做“超人”。如果從其英文名ChatGPT的音譯來近似稱呼的話,不妨叫他“猜不透”——意思嘛,就是猜不透他有多能耐。

2. 他到底有多能耐?

“猜不透”是一種基于人工智能的聊天機(jī)器人,可以像跟人聊天一樣跟你聊天。他可以隨時(shí)解答你日常生活、工作和學(xué)習(xí)中的大部分問題。他不僅可以靈活自如地應(yīng)對各種主題,而且還擁有超高的情商和智商。“猜不透”在語言智商測試中的測試智商為147,而一般正常人的智商測評分?jǐn)?shù)在90~110分之間,140以上是屬于非常優(yōu)秀的水平。

這里所說的人工智能嘛,就是一種讓機(jī)器可以模擬人類智慧的技術(shù)?!安虏煌浮钡墓ぷ髟硎腔谏疃葘W(xué)習(xí)算法和大規(guī)模數(shù)據(jù)訓(xùn)練的。也就是說,他在訓(xùn)練過程中吸取了大量的語言數(shù)據(jù),并通過內(nèi)部的算法來預(yù)測和生成文本。他是人工智能技術(shù)驅(qū)動的自然語言處理工具,能夠通過學(xué)習(xí)和理解人類的語言來進(jìn)行對話,真正像人類一樣來聊天交流。他既能完成包括寫代碼、修bug(代碼改錯(cuò))、翻譯文獻(xiàn)、寫小說、寫商業(yè)文案、創(chuàng)作菜譜、做作業(yè)、評價(jià)作業(yè)、寫論文(“科研民工”們是不是心動顏開了)等一系列常見文字輸出型任務(wù),而且在和用戶對話時(shí),能記住對話的上下文,反應(yīng)非常逼真。

當(dāng)你與“猜不透”進(jìn)行對話時(shí),他會根據(jù)你的輸入來生成回應(yīng)答案。這些回應(yīng)有時(shí)候可能會出乎你的意料,但它們都基于“猜不透”之前所接觸的數(shù)據(jù)和模式。只要你提供的信息符合“猜不透”之前所接觸過的內(nèi)容,他就會給你一個(gè)合理的回答??梢哉f,他能幫助我們解決各種問題。叫他“萬事通”,一點(diǎn)也不過分。

3. 他這么能耐,是怎么做到的?

“猜不透”通過吸收大量來自網(wǎng)絡(luò)的內(nèi)容,包括成千上萬的維基百科條目、社交媒體帖子和新聞文章,來學(xué)習(xí)句子、單詞和部分單詞之間的關(guān)系。他的“大腦”里的神經(jīng)網(wǎng)絡(luò)包含至少1750億個(gè)參數(shù),為有史以來參數(shù)最多的神經(jīng)網(wǎng)絡(luò)模型。正常人的腦細(xì)胞大約有140億~150億個(gè)。從我這個(gè)“識數(shù)的人”來看,以“猜不透”的1750億對人類的150億,“猜不透”真的比人類的大腦要厲害得多啦?。▽?shí)際上并不能這么簡單比較哦)

“猜不透”以模擬人類智慧的方式進(jìn)行學(xué)習(xí)、交流和創(chuàng)作。這些活動,可分為七個(gè)學(xué)習(xí)過程:認(rèn)識、記憶、試操、熟練、創(chuàng)造、檢驗(yàn)與保持。也就是說,初始階段是記憶他人的間接經(jīng)驗(yàn)、模仿他人的行為,然后就會嘗試積累自己的直接經(jīng)驗(yàn)(可能真實(shí)的情況是,更多的是教訓(xùn))、創(chuàng)造自己的知識,并不斷試錯(cuò)、修正、完善經(jīng)驗(yàn)知識,形成可以重復(fù)驗(yàn)證的知識。

創(chuàng)新的前提是學(xué)習(xí)。學(xué)習(xí)就需要有大量的知識供學(xué)習(xí),還需要有很好的記憶力和理解力來學(xué)習(xí);創(chuàng)新則需要豐富的聯(lián)想力和判斷力來完成。

不管是超人“猜不透”還是普通人,上述過程可以歸納為三個(gè)要素:知識、算法和算力。

“猜不透”之所以是“超人”,首先就是因?yàn)樗麑W(xué)到的知識遠(yuǎn)遠(yuǎn)超過了一個(gè)普通人;他的知識是全人類的知識總和,目前有著超過萬億單詞的人類語言數(shù)據(jù)集。并且,在和人類聊天過程中還在不斷地學(xué)習(xí)、積累新知識。因此,“猜不透”的知識儲備和學(xué)習(xí)能力是驚人的。其次,他利用了各種人工智能算法,這些算法保證了他在處理問題的時(shí)候一般不會出錯(cuò),也就是說他的思考和處理知識的邏輯性會大大超過普通人。再次,他的算力夠強(qiáng),這里的算力指的是他處理問題的速度,這個(gè)就受到計(jì)算機(jī)硬件設(shè)備性能的限制了。在算力方面,目前“猜不透”總算力消耗約3640 PF-days(即每秒一千萬億次計(jì)算,運(yùn)行3640個(gè)整日),訓(xùn)練成本預(yù)計(jì)在500萬美元/次。這僅僅指的是“猜不透”在訓(xùn)練階段消耗的算力。就目前的服務(wù)器處理能力來看,大概是幾十到幾百臺GPU級別的服務(wù)器的體量才能夠?qū)崿F(xiàn),而且需要幾日甚至幾十日的訓(xùn)練。需要7~8個(gè)投資規(guī)模30億、算力500P的數(shù)據(jù)中心才能支撐運(yùn)行。這里的P是指礦機(jī)算力的單位,是1PH/s的簡寫;1P約等于每秒1000萬億次的計(jì)算速度。而且,聊天嘛,不能我說一句話,等你半天才回應(yīng);運(yùn)算速度和網(wǎng)絡(luò)傳輸速度都必須足夠快才行??梢姡安虏煌浮钡乃懔κ欠浅s@人的。遺憾的是,即使對于人類目前擁有的少數(shù)“超強(qiáng)大腦”來說,“絞盡腦汁”也無法與“猜不透”的算力相媲美。

更可怕的是:“不怕學(xué)霸學(xué)習(xí)好,就怕學(xué)霸好學(xué)習(xí)”(請參看我的微信公眾號“醫(yī)用生物力學(xué)”里的相關(guān)文章)?!安虏煌浮币恢痹诓煌5貙W(xué)習(xí)和升級。早在2017年,人工智能研究公司OpenAI就發(fā)布了GPT-1,是一個(gè)能夠生成人類文本的語言處理模型,其在預(yù)測下一個(gè)單詞的任務(wù)中表現(xiàn)出色。2019年,OpenAI發(fā)布了GPT-2模型,其可生成高質(zhì)量的自然語言文本,但因擔(dān)心濫用而未公開全部模型參數(shù)。2020年,OpenAI發(fā)布了GPT-3模型,是當(dāng)時(shí)最大的自然語言處理模型,擁有1.75萬億個(gè)參數(shù),能夠執(zhí)行各種語言任務(wù),如對話、翻譯、摘要等。2022年12月,一個(gè)名為“ChatGPT”的GPT-3.5誕生,他就像一條“鯰魚”攪動了整個(gè)市場。在5天之內(nèi)吸引了100萬用戶;然后在2個(gè)月內(nèi)吸引了1億用戶。從上線開始算,到達(dá)1億用戶,TikTok花了大約9個(gè)月,Instagram花了大約兩年半,而ChatGPT只用了60天。2023年3月14日,OpenAI公布了最新版本——GPT-4。GPT-4產(chǎn)生正確回應(yīng)的可能性要比GPT-3.5高出40%,新模型將產(chǎn)生更少的錯(cuò)誤答案,更少地偏離談話軌道,更少地談?wù)摻稍掝}。長江后浪推前浪,ChatGPT的新版本不斷把舊版本拍到沙灘上。

盡管如此,“猜不透”從出生到成長到現(xiàn)在,畢竟還是個(gè)新事物,也就相當(dāng)于人類的嬰幼兒階段,還沒有準(zhǔn)備好做任何重要的事情!不過,他一直在不斷進(jìn)化之中。短期內(nèi)“猜不透”的發(fā)展方向可能成為每一個(gè)人的工作、學(xué)習(xí)以及生活的助理,反過來又進(jìn)一步充實(shí)他自身的知識和算法,讓他變得越來越智能、越來越聰明。無法想象,不久的將來,“猜不透”這個(gè)“超人”會聰明絕頂而“膨脹”到什么程度?!

4. 面對“超人”,我們能做什么?

如果你把“猜不透”僅僅看成一個(gè)用來聊天解悶的網(wǎng)友,那就白白浪費(fèi)了這個(gè)“超人”的超人能耐啦!

“猜不透”不僅給人工智能領(lǐng)域注入了一針強(qiáng)心劑,而且也給我這樣的“科研民工”打上了一針興奮劑。

我就在想啊……

敲黑板,劃重點(diǎn)!

目前的科研創(chuàng)新模式,大致是靠個(gè)人或者團(tuán)隊(duì)的比拼而艱苦奮斗來實(shí)現(xiàn)的。這其中,人們學(xué)習(xí)知識的過程必然花費(fèi)很長的時(shí)間,僅僅是掌握必要的專業(yè)知識就疲于應(yīng)付了,更別說精通多學(xué)科的復(fù)雜知識了。這就大大限制了科技進(jìn)步的快速發(fā)展。特別是在面臨“百年未有之大變局”的時(shí)候,“我兔”需要解決很多“卡脖子”的重要科學(xué)技術(shù)問題,小眾的力量總是顯得力不從心、難以應(yīng)付。

從認(rèn)識“猜不透”那一刻起,我想到了一個(gè)針對上述問題的解決方案?!安虏煌浮笔莻€(gè)匯集全人類智慧的一個(gè)“超人”,能不能把“猜不透”拿來做科研呢?咱就是說,“我兔”自己孕育一個(gè)親生的“超人”,專門解決科學(xué)研究的“卡脖子”問題。我們這些“科研民工”每天苦哈哈地“挖礦”搞創(chuàng)新,還難有什么成果,不如把各自積累的一點(diǎn)點(diǎn)經(jīng)驗(yàn)知識(也就是數(shù)據(jù))都交給“超人”,讓他替我們記憶、學(xué)習(xí)、分析、創(chuàng)新。反過來,“超人”可以為每個(gè)“科研民工”提供想要的資源和解決方案。要知道,科研的初級階段就是枯燥的、大量的學(xué)習(xí)知識和積累數(shù)據(jù),然后才是創(chuàng)新聯(lián)想和邏輯推理;而人工智能的大部分工作是構(gòu)建數(shù)據(jù)庫,然后才是利用算法進(jìn)行數(shù)據(jù)處理和分析、得出決策結(jié)果。人機(jī)結(jié)合起來,往往能優(yōu)勢互補(bǔ),發(fā)揮各自更大的潛力,從此開啟科研創(chuàng)新的新模式。

這個(gè)“新生兒”的養(yǎng)育,需要每個(gè)人的奉獻(xiàn)和努力,更需要國家層面的組織和管理,涉及到政策和技術(shù)層面的頂層設(shè)計(jì)。畢竟,這樣一個(gè)“超人”會動了絕大多數(shù)人的奶酪。親,你能接受嗎?我想聽到:YES, I DO!

穿過人海,別停下來,趁現(xiàn)在還有期待……

評論
醫(yī)用生物力學(xué)
秀才級
超人需要大家一起來“養(yǎng)”。
2024-06-25
醫(yī)用生物力學(xué)
秀才級
看懂了?
2024-06-25