版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

新發(fā)布GPT-4表現(xiàn)“可與人類相媲美”,律師資格模擬考試分?jǐn)?shù)超過90%考生

北京科協(xié)

OpenAI公司發(fā)布GPT-4。圖片來源:英國《新科學(xué)家》雜志網(wǎng)站

科技日報記者 劉霞

據(jù)英國《新科學(xué)家》雜志網(wǎng)站報道,當(dāng)?shù)貢r間14日,在震驚科技行業(yè)的人工智能(AI)聊天機(jī)器人ChatGPT發(fā)布約4個月后,ChatGPT背后的開放人工智能公司(OpenAI)宣布正式發(fā)布為ChatGPT提供支持的更強(qiáng)大的下一代技術(shù)GPT-4,其擁有圖像識別功能,高級推理技能,以及處理25000個單詞的能力,在某些測試中的表現(xiàn)“可與人類相媲美”。

OpenAI公司表示,它“花了6個月的時間使GPT-4更安全、更穩(wěn)定”,這樣AI就不太可能在回復(fù)人類用戶提問時給出“不被允許的內(nèi)容”。OpenAI公司發(fā)布的一篇博客文章和技術(shù)報告宣稱,GPT-4在某些方面的性能“可與人類相媲美”,并在大學(xué)入學(xué)和法律及醫(yī)學(xué)等專業(yè)領(lǐng)域的許多模擬考試中優(yōu)于其前身GPT-3.5。例如,GPT-4通過了律師資格模擬考試,分?jǐn)?shù)超過90%的人類考生,而GPT-3.5此前的分?jǐn)?shù)則低于90%的人類考生。

目前OpenAI公司僅公布了有關(guān)GPT-4的架構(gòu)、硬件、訓(xùn)練所需算力及用于訓(xùn)練它的數(shù)據(jù)方面的最少細(xì)節(jié)。OpenAI表示,此舉“出于競爭和安全方面的考量”,但缺少更多信息也使科學(xué)家們核查GPT-4性能的準(zhǔn)確性和安全性變得更困難。

自去年11月推出以來,ChatGPT已能根據(jù)用戶的提示生成文章、故事和詩歌,但其也因情緒反應(yīng)過激、犯事實錯誤等受到指責(zé)并引發(fā)人們的擔(dān)憂情緒。OpenAI公司也警告稱,GPT-4仍然會“幻想事實并犯推理錯誤”,這意味著“人們在使用語言模型輸出的信息時應(yīng)該非常小心,在高風(fēng)險環(huán)境中更應(yīng)如此”。

微軟是OpenAI的主要支持者,向其投資了數(shù)十億美元。微軟透露,其必應(yīng)搜索引擎聊天機(jī)器人此前已經(jīng)在GPT-4上運行了5周。OpenAI的公告還強(qiáng)調(diào)稱,語言學(xué)習(xí)應(yīng)用Duolingo、支付服務(wù)Stripe、在線學(xué)習(xí)服務(wù)Khan Academy和金融服務(wù)公司摩根士丹利等也已在使用GPT-4。

評論
柳恩和-基層農(nóng)業(yè)
少傅級
微軟是OpenAI的主要支持者。
2023-03-17
北風(fēng)那個吹雪花那個飄
庶吉士級
2023-03-17
逢瑞
庶吉士級
人的確都有學(xué)習(xí)的天賦,不喜歡的事情并不代表不能通過實踐的打磨變得爐火純青,很多人最終擁有了不錯的表演技巧,但我擔(dān)心的是,當(dāng)他們后來回首往事時,忽然發(fā)現(xiàn)自己選擇了一條錯誤的道路。
2023-03-17