版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

演講實錄丨百度首席技術(shù)官王海峰:機器翻譯——從夢想到現(xiàn)實

中國人工智能學(xué)會
我國智能科學(xué)技術(shù)領(lǐng)域唯一的國家級學(xué)會
收藏

2021年6月5日至6日,由中國科學(xué)技術(shù)協(xié)會、中國科學(xué)院、中國工程院、浙江省人民政府指導(dǎo),中國人工智能學(xué)會、杭州市人民政府主辦,杭州市余杭區(qū)人民政府籌備組承辦,浙江杭州未來科技城管理委員會具體執(zhí)行的2021全球人工智能技術(shù)大會在杭州成功舉辦。在6月6日舉辦的多語種智能信息處理專題論壇上,百度首席技術(shù)官、CAAI/ACL Fellow王海峰博士為我們帶來了題為《機器翻譯:從夢想到現(xiàn)實》的精彩演講。

王海峰

百度首席技術(shù)官

CAAI/ACL Fellow

以下是王海峰博士的演講實錄:

機器翻譯邁入深度學(xué)習(xí)時代

機器翻譯的發(fā)展歷程可以追溯到1947年機器翻譯設(shè)想的提出。在70多年的時間里,機器翻譯經(jīng)歷了基于規(guī)則的方法、統(tǒng)計機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)機器翻譯三個階段,進入深度學(xué)習(xí)時代。

神經(jīng)網(wǎng)絡(luò)機器翻譯的大規(guī)模產(chǎn)業(yè)應(yīng)用面臨高質(zhì)量、多語言、跨模態(tài)的產(chǎn)業(yè)化需求。在翻譯質(zhì)量方面,百度研發(fā)了融合豐富特征的神經(jīng)網(wǎng)絡(luò)機器翻譯模型,漏譯率降低80%;多智能體聯(lián)合學(xué)習(xí)模型,突破單一模型學(xué)習(xí)能力不足的限制;在國際權(quán)威機器翻譯評測中獲得第一名,翻譯質(zhì)量大幅提升。2015年5月,百度在全球率先上線大規(guī)模神經(jīng)網(wǎng)絡(luò)機器翻譯產(chǎn)品。

在多語言翻譯方面,針對語言數(shù)量多、語料分布不均衡、部署復(fù)雜、實現(xiàn)難度大等難題,百度研發(fā)了基于共享編碼器的翻譯模型,突破了低資源語言的翻譯瓶頸,研制了多語言翻譯統(tǒng)一框架,大幅提升部署效率,實現(xiàn)203種語言互譯,支持41006個翻譯方向。

機器同傳方面,針對同傳翻譯質(zhì)量與時延難以兼顧的痛點,百度打造了基于語義單元的同傳模型,翻譯準(zhǔn)確率超過80%,時間延遲約為3秒,翻譯水平媲美人類譯員。同時,在端到端同傳模型方面,突破了語音識別和機器翻譯交互同步解碼,實現(xiàn)跨模態(tài)知識共享。百度在機器翻譯技術(shù)上持續(xù)創(chuàng)新突破的同時,也積極開放合作,聯(lián)合Google、清華大學(xué)等舉辦機器同傳研討會、發(fā)布面向真實演講場景的中英同傳數(shù)據(jù)集,促進同傳研究。

每天翻譯超千億字符,跨語言溝通正在成為現(xiàn)實

機器翻譯是百度很早就開始積累和打造的AI技術(shù)之一。2010年以來,百度在大規(guī)模產(chǎn)業(yè)化機器翻譯技術(shù)、海量翻譯知識獲取、多語言翻譯、機器同聲傳譯等方面均進行了系統(tǒng)而深入的研究,技術(shù)上不斷突破創(chuàng)新,產(chǎn)業(yè)應(yīng)用不斷豐富。百度翻譯已形成包括翻譯PC 版、翻譯APP、AI 同傳,以及翻譯開放平臺等完整的產(chǎn)品矩陣,實時準(zhǔn)確地響應(yīng)全球海量復(fù)雜多樣的翻譯請求,每天翻譯超過千億字符,較十年前增長了10萬倍。

截止目前,百度翻譯已服務(wù)50多萬家企事業(yè)單位和開發(fā)者,覆蓋30多個領(lǐng)域,持續(xù)在人們生活工作、公共服務(wù)、科研學(xué)習(xí)等方面發(fā)揮作用:服務(wù)服貿(mào)會、進博會、全球人工智能技術(shù)大會等上百場重要國際會議;服務(wù)經(jīng)濟發(fā)展、助力跨國貿(mào)易平臺/企業(yè)降本增效;免費開放生物醫(yī)藥領(lǐng)域翻譯,與防疫志愿者小組等合作,助力全球抗疫等等。

資料顯示, 全球權(quán)威咨詢機構(gòu)Gartner 發(fā)布“Hype Cycle for Natural Language Technologies,2020”,將百度評為神經(jīng)網(wǎng)絡(luò)機器翻譯標(biāo)桿機構(gòu)。百度是國內(nèi)機器翻譯領(lǐng)域唯一入圍單位。2020 年12月,Gartner 在報告“Market Guide for AI-Enabled Translation Services”中提到,百度憑借在機器翻譯方面出色的表現(xiàn)強勢入圍全球AI翻譯服務(wù)代表性提供商。

百度將始終堅持技術(shù)創(chuàng)新,推動技術(shù)進步,為產(chǎn)業(yè)升級、社會經(jīng)濟高質(zhì)量發(fā)展、國家繁榮昌盛做出更大貢獻。

評論
信吉剛
進士級
2024-05-06
科普642581d1b0844
貢士級
2023-05-01