5G技術(shù)的低延遲、高帶寬特性為通信領(lǐng)域帶來了革命性的變化。在這一背景下,5G新通話應(yīng)運(yùn)而生。5G新通話系統(tǒng)集成了人工智能、大數(shù)據(jù)等前沿技術(shù),正推動通信方式向多媒體、智能化方向演進(jìn)。5G新通話單向視頻通話技術(shù)是5G新通話技術(shù)的一項重要創(chuàng)新研究成果,成功孵化出多個5G新通話業(yè)務(wù)。與傳統(tǒng)視頻通話相比,單向視頻通話技術(shù)展現(xiàn)了其獨(dú)特的優(yōu)勢和先進(jìn)性,極大地提升了用戶的通信體驗(yàn),用戶無需撥打視頻通話,也能看到圖像、字幕等通話輔助信息,為傳統(tǒng)的語音通話增添了豐富的視覺元素,開拓了全新通話應(yīng)用場景。
1、什么是單向視頻通話技術(shù)
5G新通話單向視頻通話技術(shù)是一種基于5G新通話先進(jìn)網(wǎng)絡(luò)架構(gòu)和智能算法實(shí)現(xiàn)智能定制化視頻內(nèi)容單向傳輸?shù)耐ㄐ偶夹g(shù)。5G新通話單向視頻通話在傳統(tǒng)音頻通話基礎(chǔ)上無縫集成視頻元素,豐富信息展現(xiàn)形態(tài),支持用戶在撥打音頻通話的同時,查看由網(wǎng)絡(luò)推送的視頻內(nèi)容,同時不暴露傳統(tǒng)視頻通話中的本地視頻信息,有效解決了傳統(tǒng)音頻通話方式中通話形式單一視頻通話必須展示用戶當(dāng)前形象的問題,擴(kuò)展了通話應(yīng)用場景,保護(hù)了用戶隱私。
例如,用戶在撥打客服電話時,需要通過視頻信息輔助理解客服人員講解,同時通過單向視頻通話技術(shù)用戶無需暴露本地人物形象;再比如,弱聽用戶或跨語言溝通場景中,可以通過單向視頻通話技術(shù),向用戶推送含有語音轉(zhuǎn)文字或翻譯后的通話字幕,解決用戶溝通困難的問題。
5G新通話單向視頻通話技術(shù)它不僅繼承了5G網(wǎng)絡(luò)低延遲、高帶寬的特點(diǎn),支持調(diào)用5G新通話云端智能音、視頻AI處理能力,更通過創(chuàng)新的設(shè)計,解決了傳統(tǒng)視頻通話中的一些局限性問題,具有如下技術(shù)優(yōu)勢:
①保護(hù)用戶隱私性:單向視頻通話技術(shù)允許用戶在不暴露自己環(huán)境的情況下,接收到對方或系統(tǒng)發(fā)送的視頻內(nèi)容。這一點(diǎn)對于保護(hù)用戶隱私至關(guān)重要,尤其是在不希望或不適宜展示用戶本身形象的場景(如客服場景)。
②展現(xiàn)信息更豐富:該技術(shù)能夠在通話中加入豐富的視覺元素,如頁面、字幕、圖像、視頻等,極大地增強(qiáng)了原有語音通話過程中的信息傳遞能力,使得溝通更為直觀和生動。
③業(yè)務(wù)更加智能化:結(jié)合人工智能技術(shù),基于單向視頻通話能力,服務(wù)方能夠根據(jù)通話內(nèi)容進(jìn)行實(shí)時分析,向用戶提供智能翻譯、字幕生成等服務(wù),進(jìn)一步提升通話的可用性和高效性。
④用戶無需更換終端:單向視頻協(xié)商對終端無特殊要求,存量終端用戶也可直接使用業(yè)務(wù),用戶使用門檻低。
⑤網(wǎng)絡(luò)傳輸高效性:由于只傳輸單向視頻流,該技術(shù)在網(wǎng)絡(luò)資源的使用上更為高效,尤其在網(wǎng)絡(luò)條件受限的環(huán)境中,依然能夠保證通話的流暢性和視頻的質(zhì)量。
2、單向視頻通話技術(shù)原理
單向視頻通話基于5G新通話網(wǎng)絡(luò)架構(gòu)實(shí)現(xiàn)。5G新通話網(wǎng)絡(luò)架構(gòu)如圖1所示,主要包括VoLTE AS、VoNR+能力網(wǎng)元、VoNR+媒體面、媒體能力平臺、業(yè)務(wù)應(yīng)用服務(wù)器等關(guān)鍵組件。
圖1 5G新通話網(wǎng)絡(luò)架構(gòu)
VoNR+能力網(wǎng)元:作為 5G 話音的新生態(tài)引擎,通過對基礎(chǔ)音視頻和實(shí)時交互能力進(jìn)行提煉抽象,接收業(yè)務(wù)應(yīng)用服務(wù)器的呼叫控制指令,指示VoLTE AS進(jìn)行單向視頻相關(guān)能力的協(xié)商與控制,北向通過Restful API 接口開放給使能層
VoLTE AS:作為網(wǎng)絡(luò)基礎(chǔ)通信能力網(wǎng)元,可提供傳統(tǒng)音視頻呼叫路由、呼叫控制、媒體控制及協(xié)議適配等能力。通過 Restful接口向能力層提供原子API。
VoNR+媒體面:作為系統(tǒng)統(tǒng)一媒體管理網(wǎng)元,負(fù)責(zé)除支持傳統(tǒng)音視頻播放、放音、會議等媒體能力之外,對多種媒體進(jìn)行合成、渲染。
媒體能力平臺:作為媒體AI處理引擎,負(fù)責(zé)提供語音識別、自然語言處理、圖像識別等音、視頻媒體AI處理等服務(wù)。支持根據(jù)業(yè)務(wù)提供方實(shí)現(xiàn)能力的快速調(diào)用。
業(yè)務(wù)應(yīng)用服務(wù)器:業(yè)務(wù)服務(wù)器,開發(fā)者可基于5G新通話開放能力實(shí)現(xiàn)業(yè)務(wù)的開發(fā),以服務(wù)器方式部署到新通話網(wǎng)絡(luò)中后,為用戶提供新通話服務(wù)。
5G新通話單向視頻通話技術(shù)關(guān)鍵要素包括:
①單向視頻媒體協(xié)商:單向視頻技術(shù)首先依賴于穩(wěn)定的音頻通話基礎(chǔ),即利用VoLTE/VoNR技術(shù)建立高質(zhì)量的雙向音頻連接。這是確保通話雙方能夠清晰交流的基礎(chǔ)。為了能實(shí)現(xiàn)用戶僅接受視頻,不上傳本地視頻的效果,系統(tǒng)根據(jù)業(yè)務(wù)觸發(fā),向終端發(fā)起單向視頻媒體重協(xié)商,攜帶sendonly媒體屬性,指示終端進(jìn)行單向視頻通道的建立。
②分段式精準(zhǔn)視頻推送控制:根據(jù)業(yè)務(wù)需求的不同,可能存在向主叫用戶推送單向視頻的場景,也可能存在向被叫用戶或向主被叫用戶推送單向視頻的場景;該需求可能由主叫網(wǎng)絡(luò)(主叫用戶需求)觸發(fā),也可能由被叫網(wǎng)絡(luò)(被叫用戶需求)觸發(fā);此外,向用戶推送視頻的時間及觸發(fā)條件也存在多種不同場景,用戶可能在通話中中間的某個時間需要(如客服場景下需要介紹某個產(chǎn)品時),也可能在通話一接通時就需要(如點(diǎn)亮屏幕業(yè)務(wù)場景);單向視頻推送觸發(fā)可能是根據(jù)用戶設(shè)置提前配置好的,也可能是根據(jù)用戶需求在通話中實(shí)時觸發(fā)的。面向復(fù)雜的業(yè)務(wù)場景,分段式精準(zhǔn)視頻推送控制機(jī)制可以完美解決不同需求場景下的業(yè)務(wù)控制。
③實(shí)時音視頻AI媒體處理:為了支撐更豐富的單向視頻場景,系統(tǒng)支持根據(jù)業(yè)務(wù)平臺控制,將通話中的音、視頻流復(fù)制到網(wǎng)絡(luò)側(cè)的媒體能力平臺,通過智能分析處理,生成用戶所需信息,通過單向視頻向用戶展示。例如在語音通話場景,針對跨語言或弱聽用戶交流場景,系統(tǒng)可以對用戶音頻通話內(nèi)容進(jìn)行智能識別,并在單向視頻中向用戶展示說話內(nèi)容對應(yīng)的字幕,方便用戶理解,提升用戶溝通效率。
3、單向視頻通話應(yīng)用場景
智能客服:基于單向視頻通話的智能客服通話中,用戶可以查看客服人員用戶用于輔助溝通所提供的產(chǎn)品介紹、用戶訂單/賬戶信息等內(nèi)容,但無需向客服人員展示自己當(dāng)前的通話形象,提升了溝通效率的同時,可以很好的保護(hù)用戶通話隱私。
點(diǎn)亮屏幕:點(diǎn)亮屏幕業(yè)務(wù)允許用戶在通話過程中向?qū)Ψ秸故咀约侯A(yù)設(shè)的視頻內(nèi)容,適用于音頻起呼且簽約用戶作為被叫的通話場景。用戶可以選擇系統(tǒng)提供的多種視頻內(nèi)容或上傳圖片生成自定義視頻形象,可提升通話的趣味性。
智能翻譯與通話字幕:結(jié)合語音識別、實(shí)時翻譯和視頻合成技術(shù),智能翻譯服務(wù)在通話過程中為用戶提供語音轉(zhuǎn)寫和實(shí)時翻譯功能,以字幕形式展現(xiàn)對方說話的文字內(nèi)容,幫助弱聽人群和跨語種溝通人群解決溝通障礙。
AI速記:AI速記為用戶提供通話記錄及摘要提取服務(wù),用戶可在通話過程中,實(shí)時看到聊天內(nèi)容,同時掛機(jī)后,還能收到系統(tǒng)整理好的通話記錄文件,方便用戶后續(xù)隨時查看、整理。
視頻通話會議:支持用戶只查看共享視頻內(nèi)容(如會議討論材料),無需暴露用戶當(dāng)前參加會議形象及環(huán)境,有助于減小視頻會議中用戶形象維護(hù)上的心理壓力。
4、結(jié)語
基于5G新通話的單向視頻通話技術(shù),為通信領(lǐng)域帶來了全新業(yè)務(wù)創(chuàng)新場景。它通過低延遲、高帶寬的5G網(wǎng)絡(luò),結(jié)合人工智能,提高了用戶溝通效率、增強(qiáng)了信息展示的豐富性,同時還能保護(hù)用戶隱私。在智能客服、翻譯、會議等場景的應(yīng)用,突顯了其在提升用戶體驗(yàn)和解決實(shí)際問題上的潛力。隨著技術(shù)的演進(jìn)與更多業(yè)務(wù)開發(fā)者的參與,單向視頻通話將在更多領(lǐng)域有更豐富的應(yīng)用,推動通信行業(yè)在智能通話升級上的創(chuàng)新。
作者:張昕、喬瑋、李穎
單位:中國移動研究院業(yè)務(wù)研究所