審核專家:鄭遠攀
鄭州輕工業(yè)大學教授
最近,很多人又開始重 溫經(jīng)典,回憶起那些陪伴著童年長大的經(jīng)典歌曲。除了還在開演唱會的幾位歌手外,“饑渴難耐”的歌迷們又整出來新花樣。
在B站,“AI孫燕姿”翻唱了眾多明星的經(jīng)典歌曲,其作品不僅累積上千萬的播放量,在科技圈和音樂圈也都引發(fā)了熱議。(因版權(quán)問題,可自行前往B站搜索收聽)
來源 | 嗶哩嗶哩網(wǎng)站截圖
“AI孫燕姿”當然不是華語歌壇明星孫燕姿本人,但她翻唱的歌曲卻讓絕大多數(shù)人都難辨真假,連淡出大眾視線許久的孫燕姿本人也在網(wǎng)絡發(fā)布文章作出相關(guān)回應,同時也對這次現(xiàn)象級的出圈和“翻紅”事件表達了自己的看法。
來源 | 孫燕姿回應截圖
1
“AI孫燕姿”是怎么翻唱歌曲的呢?
前面明顯的“AI”字樣已經(jīng)告訴我們,這音樂圈的科技與狠活靠的依然是近幾年繞不過的關(guān)鍵詞——人工智能(Artificial Intelligence,AI)。
“AI孫燕姿”翻唱的歌曲,主要是由多位創(chuàng)作者通過一個名叫“so-vits-svc”的開源項目自制后,再上傳到視頻網(wǎng)站嗶哩嗶哩。而在該網(wǎng)站,除了“AI孫燕姿”,還有“AI林俊杰”,“AI王菲”等翻唱的歌曲。
來源 | 嗶哩嗶哩網(wǎng)站截圖
目前,這個項目已經(jīng)迭代到了4.0 版本,相較于以往幾個版本的項目,so-vits-svc更加簡化,只需要幾段實驗目標音頻,就可以合成目標音色的音頻,并訓練出想要的聲學模型。
訓練出的模型不僅可以保留目標音頻的音高和音調(diào),還可以用不同語言來展現(xiàn)這個音頻,最終翻唱出不同國籍、不同歌手的各種歌曲。按照目前的技術(shù),雖然音色基本能 1:1 復制,但歌手的唱腔、技巧和風格依然很難完全模仿。
另外,網(wǎng)上關(guān)于AI 音頻制作的教學視頻也已隨處可見,簡單來說只需要 四 個步驟:①下載一鍵啟動包;②輸入合適的干聲(無音樂的純?nèi)寺暎?;③訓練聲學模型(訓練時間越長效果越好);④進入音頻編輯軟件進行合成和后期制作。
但實際操作起來卻并不容易,需要一些技術(shù)門檻和時間。比如干聲的提取和聲學模型的訓練都需要大量的數(shù)據(jù)采集和實驗,整個實施過程也需要一定的算法相關(guān)經(jīng)驗和成果支撐。
“AI 孫燕姿”創(chuàng)作者之一的Rcell表示,他和團隊花費半年左右時間,采集了孫燕姿約100首歌曲作為訓練數(shù)據(jù),通過上百組實驗,才最終得到了當前的模型。
同時,他們也嘗試了其他歌手的音色轉(zhuǎn)換,比如周杰倫、林俊杰、王菲等等,但是效果都不如孫燕姿的好。
來源 | 微博
另一位創(chuàng)作者子魚猜測,這可能與孫燕姿本身的聲音辨識度有關(guān)。孫燕姿吐字相對清晰,音色有一定的顆粒感,這樣的特質(zhì)讓目前版本的開源項目能夠訓練出具有同樣特質(zhì)的模型,所以讓人感覺特別像。
在這些“AI孫燕姿”的翻唱視頻中,“開口跪”、“一模一樣”、“這不是原唱?”……等類似的彈幕和評論比比皆是,不少網(wǎng)友都震驚于AI技術(shù)已發(fā)展到如此地步。
2
聲音的隱私與安全
每個人的聲音和相貌都具有獨特性,但AI深度合成技術(shù)正在逐步打破這一邊界。
早在攻占樂壇之前,AI在其他領(lǐng)域就引發(fā)了熱議,比如AI視頻換臉。最開始大家也只是把影視作品里的演員通過AI換臉成其他明星或個人,屬于小部分人的自娛自樂,圈地自萌。
但隨著AI技術(shù)的發(fā)展,在給人們帶來便利,提高生產(chǎn)效率的同時,也帶來不少新問題。比如不法分子通過AI 換臉實施詐騙活動等,而AI換臉與AI語音生成的結(jié)合更是讓人防不勝防。
來源 | AIGC (AI作圖)
據(jù)悉,2020年上海一公司高管就因騙子使用AI換臉與人工生成的語音技術(shù)假扮公司領(lǐng)導,并要求該高管轉(zhuǎn)賬,最終致使其被騙150萬元。
專業(yè)人士介紹,當前AI技術(shù)被用于電信詐騙犯罪活動主要表現(xiàn)在以下兩個方面:其一,騙子通過騷擾電話錄音等來提取某人聲音,獲取素材后,利用 AI 技術(shù)進行聲音合成,而后用偽造的聲音欺騙被害人。其二,騙子用AI換臉技術(shù),偽裝成被害人的熟人,再通過視頻通話方式,進行信息確認,騙取信任。
如同之前ChatGPT(Chat Generative Pre-trained Transformer,聊天生成預訓練轉(zhuǎn)換器)爆火引發(fā)版權(quán)問題一樣,AI 翻唱涉及的版權(quán)問題也再次被人們提及,比如:AI 翻唱是否侵犯了歌手的聲音版權(quán)?AI 翻唱的歌曲是否享有自己的版權(quán)?
這些問題在我國目前還沒有明確的法律規(guī)定和司法判例,因此存在很多爭議。對此,國家互聯(lián)網(wǎng)信息辦公室2023年4月11日發(fā)布了《生成式人工智能服務管理辦法(征求意見稿)》。
來源 | 中華人民共和國國家互聯(lián)網(wǎng)信息辦公室
這份征求意見稿已于2023年5月10日結(jié)束公開征求意見,但最終版的具體發(fā)布和生效時間還不確定。
法律相關(guān)人士表示,制定該辦法展現(xiàn)了國家網(wǎng)絡監(jiān)管部門對于AI技術(shù)所帶來的社會倫理、法律等問題的高度關(guān)注,并已開始研究劃定AI應用的“邊界”。
3
你如何看待AI翻唱?
網(wǎng)友們聽著這些“AI孫燕姿”們的翻唱歌曲,有的人單純享受著這難得的“福利”時間,也人思考得更深,比如:對“過氣”歌手的回捧、對經(jīng)典老歌的翻唱,是否說明華語歌壇長久以來都沒有好的歌手和歌曲出現(xiàn);歌手是否會像翻譯人員、繪畫工作者等一樣面臨著被AI取代的問題......
總之,各種不同的聲音都有,而歌手陳珊妮的一番行為藝術(shù)般的操作,給了我們更多啟發(fā)。2023年3月,陳珊妮發(fā)布新歌《教我如何做你的愛人》,粉絲聽完后,紛紛表示演唱水準依然在線,狀態(tài)甚至比以前更好。
來源 | 微博
但隨后,陳珊妮發(fā)布微博說這首新歌并不是她本人演唱的,而是由她花大量時間和精力訓練的“AI模型”演唱,并且連單曲封面也是由AI生成。
消息一出,大眾無不感到震驚:音樂人竟然主動接納AI,并讓AI“取代”自己。
面對各種爭議,陳珊妮也公布了自己這么做的初衷,“在AI發(fā)展熱議的當下,希望透過這首歌,與所有關(guān)心創(chuàng)作的人一起思考——如果 AI 的時代必將到來,創(chuàng)作人該在意的或許不是‘我們是否會被取代’,而是‘我們還可以做些什么’。”
來源 | Pexels
確實,無論是明星還是普羅大眾,都沒法阻止科技前進的步伐,比起反對它,恐懼它,我們更應該思考如何去使用和掌握它。