當(dāng)前位置：前瞻產(chǎn)業(yè)研究院 ? 經(jīng)濟(jì)學(xué)人 ? 觀察家專欄

AI孫燕姿成今年爆火歌手，這一時(shí)代眼見(jiàn)不實(shí)，耳聽(tīng)為虛

分享到：

電子發(fā)燒友網(wǎng) ? 2023-05-16 07:30:24 　來(lái)源：電子發(fā)燒友網(wǎng)　E5435G0

(圖片來(lái)源：攝圖網(wǎng)）

作者|黃山明來(lái)源|電子發(fā)燒友網(wǎng)(ID：elecfans)

就在近期，華語(yǔ)樂(lè)壇的不少歌迷喜氣洋洋，認(rèn)為目前的歌壇回到了20年前，歌迷們又享受到了許多動(dòng)聽(tīng)的歌聲。不過(guò)與以往不同的是，這些演唱者并非真人，而是一個(gè)個(gè)訓(xùn)練出來(lái)的AI。

這些AI足以以假亂真，通過(guò)技術(shù)將一首音樂(lè)以更換演唱者的方式來(lái)進(jìn)行不同的演繹，不僅為歌壇帶來(lái)了不一樣的視聽(tīng)體驗(yàn)，同時(shí)也引發(fā)了行業(yè)對(duì)AI技術(shù)應(yīng)用的思考。在AI時(shí)代，我們的所見(jiàn)所聞，或許都是由AI創(chuàng)造的。

光怪陸離的AI時(shí)代

如今的網(wǎng)絡(luò)上有一個(gè)梗，要問(wèn)今年哪個(gè)歌手最火，答案可能會(huì)出乎許多人意料，并不是某位歌手，而是一些由AI所制作出來(lái)的語(yǔ)音，如AI孫燕姿、AI周杰倫等。通過(guò)將原來(lái)歌手的聲音進(jìn)行采集訓(xùn)練，從而替換另一首歌的原唱。

通過(guò)這種方式，實(shí)現(xiàn)了讓自己喜歡的歌手唱另一首自己喜歡但非歌手的歌，比如用孫燕姿的聲音演唱周杰倫的《晴天》。關(guān)鍵在于，不論是演唱語(yǔ)調(diào)、技巧乃至音色，幾乎都與孫燕姿相差無(wú)幾。

實(shí)現(xiàn)這一技術(shù)目前已經(jīng)有一套標(biāo)準(zhǔn)流程，先通過(guò)收集大量的音樂(lè)和歌詞，并對(duì)這些數(shù)據(jù)進(jìn)行清洗和標(biāo)注，以便訓(xùn)練算法和模型。再選擇合適的算法和模型，并進(jìn)行優(yōu)化和調(diào)整，以提高虛擬人物的歌唱和表演能力。

通過(guò)語(yǔ)音合成技術(shù)將文字轉(zhuǎn)換為聲音，并對(duì)聲音進(jìn)行處理和優(yōu)化，以達(dá)到更加自然和流暢的效果。最后將原來(lái)歌曲的聲音替換成語(yǔ)音合成的聲音，再進(jìn)行調(diào)試，就能得到一首全新演唱的歌曲。

既然都已經(jīng)可以替換聲音演唱歌曲了，那么更進(jìn)一步替換視頻畫(huà)面進(jìn)行演繹也就不太難了。近期谷歌的I/O大會(huì)上，便公布了一項(xiàng)Universal Translator技術(shù)，該工具旨在將視頻從一種語(yǔ)言翻譯成另一種語(yǔ)言，同時(shí)保留整體基調(diào)和氛圍。

這意味著該技術(shù)不僅可以將音頻從一種語(yǔ)言翻譯成另一種語(yǔ)言，還可以模仿說(shuō)話者的聲音、語(yǔ)氣和面部表情，人物說(shuō)話視頻會(huì)根據(jù)目標(biāo)語(yǔ)言的發(fā)音同步改變口型。

當(dāng)然，為了避免這項(xiàng)技術(shù)被用來(lái)制作虛假視頻，谷歌將這項(xiàng)技術(shù)只授權(quán)給少部分的合作廠商使用，普通人是無(wú)法接觸到的。但市場(chǎng)上如今已經(jīng)有許多類似的AI出現(xiàn)，谷歌的此舉不過(guò)是略作限制，但無(wú)法阻止這股趨勢(shì)。

更有甚者，如一位美國(guó)網(wǎng)紅發(fā)布了AI版本的自己“Caryn AI”，這個(gè)應(yīng)用是一款聊天機(jī)器人，可以作為用戶的虛擬伴侶，目前正在內(nèi)部測(cè)試階段，每分鐘收費(fèi)一美元。

據(jù)美國(guó)雜志《財(cái)富》披露，就在過(guò)去一周的時(shí)間內(nèi)，這款軟件已經(jīng)為其創(chuàng)造了7.16萬(wàn)美元（約合人民幣50萬(wàn)元）的收入，已經(jīng)吸引了超過(guò)1000名付費(fèi)粉絲。

這種模式或許也將沖擊未來(lái)的娛樂(lè)行業(yè)，想象每一位追星的粉絲，只要付費(fèi)，都將擁有與自己偶像一對(duì)一聊天的機(jī)會(huì)，其所創(chuàng)造的價(jià)值潛力將是巨大的。

但這種由AI所創(chuàng)造出來(lái)的音樂(lè)、視頻、伴侶或者偶像，真的可以提供人們所需要的情緒價(jià)值嗎？這是個(gè)值得思考的問(wèn)題。

AI之后的隱憂

盡管這些AI應(yīng)用的落地前景非常誘人，比如采用AI替換歌曲中的聲音，就能夠?qū)崿F(xiàn)歌手只需要提供聲音的模板，便可以進(jìn)行批量的音樂(lè)制作。甚至不用自己演唱，也能夠推行相關(guān)專輯。

技術(shù)上主要通過(guò)機(jī)器學(xué)習(xí)技術(shù)，訓(xùn)練機(jī)器模仿一個(gè)特定的歌手的音樂(lè)風(fēng)格、聲音和唱腔，然后將這些技能應(yīng)用于其他歌曲的錄制中。這種技術(shù)在一定程度上提高了錄制歌曲的效率和質(zhì)量，并且可以節(jié)省制作成本。

但如果使用他人的聲音進(jìn)行創(chuàng)作，就可能有侵權(quán)的風(fēng)險(xiǎn)。尤其在數(shù)據(jù)采集階段，以語(yǔ)音替換為例，首先需要收集大量的語(yǔ)音數(shù)據(jù)，并對(duì)這些數(shù)據(jù)進(jìn)行標(biāo)注和處理。標(biāo)注可以包括音素、語(yǔ)調(diào)、語(yǔ)速等信息，以便訓(xùn)練模型能夠準(zhǔn)確地識(shí)別和替換語(yǔ)音。

這一過(guò)程便可能涉及到對(duì)用戶隱私數(shù)據(jù)的采用，甚至對(duì)用戶的隱私和數(shù)據(jù)安全造成威脅，還有可能進(jìn)一步造成財(cái)產(chǎn)安全。因?yàn)檎Z(yǔ)音合成就可能被犯罪分子用于詐騙，通過(guò)合成親屬或者熟人的聲音來(lái)謀取資金。

如果用AI更改視頻畫(huà)面甚至進(jìn)一步篡改其中的對(duì)話，則可能造成更多的風(fēng)險(xiǎn)。比如將會(huì)遇到即便是用視頻聊天，也無(wú)法確定對(duì)面的是不是真的想要聯(lián)系的那個(gè)人。這項(xiàng)技術(shù)目前甚至已經(jīng)應(yīng)用在許多的直播平臺(tái)中，比如一些虛擬主播、虛擬偶像等，如果一旦濫用，可能會(huì)造成更多的危害。

為了避免這一情況的發(fā)生，除了加強(qiáng)對(duì)AI技術(shù)的監(jiān)管，建立相應(yīng)的法律制度和規(guī)范，還可以通過(guò)一些技術(shù)手段來(lái)避免自身的數(shù)據(jù)被采集，從而造成侵權(quán)以及侵犯隱私的風(fēng)險(xiǎn)。比如采用區(qū)塊鏈技術(shù)來(lái)保護(hù)數(shù)據(jù)的安全性和隱私性，采用人工智能算法來(lái)檢測(cè)和識(shí)別惡意行為等手段。

以區(qū)塊鏈技術(shù)為例，其去中心化和不可變性特點(diǎn)能夠確保數(shù)據(jù)的安全和完整性，因此可以用于AI技術(shù)的安全驗(yàn)證和認(rèn)證。基于區(qū)塊鏈技術(shù)，數(shù)據(jù)交互和交流的過(guò)程被保護(hù)，因此可以授權(quán)AI對(duì)數(shù)據(jù)的操作并確保AI數(shù)據(jù)訪問(wèn)權(quán)限受到限制。

同時(shí)，區(qū)塊鏈技術(shù)還可以幫助人們更好地控制AI技術(shù)的使用，并提高AI的公正和透明性。例如，以基于區(qū)塊鏈技術(shù)的智能合約的方式來(lái)控制AI的使用，可以加強(qiáng)對(duì)AI系統(tǒng)的監(jiān)督，并確保其行為符合人類的期望和價(jià)值。

當(dāng)然，區(qū)塊鏈技術(shù)還面臨著可擴(kuò)展性、隱私保護(hù)等問(wèn)題，同時(shí)在操作成本和技術(shù)難度方面也存在一定的限制，還無(wú)法完全避免AI濫用的問(wèn)題。

我們還可以運(yùn)用數(shù)字簽名技術(shù)檢測(cè)音頻和視頻是否被AI修改，數(shù)字簽名是指在文件中包含數(shù)字代碼的技術(shù)，在將文件傳輸或轉(zhuǎn)發(fā)給其他人時(shí)，可以驗(yàn)證文件的完整性和真實(shí)性。或者使用機(jī)器學(xué)習(xí)算法來(lái)檢測(cè)這些變化，例如，可以使用深度神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)音頻或視頻進(jìn)行分析，以檢測(cè)其中的模式和結(jié)構(gòu)是否與人類創(chuàng)作者的作品相似。如果發(fā)現(xiàn)有明顯的差異，則可能表明該作品是由AI生成的。

但隨著未來(lái)AI技術(shù)的發(fā)展，這些差異化和容易被檢測(cè)出來(lái)的問(wèn)題都有可能被AI克服，使得我們最終很難分辨哪些產(chǎn)品是由AI制作，哪些才是由人所原創(chuàng)的。

寫(xiě)在最后

隨著生成式AI技術(shù)的大爆發(fā)，如ChatGPT、文心一言、訊飛星火等聊天機(jī)器人的出現(xiàn)，讓人們工作效率得以極大地提高，Stable Diffusion、Midjourney等AI的出現(xiàn)，讓圖片制作成本大幅降低，Universal Translator、Video Dubbing AI等，讓視頻也開(kāi)始變得容易制作。

這些AI技術(shù)的出現(xiàn)顯然極大的解放了人們的生產(chǎn)力，讓人類發(fā)展走上快車道。當(dāng)然有人會(huì)說(shuō)以上這些AI都是通過(guò)收集大量數(shù)據(jù)之后，輸出縫合之后的產(chǎn)品，根本不能稱得上是原創(chuàng)。

但就像我們的學(xué)習(xí)過(guò)程一樣，最開(kāi)始都是模仿，后來(lái)才開(kāi)始擁有自己的獨(dú)立風(fēng)格，但這些風(fēng)格或多或少都會(huì)有之前學(xué)習(xí)過(guò)的影子，而這就是創(chuàng)造的過(guò)程，AI也是如此。

更值得關(guān)注的是，隨著AI技術(shù)的快速發(fā)展，其所帶來(lái)的風(fēng)險(xiǎn)也在與日俱增。如何更好的處理AI所引發(fā)的風(fēng)險(xiǎn)，將是我們未來(lái)所面對(duì)的主要問(wèn)題。

編者按：本文轉(zhuǎn)載自微信公眾號(hào)：電子發(fā)燒友網(wǎng)(ID：elecfans)，作者：黃山明

本文來(lái)源電子發(fā)燒友網(wǎng)，內(nèi)容僅代表作者本人觀點(diǎn)，不代表前瞻網(wǎng)的立場(chǎng)。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。（若存在內(nèi)容、版權(quán)或其它問(wèn)題，請(qǐng)聯(lián)系：service@qianzhan.com）　品牌合作與廣告投放請(qǐng)聯(lián)系：0755-33015062 或 hezuo@qianzhan.com

p50 q0 我要投稿

標(biāo)簽： AI 孫燕姿

品牌、內(nèi)容合作請(qǐng)點(diǎn)這里：尋求合作 ››

產(chǎn)業(yè)規(guī)劃
園區(qū)規(guī)劃
產(chǎn)業(yè)招商
可行性研究
低空經(jīng)濟(jì)
高端裝備
生物醫(yī)藥

前瞻經(jīng)濟(jì)學(xué)人

專注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國(guó)產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者，專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案，掃一掃關(guān)注。