報告服務熱線400-068-7188

誰在“操控”虛擬人?

分享到:
20 自象限 ? 2023-10-16 10:07:16  來源:自象限 E3512G1

作者|程心 來源|自象限(ID:zixiangxian)

大模型的風,吹動虛擬數字人廠商野蠻生長(以下統(tǒng)稱虛擬人)。

《虛擬數字人深度產業(yè)報告》預計,到2030年我國虛擬數字人整體市場規(guī)模將達到2700億元,其中,“服務型虛擬人”總規(guī)模也將超過950億元。

如同禿鷹盯上腐肉,嗅到萬億商機各方勢力,都欲分一杯羹,這也直接導致了目前的虛擬人玩家格局陷入了“混戰(zhàn)”狀態(tài)。

「自象限」根據各方數據不完全統(tǒng)計,目前國內虛擬數字人核心廠商約有6000家。而按天眼查的數據顯示,相關廠商數量甚至超過6萬家。

同時,隨著大模型(Large Model)的興起,虛擬人的產業(yè)格局也在發(fā)生深刻變化。

比如,虛擬人正在經歷從制作流程降本到技術突破的關鍵階段,從大語言模型到多模態(tài)能力,讓虛擬人從展示突破到了實時互動,這意味著未來虛擬人可能只需要一個實時渲染的外觀,就能擁有十分逼真的溝通能力。技術門檻的降低,也會讓更多參與方加入到這個開拓中的市場。而狂奔半年后,百億個虛擬人也逐漸滲透進各行各業(yè),并逐步進入商業(yè)化階段。

也就是說,在廠商“混戰(zhàn)”的表面下,隱藏的不僅是巨大的商業(yè)利益,更是復雜的技術博弈。而牽動著虛擬人“木偶引線”的另一頭,操控者們的世界也在發(fā)生翻天覆地的變化。

千億市場,廠商“混戰(zhàn)” ‍‍‍‍‍‍‍‍‍‍

如果說元宇宙時期的虛擬人已經是一把大火,那大模型就相當于在這之上又烹上了一勺油。一瞬間,鋪天蓋地的數字人廠商涌來,將本就復雜的行業(yè)攪得愈發(fā)渾濁。

這其中,既包括從元宇宙時期就一直堅持虛擬數字人的廠商,也有依靠全棧技術優(yōu)勢輕松邁出第一步的大廠,更不乏聞風而來的換道廠商。

「自象限」初步了統(tǒng)計核心廠商的類型后發(fā)現(xiàn),這些廠商大致可以分為四類:

▲圖為自象限原創(chuàng),轉載請注明出處

第一類互聯(lián)網大廠如騰訊、百度、阿里、京東、網易等。這里面其實也分兩類,一類是騰訊、百度為代表,他們業(yè)務龐大,在面向To B的解決方案上,比如金融、文旅、汽車等場景,需要一個數字人形象來符合新的交互方式。對于這些企業(yè),數字人只是業(yè)務的一個補充。另一類則是網易為代表的,具有技術積累的企業(yè),由于網易在游戲建模、AI捏臉等方面豐富的探索和技術積累,讓他們需要通過虛擬人將這些沉淀的資源轉化。

第二類原生廠商。這是較早布局數字人的一批廠商,如即構科技、魔琺科技、硅基智能、風平智能、數字栩生、相芯科技等。這類廠商或屬于上一波元宇宙創(chuàng)業(yè)的“遺珠”,或屬于市場早期以電商直播帶貨、本地生活直播等場景切入數字人場景的公司,得益于AIGC技術,其中的一些公司完成了從2D數字人到3D數字人的升級。

第三類換道廠商。基于原有技術延伸入局數字人賽道,如:商湯、華為、科大訊飛、快手、360、美圖、蔚領時代、元境科技、新壹科技等。這類廠商在發(fā)展過程中積累了一些涉及數字人的技術。譬如商湯的視覺識別技術、科大訊飛的語言識別技術、蔚領時代的游戲渲染技術等等,以這些技術為突破口再結合大模型的發(fā)展,完成了賽道的轉換。

第四類跨界廠商。他們因為自身業(yè)務場景需求而下探數字人技術,如萬興科技、藍色光標、謙尋、高途、中公教育等。這類廠商的特點是其原本業(yè)務與數字人并無太大交集,如萬興科技主營業(yè)務是提供文圖、剪輯類的基礎工具,衍生出為客戶提供數字人工具;藍色光標的主要業(yè)務為廣告業(yè)務,通過數字人可以更好的完成客戶的需求;而謙尋則是一家MCN公司。但隨著應用和場景的拓展,數字人成為了其新的發(fā)力方向,萬興科技借數字人進一步開拓了海外直播、營銷業(yè)務,謙尋借由數字人找尋到了新一輪直播帶貨流量、成交額增長動力。

源于“出身”的不同,不同廠商的商業(yè)模式和目標也完全不同。

大廠的虛擬人多為服務自身核心戰(zhàn)略而生,比如阿里、京東的虛擬人多被應用在電商領域;騰訊將移動互聯(lián)網時代積累下來的RTC(實時通信技術)應用在虛擬人交互中,打造了智影制作平臺;百度希壤更偏向于表演型虛擬人,為不同企業(yè)提供定制化代言人;而網易則將虛擬人應用在游戲、教育等多個自身業(yè)務中。總的來說,互聯(lián)網大廠并沒有急于將虛擬人獨立對外商業(yè)化,而是受自身技術的積累和場景需求催生。

核心對外提供服務的主要是原生的數字人廠商和換道廠商,從上個風口到如今,這類廠商已經積累了數字人的技術經驗,對于底層技術、細節(jié)把控和場景的探索都有著更為體系化的認知。根據技術路線的不同,原生廠商又被分為2D廠商和3D廠商,2D廠商更傾向于虛擬人與場景的結合,而3D廠商則處于技術迭代的狀態(tài)。

“2D虛擬人制作有兩種方式,一種是請真人錄制,然后幫其定制形象。一種是從用戶提供的視頻中提取形象,再用到各種場景中。但是2D數字人沒辦法做到3D那樣轉身、跳舞、做各種動作。”即構科技對二者的制作差異進行了詳細解釋。

但由于2D虛擬人的制作成本低,帶動了整個虛擬人市場“飛入尋常百姓家”,填補了市場由于價格攔路而不能落地的需求鴻溝。「自象限」了解到,目前原廠廠商是大公司和品牌側傾向的選擇,通過行業(yè)KA客戶打造標桿案例,比如銀行、大型消費品品牌(健力寶)、美妝品牌(HR赫蓮娜)等等。

換道廠商和跨界廠商有異曲同工之筆,如商湯、美圖等換道廠商,在上個階段積累了CV、圖像識別等技術,被應用在了虛擬人的制作中,而像藍標、謙尋等公司,源于自身的需求出發(fā),為了避免高昂的采購成本,也選擇自研虛擬人,技術不夠硬核但有固定的客戶群,商業(yè)化冷啟動相對迅速。

 產品成熟,重在交付 

今年8月、9月開始,虛擬人廠商產品開始加速迭代。據不完全統(tǒng)計,兩個月內至少有10家廠商發(fā)布了新的虛擬人產品。

產品的高度迭代意味著虛擬人正在飛快得適應市場需求,而這也意味著虛擬人第一階段的賽點已經走入關鍵階段。

從類型來看,虛擬人廠商分為兩類,一類直接交付虛擬人產品,包括通用虛擬人產品、行業(yè)垂直場景的虛擬人產品,比如電商、零售、營銷、直播等,客戶即拿即用,或標準化或定制化;另一類則提供虛擬人制作平臺,客戶通過使用平臺提供的工具,自主生產虛擬人。

相比之下,產品交付類型更適合企業(yè)探索虛擬人初期,幾乎不需要技術團隊配合,門檻更低,也是目前較多企業(yè)選擇的方式。

針對這類產品形式,虛擬人廠商也提供了多樣的購買方案。如汽車試駕一樣,品牌在購買虛擬人之前,可以先可進行Demo的試用,真實感受虛擬人的表情、動作、交互等等。除此之外,品牌在購買前還可以進行方案咨詢,廠商會根據客戶情況,制定具體的虛擬人傳播方案,并有多種不同風格的虛擬人可以選擇。

以即構虛擬人Avatar為例,企業(yè)可選擇擬人形象和Q版形象,并可以在線直接體驗給虛擬人換裝、捏臉,并通過AI完成了表情驅動、聲音驅動、文本驅動、肢體驅動等全方位的驅動方式。

▲圖源:即構官網截圖

提供制作平臺的廠商產品則更加復雜,如魔琺科技的三款產品分別針對了不同場景進行,包括虛擬視頻、虛擬人直播和獨立的虛擬人服務,并且在后端打造了端到端的寫實3D虛擬人工業(yè)化產線,包括從技術到調試到運營的“星云平臺”,讓虛擬人能夠和大模型結合,長出“腦子”,真正實現(xiàn)3D交互。

1

▲圖源:魔琺科技發(fā)布會

今年8月,魔琺科技升級了有言AIGC生成平臺、有光直播帶貨平臺和有靈虛擬人制作平臺,為企業(yè)提供系列生成工具,企業(yè)根據自身需求,能夠更加靈活的調整虛擬人的細節(jié)、結構和適配的使用場景。

1

相比之下,商湯既能夠直接交付虛擬人產品,也打造了如影虛擬人制作平臺,基于在視覺、語音領域積累的3萬個算法模型,打造了集智能化生成、智能化驅動、智能化交互的數字人平臺。在商湯智能化引擎驅動下,虛擬人能快速識別、反應,與用戶建立起對話關系。并且,事后,虛擬人也不會“失憶”,繼續(xù)學習迭代。

這也說明了,當下廠商不僅是商業(yè)模式上的競爭,更是技術先進性的比拼。

從整個虛擬人的技術發(fā)展進程來說,大模型帶來最核心的改變,是推動著虛擬人從第一階段看起來“像人”,到能夠與人實時互動。

1

▲圖為自象限原創(chuàng),轉載請注明出處

第一階段,虛擬人廠商比拼的是“誰看起來更像人”?虛擬人廠商的核心技術多在傳統(tǒng)的CG(建模)技術、驅動技術、渲染引擎等等,所以虛擬代言人為代表的表演型虛擬人成為了核心交付產品。

但由于技術的不成熟導致了虛擬人制作成本高企,「自象限」從行業(yè)內人士了解到,2022年,某大廠提供的訂制虛擬人價格高達10萬,這讓虛擬人根本無法規(guī)?;涞?。

大模型來了之后,一方面讓虛擬人制作成本進行了大幅度降低另一方面,AI技術加速了虛擬人的交互功能,讓虛擬人交互起來更像人。

某虛擬人制作廠商曾吐槽:“以前6888元一個,賣一個賠一個”,通過智能渲染、智能驅動,流程自動化制作等能力,讓虛擬人的制作成本有了30%-50%的縮減,市面上甚至冒出了“99元、299元一個的虛擬人”。

更重要的是,大模型技術加速了虛擬人對語言語義的理解能力,讓虛擬人能夠從簡單的檢索生成,到語言文字AI驅動,更快速的對人的需求進行回復,甚至做到“秒回”,同時模型也驅動了渲染技術、擬真技術、超寫實技術的進化。

舉個具體的例子:交互的核心并不只是動作反饋,更是內容的生成和語音的交流,故而,AIGC技術和語音生成技術成為了當下技術發(fā)展的核心。

1

▲圖源:網絡

大模型讓虛擬人“長了腦子”,有了思考和推理能力,AIGC技術讓虛擬人能夠有“想法”,TTSText To Speech 文本轉語音技術)技術則讓虛擬人能夠“表達”。

幾天前,在GPT-4V版本更新,TTS實現(xiàn)了進步,文本驅動語音有了語氣和口吻,在停頓、重音和自然交互程度上有了極大的提升。不僅可以模仿不同的口吻,甚至設定“渣女”時還學會了“夾子音”。

有行業(yè)專家推測:TTS技術端到端成熟后,對行業(yè)格局的改變會很大。因為虛擬人真的能夠實時交互后,落到產業(yè)里才能產生實際價值。

從看起來像人,到實時互動,大模型推動著虛擬人完成二級階躍,但這也只是一個新的開始。從元宇宙到大模型時代,虛擬人真正備受關注的內在原因在于,他將有可能是下一個虛擬時代的“入口”,背后連接著新的虛擬世界,入口屬性讓其變的既性感又危險。

國外最早布局虛擬人的微軟小冰CEO李笛則認為:虛擬人未來是混合模型。

本質上,這兩種觀點的內核是一致的,只不過李笛的假設更為具體。下一階段,將進入“虛擬人+”的階段,虛擬人+RPA在企業(yè)內部打造數字員工;虛擬人+AI Agent,在C端打造陪伴型機器人;虛擬人+AR/VR,在3D空間打造可見的游戲NPC;虛擬人+具身智能,讓人型機器人有了靈魂。

若將多種技術進行全面融合,虛擬人才真的能夠成為“入口級應用”。屆時,比拼的賽點將是虛擬人的開放程度、生態(tài)建設、場景拓展等一系列綜合能力。

當虛擬人被賦予了更多能力,其背后的木偶引線到底還能否掌握在人的手里?

這個答案,也著實讓人期待。

編者按:本文轉載自微信公眾號:自象限(ID:zixiangxian),作者:程心 編者按:本文轉載自微信公眾號:自象限(ID:zixiangxian),作者:程心

本文來源自象限,內容僅代表作者本人觀點,不代表前瞻網的立場。本站只提供參考并不構成任何投資及應用建議。(若存在內容、版權或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p17 q1 我要投稿

分享:
標簽: 虛擬人 機器人

品牌、內容合作請點這里:尋求合作 ››

前瞻經濟學人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關注。

前瞻產業(yè)研究院

中國產業(yè)咨詢領導者,專業(yè)提供產業(yè)規(guī)劃、產業(yè)申報、產業(yè)升級轉型、產業(yè)園區(qū)規(guī)劃、可行性報告等領域解決方案,掃一掃關注。

前瞻數據庫
企查貓
前瞻經濟學人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經濟學家互動交流讓您成為更懂趨勢的人

研究員周關注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經濟學人》APP提問

 
在線咨詢
×
在線咨詢

項目熱線 0755-33015070

AAPP
前瞻經濟學人APP下載二維碼

下載前瞻經濟學人APP

關注我們
前瞻產業(yè)研究院微信號

掃一掃關注我們

我要投稿

×
J