報告服務熱線400-068-7188

2023年中國數(shù)字人行業(yè)技術發(fā)展現(xiàn)狀 主要分兩大技術流程【組圖】

分享到:
20 杜怡萱 ? 2022-12-28 16:00:42  來源:前瞻產(chǎn)業(yè)研究院 E9445G0

行業(yè)主要上市公司:科大訊飛(002230)、藍色光標(300058)、歌力思(603808)、芒果超媒(300413)、博瑞傳播(600880)、虹軟科技(688088)、騰訊(00700)、百度(BIDU)等

本文核心數(shù)據(jù):數(shù)字人專利相關統(tǒng)計數(shù)據(jù)。

智慧芽統(tǒng)計口徑說明:1)搜索關鍵詞:數(shù)字人及與之相近似或相關關鍵詞;2)搜索范圍:標題、摘要和權利說明;3)篩選條件:簡單同族申請去重、法律狀態(tài)為實質審查、授權、PCT國際公布、PCT進入指定國(指定期),簡單同族申請去重是按照受理局進行統(tǒng)計;行業(yè)篩選參考數(shù)字經(jīng)濟分類對應國民經(jīng)濟分類。4)統(tǒng)計截至日期:2022年11月21日。5)若有特殊統(tǒng)計口徑會在圖表下方備注。下同。

數(shù)字人系統(tǒng)框架:由五大模塊構成

虛擬數(shù)字人系統(tǒng)一般情況下由人物形象、語音生成、動畫生成、音視頻合成顯示、交互等5個模塊構成。人物形象根據(jù)人物圖形資源的維度,可分為2D和3D兩大類,從外形上又可分為卡通、擬人、寫實、超寫實等風格,這部分主要由建模技術生成;語音生成模塊和動畫生成模塊可分別基于文本生成對應的人物語音以及與之相匹配的人物動畫;音視頻合成顯示模塊將語音和動畫合成視頻,再顯示給用戶。交互模塊使數(shù)字人具備交互功能,即通過語音語義識別等智能技術識別用戶的意圖,并根據(jù)用戶當前意圖決定數(shù)字人后續(xù)的語音和動作,驅動人物開啟下一輪交互。

圖表1:虛擬數(shù)字人通用系統(tǒng)框架示意圖

真人驅動型數(shù)字人技術流程:CG技術的進一步延續(xù)

在真人驅動中,在完成原畫建模和關鍵點綁定后,動捕設備或攝像頭將基于真人的動作/表情等驅動虛擬數(shù)字人。

由于背后有真人操作,真人驅動型在動作靈活度、互動效果等方面有明顯優(yōu)勢,一方面能夠在影視內容的創(chuàng)作中減低生產(chǎn)成本,為影視行業(yè)降低門檻,推動影視級內容向消費級轉化。另一方面則多用于虛擬偶像、重要直播中,幫助虛擬數(shù)字人完成大型直播、現(xiàn)場路演等互動性、碎片化活動。

事實上,這種技術思路可以看作是傳統(tǒng)影視制作中,CG技術的進一步延續(xù)。近年來主要的技術突破在于動作捕捉環(huán)節(jié)。隨著圖像識別技術,姿勢、表情等識別算法的進步,昂貴的慣性或光學動捕設備不再是驅動的必備工具。普通攝像頭結合理想的識別算法通用能實現(xiàn)較為精準的驅動(如iPhone 12攝像頭已可支持簡單的動作捕捉),顯著降低了精細虛擬內容生成的門檻。

圖表2:真人驅動型數(shù)字人技術流程示意

算法驅動型數(shù)字人技術流程:依賴深度學習模型

在計算驅動型中,虛擬數(shù)字人的語音表達、面部表情、具體動作將主要通過深度學習模型的運算結果實時或離線驅動,在渲染后實現(xiàn)最終效果。

計算驅動的虛擬數(shù)字人最終效果受到語音合成(語音表述在韻律、情感、流暢度等方面是否符合真人發(fā)聲習慣)、NLP技術(與使用者的語言交互是否順暢、是否能夠理解使用者需求)、語音識別(能否準確識別使用者需求)等技術的共同影響。盡管在特定方向上,各感知類技術已有的商業(yè)化能力已足以支撐,然而,但要達成理想的綜合效果,需要該公司在三個方面同時具有較強的綜合能力。這也間接導致國內開展計算驅動型虛擬數(shù)字人業(yè)務的公司,大多是在感知技術方面有較強的綜合實力,相對成熟的AI技術公司。

圖表3:算法驅動型數(shù)字人技術流程示意

專利布局:網(wǎng)易專利申請數(shù)量最多,游戲領域專利占比較大

——熱門申請人:網(wǎng)易專利申請數(shù)量最多

中國數(shù)字人領域專利申請數(shù)量TOP10申請人分別是網(wǎng)易(杭州)網(wǎng)絡有限公司、騰訊科技(深圳)有限公司、北京達佳互聯(lián)信息技術有限公司、北京字跳網(wǎng)絡技術有限公司、維沃移動通信有限公司、北京百度網(wǎng)訊科技有限公司、OPPO廣東移動通信有限公司、抖音視界有限公司、廣州方硅信息技術有限公司、華為技術有限公司。

其中,網(wǎng)易(杭州)網(wǎng)絡有限公司在數(shù)字人領域專利申請數(shù)量最多,公司專利數(shù)量達1535項,騰訊科技(深圳)有限公司排名第二,其數(shù)字人領域專利申請數(shù)量達1295項。

智慧芽 圖表4:截至2022年中國數(shù)字人熱門申請人TOP10(單位:項)

——技術構成:與游戲相關的專利占比超20%

從技術構成來看,目前“A63F13 視頻游戲,即使用二維或多維電子顯示器的游戲〔7,2014.01〕[2014.01]”申請數(shù)量最多,達到3101項,占前十大技術總量比重23.62%;其次為“G06F3 用于將所要處理的數(shù)據(jù)轉變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設備的輸出裝置,例如,接口裝置〔4〕[2006.01]”,專利數(shù)量達到2442項,占前十大技術總量的比例達18.6%。

圖表5:截止2022年中國數(shù)字人行業(yè)技術構成(單位:項,%)

更多本行業(yè)研究分析詳見前瞻產(chǎn)業(yè)研究院《中國數(shù)字人產(chǎn)業(yè)發(fā)展前景預測與投資戰(zhàn)略規(guī)劃分析報告》,同時前瞻產(chǎn)業(yè)研究院還提供產(chǎn)業(yè)大數(shù)據(jù)、產(chǎn)業(yè)研究、政策研究、產(chǎn)業(yè)鏈咨詢、產(chǎn)業(yè)圖譜、產(chǎn)業(yè)規(guī)劃、園區(qū)規(guī)劃、產(chǎn)業(yè)招商引資、IPO募投可研、IPO業(yè)務與技術撰寫、IPO工作底稿咨詢等解決方案。

更多深度行業(yè)分析盡在【前瞻經(jīng)濟學人APP】,還可以與500+經(jīng)濟學家/資深行業(yè)研究員交流互動。

前瞻產(chǎn)業(yè)研究院 - 深度報告 REPORTS

2024-2029年中國數(shù)字人(虛擬人)產(chǎn)業(yè)發(fā)展前景預測與投資戰(zhàn)略規(guī)劃分析報告
2024-2029年中國數(shù)字人(虛擬人)產(chǎn)業(yè)發(fā)展前景預測與投資戰(zhàn)略規(guī)劃分析報告

本報告前瞻性、適時性地對數(shù)字人產(chǎn)業(yè)的發(fā)展背景、供需情況、市場規(guī)模、競爭格局等行業(yè)現(xiàn)狀進行分析,并結合多年來數(shù)字人產(chǎn)業(yè)發(fā)展軌跡及實踐經(jīng)驗,對數(shù)字人產(chǎn)業(yè)未來的發(fā)展...

查看詳情

本文來源前瞻產(chǎn)業(yè)研究院,內容僅代表作者個人觀點,本站只提供參考并不構成任何投資及應用建議。(若存在內容、版權或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

如在招股說明書、公司年度報告等任何公開信息披露中引用本篇文章數(shù)據(jù),請聯(lián)系前瞻產(chǎn)業(yè)研究院,聯(lián)系電話:400-068-7188。

p43 q0 我要投稿

分享:

前瞻經(jīng)濟學人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領導者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領域解決方案,掃一掃關注。

前瞻數(shù)據(jù)庫
企查貓
作者 杜怡萱
產(chǎn)業(yè)研究員、分析師
2073717
關注
225
文章
20
前瞻經(jīng)濟學人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟學家互動交流讓您成為更懂趨勢的人

研究員周關注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟學人》APP提問

 
在線咨詢
×
在線咨詢

項目熱線 0755-33015070

AAPP
前瞻經(jīng)濟學人APP下載二維碼

下載前瞻經(jīng)濟學人APP

關注我們
前瞻產(chǎn)業(yè)研究院微信號

掃一掃關注我們

我要投稿

×
J