張一鳴的對手,多了一個又一個
作者|馬舒葉 來源|字母榜(ID:wujicaijing)
進入7月,文生視頻賽道動作不斷:智譜AI 推出AI生成視頻模型智譜清言,用戶可在30秒內(nèi)免費生成6秒視頻;快手可靈迎來全面開放測試,并正式上線會員體系,月費分為66元、266元和666元三檔。
據(jù)字母榜(ID:wujicaijing)不完全統(tǒng)計,僅國內(nèi),目前便有超20家公司推出了自研AI視頻產(chǎn)品/模型。非凡產(chǎn)研數(shù)據(jù)顯示,2024年上半年,僅文生視頻領(lǐng)域全球有18次融資活動,其中12起融資都集中在國內(nèi)。
在今年2月份Sora震撼發(fā)布前后,前抖音CEO張楠幾乎同期轉(zhuǎn)崗剪映,并表示將推出一個AI生圖和視頻產(chǎn)品。但近半年過去,面對國內(nèi)其他玩家在成為Sora的“國產(chǎn)平替”的競賽中,字節(jié)在文生視頻領(lǐng)域卻推進緩慢。
更糟糕的是,新競爭對手還在不斷趕來的路上,如今字節(jié)最新的對手是MiniMax。
接近MiniMax的人士告訴字母榜,如今MiniMax正在內(nèi)部開發(fā)視頻大模型,可能會植入星野AI或海螺AI內(nèi),作為單個應(yīng)用場景出現(xiàn)。
對此,MiniMax商業(yè)化負責(zé)人魏偉回應(yīng)稱,現(xiàn)在包括MiniMax在內(nèi),各家大模型公司都在做文生視頻的嘗試,但對MiniMax來說,文生視頻的技術(shù)仍在早期階段。目前MiniMax對AI音頻或AI視頻的推出還沒有明確計劃。
作為國內(nèi)“AI四小龍”之一,MiniMax由閆俊杰創(chuàng)立,3月,MiniMax官宣了由阿里巴巴領(lǐng)投的6億美元,投后估值達25億美元,根據(jù)非凡產(chǎn)研數(shù)據(jù),6月,MiniMax旗下星野AI的月活為400萬人,海螺AI的月活為200萬人。
不管是MiniMax、還是智譜AI,切入文生視頻的“軍備競賽”,背后都有著對流量的焦慮。
6月6日,快手的文生視頻大模型可靈發(fā)布,一口氣把視頻生成的時長提到了2分鐘級。上線不到兩月,申請內(nèi)測可靈的用戶已經(jīng)超過了70萬。而根據(jù)非凡產(chǎn)研數(shù)據(jù),6月,MiniMax旗下海螺AI下降量為176萬人,環(huán)比下降19.95%。
盡管非凡產(chǎn)研CEO吳畏表示,整個6月,聊天類AI產(chǎn)品數(shù)據(jù)均有下滑,屬于行業(yè)整體狀況。但對于MiniMax、智譜AI們而言,無論是開發(fā)自己的視頻大模型,還是將文生視頻作為單個功能場景插入原本的大模型內(nèi),都不失為一個引流的優(yōu)選。
引流之外,對于坐擁短視頻業(yè)務(wù)的字節(jié)而言,文生視頻還將加強剪映等視頻剪輯工具的能力,并有望帶動平臺內(nèi)容供給的豐富度。
面對各路友商在文生視頻領(lǐng)域的步步緊逼,字節(jié)不得不迎頭跟上。
一
在文生視頻領(lǐng)域效用不顯的大廠,不只有字節(jié)一家。
宣布要“All in AI”的百度,年初推出的AI視頻模型UniVG正在內(nèi)測階段,阿里達摩院推出了AI視頻產(chǎn)品“尋光”。
而根據(jù)晚點LatePost報道,2024年一季度,字節(jié) AI 研發(fā)團隊將視頻生成模型的優(yōu)先級排在了前面,還挖來了原Google視頻生成模型VideoPoet項目負責(zé)人蔣路。2024年1月,字節(jié)推出一款A(yù)I視頻生成工具——MagicVideo-V2,支持從4K到8K的超高分辨率視頻生成。隨后2月,剪映推出名為Dreamina的AI繪畫工具。3個月后,剪映Dreamina正式更名為“即夢”,上線AI作圖和AI視頻生成功能,生成時長為3-12秒。
騰訊不僅自己的AI實驗室推出了視頻生成模型VideoCrafter2,同時騰訊混元團隊還聯(lián)合中山大學(xué)和香港科技大學(xué)共同研發(fā)了視頻大模型Follow-Your-Pose-v2,上傳一張人物圖片、提供一段動作視頻,就能讓圖片人物模仿視頻中的動作,視頻可達10秒。
騰訊集團副總裁蔣杰更表示,騰訊混元已支持文生視頻、圖生視頻、圖文生視頻、視頻生視頻等多種視頻生成能力,且已擁有16s視頻生成的能力。
繼Sora激起文生視頻討論熱潮,快手推出可靈,將文生視頻從60秒拉長到2-3分鐘,文生視頻賽道也引發(fā)了AI創(chuàng)企們的爭奪。
除了MiniMax和智譜AI之外,Morph AI的Morph Studio、愛詩科技的PixVerse、MewXAI的藝映AI、右腦科技的Vega AI,雖已經(jīng)在AI視頻領(lǐng)域占據(jù)一席之地,也在不斷迭代產(chǎn)品。
但不是所有大模型企業(yè)都將研發(fā)“國產(chǎn)Sora”擺在了優(yōu)先戰(zhàn)略級。
長文本起家的月之暗面,在OpenAI推出文生視頻模型Sora引發(fā)關(guān)注之際,完成了超10億美元的新一輪融資。當(dāng)同樣由阿里領(lǐng)投的MiniMax已經(jīng)傳出正在研發(fā)視頻大模型的消息時,月之暗面在長文本之外,仍未有新動作傳出。
成立百川智能的搜狗前CEO王小川,更是在3月份一次采訪中表示,百川不走Sora路徑。他認為像Sora之類的文生視頻模型既不靠近AGI理想,也不靠近現(xiàn)實場景,Sora的高度、突破性、應(yīng)用價值都低于GPT。
二
大模型廠商爭卷文生視頻,顯然是因為看好AI視頻“錢景”。
根據(jù)公開數(shù)據(jù),早早在APP里支持“一鍵AI美顏”的美圖,由連年虧損,到2023年總收入27億元,同比增長29.3%,經(jīng)調(diào)整后歸母凈利潤3.7億元,同比增長233.2%。而這一增長主要源于AI推動主營業(yè)務(wù)收入增長,如今美圖用戶每天處理數(shù)億份圖片和視頻,其中約83%都用到了泛AI功能。
以美圖AI口播視頻工具開拍為例,面向B端用戶,即抖音、小紅書、B站上的視頻創(chuàng)作者。“用(開拍)來拍口播可以設(shè)置字幕,濾鏡美顏也會更自然,甚至美圖還有專門的APP Wink,恢復(fù)畫質(zhì)的功能也很好用。”某小紅書博主告訴字母榜,如今做自媒體,除了剪映之外,美圖的開拍、Wink已經(jīng)成了她必用的剪輯工具。
前字節(jié)視覺技術(shù)負責(zé)人、愛詩科技創(chuàng)始人兼 CEO 王長虎亦表示,在過去的移動互聯(lián)網(wǎng)時代,國民級產(chǎn)品一定包括抖音、TikTok、快手,視頻相比語言更貼近用戶,未來產(chǎn)品化和商業(yè)化的可能性更大。
對于尚在用投流換用戶,仍處在虧損中的AI創(chuàng)企如MiniMax等大模型廠商們來說,文生視頻已然成為極具誘惑力的商業(yè)化新場景。
更不用提,上線不到兩月,申請內(nèi)測可靈的用戶已經(jīng)超過了70萬。在用文生視頻“讓特朗普說rap”“讓李白跳抖肩舞”的互聯(lián)網(wǎng)造梗狂歡里,AI視頻正在創(chuàng)造新的流量入口。
對于需要用日活和下載量證明自己的AI創(chuàng)企而言,社交平臺的投流成本居高不下,研發(fā)視頻大模型,將文生視頻植入原本的AI工具內(nèi)做流量入口,無疑會幫助正在虧損中的大模型初創(chuàng)公司,盡可能壓縮成本。
此外,對于MiniMax們來說,想要承接由于OpenAI禁用API端口調(diào)用而尋找“下家”的B端用戶,不論是用AI生成電商平臺的門店物料,還是視覺創(chuàng)作、商業(yè)攝影、專業(yè)視頻編輯、商業(yè)設(shè)計等其他領(lǐng)域,文生視頻功能的載入,都能吸引一批“荷包更鼓”的B端用戶。
但對于“不缺錢”的互聯(lián)網(wǎng)大廠如字節(jié)等短視頻平臺,“卷”文生視頻賽道,還有著關(guān)乎核心業(yè)務(wù)的重要考量。
在文生視頻領(lǐng)域動作頻頻的剪映,既是視頻創(chuàng)作的工具,也和抖音的內(nèi)容生態(tài)息息相關(guān)。而面對快手可靈的“先發(fā)制人”,美圖開拍等APP的緊逼,對于持續(xù)引導(dǎo)視頻創(chuàng)作者在創(chuàng)作完成后“一鍵發(fā)布到平臺”的大廠來說,對創(chuàng)作入口的爭奪,直接關(guān)聯(lián)著背后內(nèi)容生態(tài)的建構(gòu)過程。
此外,無論是由抖音和博納合作的AI科幻短劇《三星堆:未來啟示錄》,還是快手原創(chuàng)的AI奇幻短劇《山海奇鏡之劈波斬浪》,對于巨頭APP如抖音、快手而言,文生視頻的AI技術(shù)也能夠更大程度地豐富平臺內(nèi)容。
同時,頭豹研究院數(shù)據(jù)顯示,2021年中國AI視頻生成行業(yè)的市場規(guī)模為800萬元,預(yù)計2026年,這一市場規(guī)模將達到92.79億元。截至2023年底,該賽道已經(jīng)出現(xiàn)了獨角獸公司:Midjourney估值100億美元,Stability AI估值40億美元,Runway估值15億美元。而年初爆火出圈的Pika,剛剛成立不到一年,已于6月5日,宣布完成8000萬美元B輪融資,估值達到4.7億美元。
根據(jù)非凡產(chǎn)研數(shù)據(jù),2024年上半年,僅文生視頻領(lǐng)域全球有18次融資活動,其中12起融資都集中在國內(nèi),其中愛詩科技A輪融資達1億元,生數(shù)科技A輪融資達數(shù)億元,千萬甚至億級的融資數(shù)額,也展示了資本市場對文生視頻的熱切關(guān)注。
需要不斷融資滿足單月百萬級別大模型運行費用的AI創(chuàng)企,想要把握投資人的心,也需要文生視頻這個新故事。
三
但想用AI視頻引流、做商業(yè)化,對資本市場講出新故事,仍面臨重重挑戰(zhàn)。
2月中旬,OpenAI的文生視頻模型Sora引發(fā)熱議,可以生成長達1分鐘的流暢視頻,盡管3月OpenAI CTO已透露計劃“今年晚些時候”正式推出Sora,但迄今為止,Sora仍未開放公測,僅向一些藝術(shù)家定向提供內(nèi)測。
遲遲不進行公測的Sora,或許指向的正是AI視頻生成的質(zhì)量問題。曾擔(dān)任阿里巴巴智能設(shè)計實驗室負責(zé)人,打造了AI設(shè)計平臺“魯班”的特看科技創(chuàng)始人吳春松(花名樂乘),也面向國內(nèi)出海商家和海外本土企業(yè)推出了視頻AIGC生成平臺,他表示,“在產(chǎn)品面向C端用戶的初期,用文生視頻需要嘗試25次,才能生成一次可用的視頻,對于用戶來說,抽卡概率太低。”
B站某UP主則告訴字母榜,如今用國內(nèi)幾家文生視頻大模型,“想要生成和文字描述準(zhǔn)確的結(jié)果,很多情況下更看運氣,嘗試10次下來,調(diào)整后有3-4次能用,就已經(jīng)是技術(shù)做得很不錯的模型了。”
為了解決文生視頻質(zhì)量不穩(wěn)定的問題,特看科技通過“文生圖、圖生視頻”的技術(shù)迭代,讓AI視頻生成成功的概率從1/25提升到1/10(生成10次成功1次)。但對于專業(yè)的視頻創(chuàng)作者來說,想要真正地實現(xiàn)用AI生成可用度較高的商用視頻,就不能只是社交平臺上風(fēng)靡的“復(fù)活老照片”這類簡單易復(fù)制的操作,對于AI生成視頻的分鏡、劇情的準(zhǔn)確性,甚至鏡頭效果的美觀程度和一致性,都提出了更高的要求。
反觀現(xiàn)在國內(nèi)的視頻大模型,即使是在時長和準(zhǔn)確度上表現(xiàn)不錯的可靈,也因為“平臺用來訓(xùn)練模型的基礎(chǔ)語料仍然不夠,跳出擅長的美食和人像領(lǐng)域,視頻生成的準(zhǔn)確度就會下降。”
除了生成質(zhì)量不穩(wěn)定之外,文生視頻的商業(yè)化路徑也也并不容易走通。
除了坐擁美圖秀秀這一穩(wěn)定流量入口的美圖,即便是國內(nèi)的短視頻超級APP抖音和快手,也尚未打造出破圈的商業(yè)化作品,更多依然是與影視制作團隊的內(nèi)部合作項目。
即便選擇了出海,包括5月在海外用戶量已經(jīng)高達176萬的愛詩科技PixVerse、在海外音視頻剪輯領(lǐng)域占據(jù)頭部的字節(jié)Capcut,商業(yè)化路徑也并不明晰。在出海的AI視頻工具內(nèi),只有HeyGen由于為企業(yè)定制營銷數(shù)字人視頻,在一年內(nèi)實現(xiàn)了從100萬美元到3500萬美元的增長。
模糊不清的商業(yè)化路徑,加上單月百萬級別的研發(fā)成本,對于AI大模型廠商們來說,文生視頻這場“大考”,恐怕并不好過。
仍處在賠本賺吆喝階段的文生視頻賽道,某種程度上也給了張一鳴更多追趕的時間。
編者按:本文轉(zhuǎn)載自微信公眾號:字母榜(ID:wujicaijing),作者:馬舒葉
前瞻經(jīng)濟學(xué)人
專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。