做不出GPT,字節(jié)云曲線救國
圖源;攝圖網(wǎng)
作者|樟稻 來源|科技新知(ID:kejixinzhi)
火山引擎的大模型訓(xùn)練云野望。
“大語言模型改變?cè)朴?jì)算游戲規(guī)則”,李彥宏的這則斷言,愈發(fā)成為云計(jì)算行業(yè)的共識(shí)。
可以從兩方面來解釋這種新變化。一方面,大語言模型在訓(xùn)練和推理過程中需要大量的計(jì)算資源,即算力。而這些需求催生了云計(jì)算廠商為模型訓(xùn)練提供更強(qiáng)大、更高效的計(jì)算資源。
作為佐證,投資機(jī)構(gòu)A16Z認(rèn)為,生成式AI市場里的大量資金,其實(shí)最終流向了基礎(chǔ)設(shè)施公司。
A16Z估計(jì),應(yīng)用公司平均將約20%-40%的年收入,用于推理和定制化的微調(diào)。這部分通常直接支付給云服務(wù)提供商,以獲取實(shí)例或支付給第三方模型提供商,而后者將大約一半的收入投入于云基礎(chǔ)設(shè)施。據(jù)此有理由推測,生成式AI總營收的10%-20%將流向云服務(wù)提供商。
不僅如此,A16Z估算,許多擁有自家模型的初創(chuàng)公司已籌集到數(shù)十億美元的風(fēng)險(xiǎn)投資,其中大部分資金(在早期階段高達(dá)80%-90%),通常會(huì)支付給云服務(wù)提供商。這可是流向云廠商的“一大筆錢”。
另一方面,大語言模型的興起,讓許多復(fù)雜任務(wù)可以通過預(yù)訓(xùn)練模型來解決。企業(yè)無需擁有龐大的技術(shù)團(tuán)隊(duì)和資源,就能利用云計(jì)算服務(wù)快速實(shí)現(xiàn)AI應(yīng)用。
簡單來說,模型即服務(wù)(Model as a Service,MaaS)將成為新的云計(jì)算服務(wù)形式。企業(yè)可以通過API調(diào)用預(yù)訓(xùn)練模型來滿足自身業(yè)務(wù)需求,而這降低了云計(jì)算服務(wù)的使用門檻。
微軟是最典型的案例。眼下,Azure OpenAI服務(wù)已經(jīng)普遍可用,企業(yè)可以申請(qǐng)?jiān)L問包括GPT-3.5、Codex和DALL?E 2在內(nèi)的人工智能模型。目前,已經(jīng)使用Azure OpenAI的客戶有半導(dǎo)電視臺(tái)、畢馬威、RPA廠商Moveworks等等。
得益于上述新變化,國內(nèi)云計(jì)算行業(yè)迎來新的發(fā)展契機(jī)和活力,特別是在如今的低增長速度背景下,更加鼓舞人心。
此前,市場研究機(jī)構(gòu)IDC在2022年底的預(yù)測報(bào)告中,將中國云計(jì)算行業(yè)未來五年的平均增長速度下調(diào)了10%。這是考慮到互聯(lián)網(wǎng)行業(yè)整體增速放緩的影響,同時(shí)政企集成業(yè)務(wù)也在調(diào)整過程中。多方因素共同導(dǎo)致了互聯(lián)網(wǎng)云廠商普遍降低了業(yè)務(wù)預(yù)期。
從這個(gè)角度出發(fā),便能理解為何眾多云服務(wù)廠商,如此熱衷于成為國內(nèi)大模型熱潮中的舵手。
01
“賣鏟子”的火山引擎
當(dāng)前,大模型成為科技領(lǐng)域最熱門的話題。在中國,至少有數(shù)十家企業(yè)和機(jī)構(gòu)已經(jīng)發(fā)布了大模型產(chǎn)品或公布了相關(guān)計(jì)劃。作為互聯(lián)網(wǎng)領(lǐng)域的翹楚,字節(jié)跳動(dòng)自然不會(huì)缺席這場AI競賽。
據(jù)《晚點(diǎn)LatePost》報(bào)道,面對(duì)ChatGPT和背后的大模型機(jī)會(huì),張一鳴選擇親自跟進(jìn)。一位字節(jié)人士稱,張一鳴近期時(shí)常會(huì)和一些字節(jié)人士分享論文學(xué)習(xí)心得和對(duì)ChatGPT的思考。
據(jù)了解,字節(jié)今年初才開始組建專門的大模型團(tuán)隊(duì),但一把手的跟進(jìn)也意味著諸多資源傾斜。果不其然,近日,在BAT先后展示自己在大模型產(chǎn)品領(lǐng)域的進(jìn)展后,字節(jié)終于亮出了自己手中“另類”的牌。
字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎舉辦的“原動(dòng)力大會(huì)”上,火山引擎總裁譚待表示,火山引擎不做大模型,而是服務(wù)客戶做好大模型,為企業(yè)和消費(fèi)者提供更豐富的AI應(yīng)用。
進(jìn)一步解讀,眼下國內(nèi)很多科技公司投入到大模型建設(shè)中,火山引擎要做的就是為大模型客戶提供高穩(wěn)定性和高性價(jià)比的AI基礎(chǔ)設(shè)施。
曾經(jīng)的北美淘金熱時(shí)期,尋找黃金的人們需要購買鏟子等必備工具,而出售這些商品的商人賺取了可觀的利潤。在現(xiàn)代商業(yè)環(huán)境中,“賣鏟子”這一說法常常用于形容為他人提供工具、服務(wù)或基礎(chǔ)設(shè)施的公司,而非直接參與某個(gè)行業(yè)的競爭?;鹕揭娲舜蜗胱龅谋闶窃诖竽P蜔岢敝?ldquo;賣鏟子”。
后續(xù)的宣傳環(huán)節(jié)中,有兩個(gè)噱頭十分玩味。一是,火山引擎宣稱,中國的大模型領(lǐng)域,七成以上已是其客戶。面對(duì)媒體群訪,譚待解釋道,上述“七成”是火山引擎相關(guān)客戶與第三方機(jī)構(gòu)統(tǒng)計(jì)的大模型企業(yè)數(shù)量之比,能獲得這么多客戶是因?yàn)闄C(jī)器學(xué)習(xí)平臺(tái)解決了算力輔助的問題。
二是,為了讓更多潛在客戶安心,譚待在多個(gè)場合公開表示,火山引擎不做大模型。“我們不急于推出一個(gè)只有30分且只能適用于本地部署的大模型,這不是最關(guān)鍵的,核心是賦能其他人做這件事情。”
這幾乎是公然叫囂其他大模型參與者,特別是前不久剛剛放言“不用造輪子”的云廠商們。
拿阿里云來說,此前的云峰會(huì)上宣傳口徑是,阿里云希望幫助更多企業(yè)用上大模型,讓每家企業(yè)都能基于“通義千問”,擁有具備自己行業(yè)能力的專屬大模型。換句話說,在阿里巴巴提供的算力基礎(chǔ)設(shè)施、機(jī)器學(xué)習(xí)平臺(tái)以及大模型服務(wù)的支持下,企業(yè)們不再需要浪費(fèi)時(shí)間和精力去“造輪子”,或是陷入針對(duì)大模型通用能力的無謂競爭。
百度也是同道中人。李彥宏認(rèn)為自家三月發(fā)布的文心一言距離GPT的差距大概在兩個(gè)月,并且認(rèn)為國內(nèi)大模型創(chuàng)業(yè)已經(jīng)基本沒有機(jī)會(huì),大家也沒必要在大模型上重復(fù)造輪子。為此,還引發(fā)了王小川的揶揄。
在阿里、百度先后公布大模型策略后,火山引擎拿出更低的姿態(tài),顯然是在丟掉時(shí)機(jī)優(yōu)勢后,寄希望于彎道超車。畢竟,哪個(gè)創(chuàng)業(yè)者沒有成為中國OpenAI的夢呢?
02
字節(jié)云需要更多王小川
“賣鏟子”商業(yè)模式的核心,是鼓吹更多淘金者加入。
歷史上,加州淘金熱期間,當(dāng)?shù)貓?bào)紙發(fā)表了關(guān)于在若干地點(diǎn)發(fā)現(xiàn)金子的文章,迅速引發(fā)了廣泛的關(guān)注。一些商人和企業(yè)便利用淘金熱來推廣他們的產(chǎn)品和服務(wù)。例如,郵輪公司和鐵路公司為了吸引更多的乘客,大肆宣傳推銷前往淘金地區(qū)的船票和車票。
放到此次大模型熱潮中,火山引擎想要靠“賣鏟子”發(fā)家致富,自然需要站在“王小川們”這一邊。
為此,火山引擎造了“多云多模態(tài)”這個(gè)概念。譚待表示,在大模型及下游應(yīng)用發(fā)展推動(dòng)下,無論傳統(tǒng)企業(yè)還是初創(chuàng)企業(yè),對(duì)AI算力都有迫切需求,企業(yè)使用多家云服務(wù)將成為常態(tài)。同時(shí),各行業(yè)有自己高質(zhì)量的私有語料,大模型不會(huì)一家獨(dú)大,而是會(huì)在千行百業(yè)生長,形成多模型共生甚至協(xié)作的生態(tài)。“未來將是‘多云多模型’的時(shí)代。”
對(duì)于該論斷,王慧文(美團(tuán)聯(lián)合創(chuàng)始人)、賈揚(yáng)清(原阿里技術(shù)副總裁)、周伯文(原京東高級(jí)副總裁)、李巖(快手前 MMU 負(fù)責(zé)人)、閆俊杰(原商湯科技副總裁)等創(chuàng)業(yè)者肯定贊同。
不過,這里也還有一些不確定因素。其一,王小川等創(chuàng)業(yè)者一定會(huì)用火山引擎賣的“鏟子”嗎?
簡單來說,火山引擎主要是為大模型客戶提供AI基礎(chǔ)設(shè)施,可以理解為AI算力需求。而對(duì)于算力需求,王小川并沒有直言通過云廠商來滿足。
此前在參訪中,王小川認(rèn)為中國可以購買的英偉達(dá)A800和A100芯片性能差距只有5%,目前不會(huì)成為“卡脖子”的瓶頸,尤其對(duì)未來國產(chǎn)芯片有一定技術(shù)突破特別有信心。
簡單來說,對(duì)于王小川等創(chuàng)業(yè)者而言,是否“借道”云廠商們猶未可知。
其二,火山引擎是否會(huì)堅(jiān)守不涉及大模型的立場?
據(jù)《晚點(diǎn) LatePost》披露,目前參與字節(jié)大模型的技術(shù)負(fù)責(zé)人有朱文佳、項(xiàng)亮、李航等,他們分屬字節(jié)多個(gè)部門。其中項(xiàng)亮、李航向火山引擎BU負(fù)責(zé)人楊震原匯報(bào)。
對(duì)于要不要做大模型,楊震源曾回應(yīng)稱字節(jié)跳動(dòng)對(duì)大模型也在做一些學(xué)習(xí)和研究,現(xiàn)在還沒有什么結(jié)果,也沒有大模型產(chǎn)品落地時(shí)間表。從這里來看,火山引擎并沒有宣傳中那樣堅(jiān)定路線。畢竟不做大模型,直接意味著云廠商少了模型及服務(wù)這條營收支線。
從這次整個(gè)宣傳動(dòng)作來看,火山引擎延續(xù)了一直以來的策略。此前,作為云市場的后來者,火山引擎的目標(biāo)是做阿里云、騰訊云、華為云之外的“第四朵云”。
對(duì)此,多云成為火山引擎反復(fù)強(qiáng)調(diào)的一個(gè)宣傳點(diǎn)。RightScale在2019年對(duì)全球企業(yè)用云策略的調(diào)查顯示,超過1000人的大型企業(yè)中,選擇多云部署的占比達(dá)到84%,其中混合云占比達(dá)到58%。這種多云策略,或是字節(jié)跳動(dòng)擴(kuò)大市場份額的轉(zhuǎn)機(jī)。
而這次,火山引擎在多云的基礎(chǔ)上還加上了多模態(tài)。
不過,根據(jù)IDC最近發(fā)布的《中國公有云服務(wù)市場(2022上半年)跟蹤報(bào)告》顯示,2022年上半年,阿里云、華為云、天翼云、騰訊云和AWS這五大云廠商一直占據(jù)了70%以上的市場份額?;鹕揭嫒匀惶幱诿灰娊?jīng)傳的其他廠商(Others)之列。
顯然,在這個(gè)已經(jīng)相對(duì)成熟的云市場中,火山引擎想要突圍并不容易。后發(fā)者想要顛覆格局,天時(shí)地利人和缺一不可,大模型熱潮可以看作機(jī)會(huì)窗口打開,但結(jié)局到底如何還要取決于字節(jié)團(tuán)隊(duì)的深耕細(xì)作。
編者按:本文轉(zhuǎn)載自微信公眾號(hào):科技新知(ID:kejixinzhi),作者:樟稻
前瞻經(jīng)濟(jì)學(xué)人
專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。