月之暗面撞上算力墻?
作者|趙晉杰 來(lái)源|字母榜(ID:wujicaijing)
“不好意思,剛剛和Kimi聊的人太多了。Kimi有點(diǎn)累了,可以晚點(diǎn)再問(wèn)我一遍。”近期正在趕畢業(yè)論文的婁曉彤,時(shí)不時(shí)仍會(huì)收到AI助手Kimi無(wú)法使用的提示。
作為大模型初創(chuàng)公司月之暗面旗下的To C應(yīng)用,自3月份更新成為國(guó)內(nèi)首個(gè)支持200萬(wàn)字上下文的大模型產(chǎn)品后,Kimi爆火出圈,QuestMobile數(shù)據(jù)顯示,Kimi 應(yīng)用月活用戶量在3月份飆升至589.7萬(wàn),但算力焦慮也隨之而來(lái)。即便距產(chǎn)品更新已經(jīng)過(guò)去一個(gè)多月,婁曉彤的遭遇仍在部分用戶身上逐一上演。
月之暗面向字母榜解釋稱,“其實(shí)是因?yàn)槊刻於加邢鄬?duì)的高峰期和低谷期,高峰期可能會(huì)遇到(類似婁曉彤的)情況。”
每次產(chǎn)品更新,對(duì)大模型公司而言都是一次流量和算力的雙重考驗(yàn)。在3月18日宣布支持200萬(wàn)字上下文后,彼時(shí)Kimi便遭遇一次大規(guī)模宕機(jī):從3月21日開始,Kimi APP和小程序被爆均無(wú)法正常使用。月之暗面隨后發(fā)布情況說(shuō)明,“觀測(cè)到Kimi的系統(tǒng)流量持續(xù)異常增高,流量增加的趨勢(shì)遠(yuǎn)超對(duì)資源的預(yù)期規(guī)劃。”
理論上,Kimi等AI助手可以支持的用戶量幾乎沒(méi)有上限,只要大模型公司能夠提供源源不斷的算力供給,但這背后涉及的卻是一個(gè)現(xiàn)實(shí)的效率平衡問(wèn)題,在商業(yè)化尚未走向閉環(huán)的當(dāng)下,這也是一眾大模型產(chǎn)品的共同難題:配置冗余算力,難免帶來(lái)部分時(shí)間段內(nèi)的資源浪費(fèi);配置緊張算力,則不可避免會(huì)在高峰期內(nèi)影響用戶體驗(yàn)。
尚需投資儲(chǔ)備算力資源的月之暗面,在近期被爆出創(chuàng)始人楊植麟通過(guò)售出個(gè)人持股已套現(xiàn)數(shù)千萬(wàn)美元消息后,更是一時(shí)間引發(fā)諸多猜測(cè)。
被商業(yè)化絆住的不止Kimi。就連行業(yè)老大哥微軟推出的AI編程工具GitHub Copilot,哪怕已經(jīng)坐擁180萬(wàn)付費(fèi)用戶,仍陷在入不敷出狀態(tài):去年10月,月費(fèi)10美元的GitHub Copilot,被爆平均每個(gè)月在每個(gè)用戶身上都要倒貼20美元,最高能達(dá)80美元。
同樣困在商業(yè)變現(xiàn)中的OpenAI,為了盡可能追求效率平衡,在免費(fèi)版ChatGPT之外,特意設(shè)計(jì)出了付費(fèi)版ChatGPT Plus。高峰時(shí)段,ChatGPT Plus用戶將享有優(yōu)先使用權(quán),可以獲得更迅速的服務(wù)響應(yīng)。
但隨著用戶規(guī)模暴漲,自去年2月推出付費(fèi)版以來(lái),OpenAI曾幾度暫停ChatGPT Plus新用戶注冊(cè),給出的理由是“需求量過(guò)大”,導(dǎo)致算力資源出現(xiàn)缺口。
大模型產(chǎn)品的規(guī)模效應(yīng)和網(wǎng)絡(luò)效應(yīng)仍處在市場(chǎng)潛伏期。這也使得部分投資人開始對(duì)大模型產(chǎn)品去魅,典型代表如金沙江創(chuàng)投主管合伙人朱嘯虎,其在接受騰訊科技采訪中表示,從2023年下半年開始,自己便決定不再和美國(guó)同事開原定每周一次的遠(yuǎn)程例行會(huì)議,探討兩邊大模型產(chǎn)業(yè)格局變化,“打了半年我不打了,沒(méi)有意義。”相比期待大模型產(chǎn)品在未來(lái)某一時(shí)刻迎來(lái)“iPhone時(shí)刻”,朱嘯虎更在意當(dāng)下能馬上變現(xiàn)的To B應(yīng)用。
資本市場(chǎng)對(duì)大模型商業(yè)化的擔(dān)憂更是進(jìn)一步體現(xiàn)在剛剛發(fā)布財(cái)報(bào)的Meta身上。“即使將我們的許多現(xiàn)有資源轉(zhuǎn)移到人工智能上,在我們從這些新產(chǎn)品中獲得大量收入之前,我們?nèi)匀恍枰獢U(kuò)大我們的投資范圍……這將是一個(gè)持續(xù)多年的投資周期。”扎克伯格宣告擴(kuò)大對(duì)AI投資話音落地,當(dāng)?shù)貢r(shí)間4月25日,Meta股價(jià)盤后應(yīng)聲下跌超10%。
對(duì)于Kimi這類缺乏自身造血能力的大模型創(chuàng)業(yè)公司而言,相比Meta,其面臨的挑戰(zhàn)只多不少:在這場(chǎng)效率平衡游戲中,它們宛如行走在懸于空中的鋼絲繩上的雜技演員,投資款便是平衡木,到達(dá)對(duì)岸的唯一路徑,便是在投資款耗盡之前,找到能夠自我造血的商業(yè)模式。
一
春節(jié)期間,婁曉彤被身邊同學(xué)安利了Kimi,當(dāng)時(shí)Kimi支持的上下文長(zhǎng)度只有20萬(wàn)字。加上彼時(shí)還未出圈,在日常使用中,婁曉彤基本沒(méi)遇過(guò)無(wú)法使用情況。
隨著Kimi將上下文長(zhǎng)度擴(kuò)展到200萬(wàn)字,并通過(guò)在資本市場(chǎng)上衍生出Kimi概念股火速出圈,從3月中旬開始,婁曉彤遭遇Kimi提示“有點(diǎn)累了”的情況,逐漸多了起來(lái)。
婁曉彤正在遭遇的算力緊張,從Kimi誕生后便已是注定的局面。去年3月創(chuàng)立月之暗面后,楊植麟便定下了做產(chǎn)品的兩大思路:只做To C,且堅(jiān)持長(zhǎng)文本路線。
圖源:月之暗面官網(wǎng)截圖
文本長(zhǎng)度和算力成本之間不可調(diào)和的矛盾,以及To C和高額營(yíng)銷成本之間的取舍,成為擺在楊植麟面前的兩重平衡難題。
3月份Kimi借助支持200萬(wàn)字上下文出圈后,新浪科技曾報(bào)道稱,Kimi用戶獲客成本達(dá)到12元-13元,其每天獲客成本超過(guò)20萬(wàn)元。
大模型耗錢也早在楊植麟預(yù)料之中。“它需要人才聚集、資本聚集。”楊植麟形容道。
短短一年多時(shí)間內(nèi),月之暗面已經(jīng)拿下近百億人民幣投資:2023年,月之暗面完成兩輪總計(jì)近20億人民幣投資;今年2月份,月之暗面完成新一輪10億美元融資,由阿里巴巴領(lǐng)投,紅杉中國(guó)、小紅書、美團(tuán)等機(jī)構(gòu)跟投,投后估值超過(guò)25億美元。
近百億融資款,更多都被用以支付算力資源。據(jù)市界報(bào)道,新一輪10億美元融資款中,領(lǐng)投方阿里出資的8億美元并非全是現(xiàn)金,其中部分將以阿里云提供的算力結(jié)算。
這方面行業(yè)早有慣例。更早之前微軟百億美元投資OpenAI,其中大部分投資款便是以微軟云服務(wù)提供的算力資源結(jié)算。在微軟參投之前,OpenAI其實(shí)是從谷歌云服務(wù)采購(gòu)算力資源。如此一來(lái),微軟投出去的錢,大部分又以云服務(wù)的方式流了回來(lái)。
更重要的是,微軟還借此完成了股價(jià)飆升,總市值不僅突破3萬(wàn)億美元,更是超越蘋果,成為全球市值最高上市公司。
亞馬遜隨后便來(lái)了個(gè)有樣學(xué)樣。今年3月底,亞馬遜正式完成對(duì)OpenAI最強(qiáng)對(duì)手Anthropic 40億美元的投資。與OpenAI一樣,Anthropic也需要選擇亞馬遜作為其主要云服務(wù)商。
二
因算力資源而導(dǎo)致服務(wù)中斷的現(xiàn)象,不只發(fā)生在Kimi一家身上,包括文心一言、ChatGPT等,都曾出現(xiàn)過(guò)無(wú)法正常使用的情況。
據(jù)字母榜不完全統(tǒng)計(jì),每次產(chǎn)品更新升級(jí)的節(jié)點(diǎn),便是大模型產(chǎn)品可能迎接“崩盤”命運(yùn)的開始。
去年4月份,ChatGPT付費(fèi)版本推出2個(gè)月后,ChatGPT Plus被爆暫停新用戶注冊(cè),OpenAI給出的理由是“需求量過(guò)大”,導(dǎo)致算力資源出現(xiàn)缺口。付費(fèi)通道恢復(fù)正常后,OpenAI再次收緊GPT-4的互動(dòng)次數(shù),從每4小時(shí)100條消息降為每3小時(shí)25條消息。
7個(gè)月后的2023年11月,OpenAI在首屆開發(fā)者大會(huì)上帶來(lái)一系列產(chǎn)品更新:全新GPT-4 Turbo、自定義GPT以及上線GPT商店。在大會(huì)結(jié)束后的短短兩天內(nèi),ChatGPT服務(wù)器再次崩潰:用戶數(shù)量的激增又一次超過(guò)了OpenAI的算力容量。
作為OpenAI CEO的山姆·奧特曼都不得不親自下場(chǎng)致歉,稱新功能的熱度遠(yuǎn)遠(yuǎn)超出了公司預(yù)期。“由于負(fù)載的原因,短期內(nèi)可能會(huì)出現(xiàn)服務(wù)不穩(wěn)定的情況,對(duì)不起。”
最近一次“崩盤”發(fā)生在4月份。為了再次降低使用門檻,擴(kuò)大用戶量,在全球185個(gè)國(guó)家/地區(qū)累積超1億每周用戶量后,OpenAI宣布用戶無(wú)需注冊(cè)賬戶就可以使用ChatGPT,“我們正在逐步推出這一功能,目的是讓任何對(duì)其功能感興趣的人都可以使用人工智能。”
在OpenAI還沒(méi)來(lái)得及將上述新功能擴(kuò)散到全球所有地區(qū)時(shí),社交媒體上已經(jīng)陸續(xù)有用戶反饋,自己在與ChatGPT互動(dòng)時(shí)又被提示“系統(tǒng)錯(cuò)誤”了。
除了采購(gòu)更多算力資源來(lái)提升用戶體驗(yàn)之外,一眾大模型公司也在想方設(shè)法通過(guò)降低算力成本來(lái)滿足更多用戶需求。
截至4月份,國(guó)內(nèi)文心大模型推理性能被爆提升了105倍,推理成本降到了原來(lái)的1%。這意味著,客戶原來(lái)一天調(diào)用1萬(wàn)次,同樣成本現(xiàn)在可以調(diào)用100萬(wàn)次。
國(guó)外OpenAI的奧特曼,更是在近期接受采訪時(shí)預(yù)言,“我們(OpenAI)可以將非常高質(zhì)量的AI技術(shù)成本降至接近零……如果我們沒(méi)有制造足夠的計(jì)算資源、供應(yīng)和需求失衡,或計(jì)算成本攀升,這將導(dǎo)致AI成本非常高。”在奧特曼看來(lái),未來(lái)AI技術(shù)成本將會(huì)變得越來(lái)越便宜。
三
使用更高效的硬件,便是推動(dòng)AI技術(shù)成本降低的直接手段。
幾乎在奧特曼預(yù)測(cè)AI技術(shù)成本將變得越來(lái)越便宜的同一時(shí)期,英偉達(dá)創(chuàng)始人黃仁勛又來(lái)給OpenAI送芯片,這次是量產(chǎn)最強(qiáng)一代的全球第一臺(tái)Nvidia DGX H200超級(jí)計(jì)算機(jī)。OpenAI總裁格雷格·布羅克曼還特意曬出了自己、奧特曼與黃仁勛的三人大合照。
但對(duì)于已經(jīng)無(wú)法獲得英偉達(dá)最強(qiáng)芯片的中國(guó)大模型公司而言,借助人才優(yōu)化算法以減少算力需求,則是另一條降低AI技術(shù)成本的路徑。
4月23日,界面新聞爆出楊植麟通過(guò)售出個(gè)人持股已套現(xiàn)數(shù)千萬(wàn)美元消息后,月之暗面隨即對(duì)外回應(yīng)稱“消息不實(shí)”,并向媒體發(fā)來(lái)了一則招聘文章說(shuō)明,里面重點(diǎn)提到,為了吸引并留住最優(yōu)秀的人才,月之暗面推出全新員工激勵(lì)計(jì)劃,為優(yōu)秀人才提供匹配其貢獻(xiàn)的豐厚回報(bào)。“從今年開始,我們將在公司取得重要進(jìn)展時(shí)發(fā)起員工期權(quán)回購(gòu)計(jì)劃,確保團(tuán)隊(duì)成員能夠分享公司發(fā)展的果實(shí)(2024年底啟動(dòng)首次期權(quán)回購(gòu)計(jì)劃)。每年定期根據(jù)工作表現(xiàn)進(jìn)行調(diào)薪和期權(quán)增發(fā),確保薪酬和期權(quán)充分反映出員工個(gè)人的成長(zhǎng)和貢獻(xiàn)。”
由此,外界也猜測(cè)楊植麟團(tuán)隊(duì)此次套現(xiàn),其中或許便包括對(duì)重要人才的貢獻(xiàn)獎(jiǎng)勵(lì)。
在公司創(chuàng)立伊始,楊植麟給出的早期招人畫像便是專注找對(duì)口的genius(天才)。“公司上限是由人的上限決定的……之前有對(duì)模型動(dòng)手術(shù)的能力,有訓(xùn)練超大規(guī)模模型直接的經(jīng)驗(yàn),就可以很快做出來(lái)。包括Kimi發(fā)布,資本效率和組織效率其實(shí)很高。”
與國(guó)內(nèi)相比,硅谷AI人才之爭(zhēng),更為瘋狂。馬斯克本人都不得不感慨:“這是我見過(guò)最瘋狂的人才大戰(zhàn)。”為了避免特斯拉人才外流,馬斯克旗下的大模型公司xAI開出了不少offer。
扎克伯格更是親力親為,通過(guò)個(gè)人電子郵件給谷歌DeepMind團(tuán)隊(duì)成員發(fā)去邀請(qǐng),希望他們能加入Meta與他共事。谷歌創(chuàng)始人謝爾蓋·布林,為了挽留即將離職轉(zhuǎn)投OpenAI的員工,也同樣選擇親自出馬,給員工加薪加福利。
人才大戰(zhàn)之下,根據(jù)薪資數(shù)據(jù)網(wǎng)站 Levels.fyi數(shù)據(jù),硅谷機(jī)器學(xué)習(xí)和AI工程師的薪酬中位數(shù)已經(jīng)接近 40萬(wàn)美元,OpenAI總薪資中位數(shù)甚至高達(dá)92.5萬(wàn)美元(包括期權(quán))。
盡管為爭(zhēng)奪AI人才,科技巨頭開支增加,但他們的一系列瘋狂舉動(dòng)已經(jīng)在股價(jià)上迎來(lái)正反饋:2024年剛過(guò)完4個(gè)月,Meta股價(jià)年內(nèi)已經(jīng)大漲22%,谷歌大漲19%,亞馬遜大漲19%。
參考資料:
《ChatGPT 之父最新演講:GPT-5 聰明程度超乎想象,一大批 AI 初創(chuàng)公司的努力將變得毫無(wú)意義》APPSO
《黃仁勛親自給OpenAI送貨,全球首臺(tái)DGX H200開箱了》機(jī)器之心
《如何評(píng)價(jià)月之暗面創(chuàng)始人楊植麟一年套現(xiàn)數(shù)千萬(wàn)美金事件?》鈦媒體
《月之暗面創(chuàng)始人楊植麟套現(xiàn)數(shù)千萬(wàn)美金》界面新聞
《月之暗面楊植麟復(fù)盤大模型創(chuàng)業(yè)這一年:向延綿而未知的雪山前進(jìn)》騰訊科技
《搞大模型巨虧,微軟都還沒(méi)掙到錢!GitHub Copilot每月收10刀,倒賠20》量子位
《Kimi創(chuàng)始人套現(xiàn)4000萬(wàn)美元疑云》市界
編者按:本文轉(zhuǎn)載自微信公眾號(hào):字母榜(ID:wujicaijing),作者:趙晉杰
前瞻經(jīng)濟(jì)學(xué)人
專注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。