囤上千英偉達(dá)芯片浮盈即過億,國(guó)產(chǎn)大模型的路更難走了
(圖片來源:攝圖網(wǎng))
作者|趙晉杰 來源|字母榜(ID:wujicaijing)
從事大模型開發(fā)的國(guó)內(nèi)創(chuàng)業(yè)者李鵬,最近切身感受了一把AI芯片行業(yè)的瘋狂。
今年4月份,李鵬以單個(gè)近8萬元的價(jià)格,下單了上千英偉達(dá)A800芯片,10月中旬收到貨后,隨即迎來美國(guó)對(duì)高性能AI芯片的進(jìn)一步限制。國(guó)內(nèi)A800芯片價(jià)格應(yīng)聲上漲,至10月20日,其單個(gè)價(jià)格已經(jīng)漲至約30萬元。這意味著,李鵬手里這批A800芯片,浮盈已經(jīng)破億元。
英偉達(dá)芯片價(jià)格暴漲的背后,離不開美國(guó)商務(wù)部工業(yè)與安全局(BIS)出臺(tái)的AI芯片出口管制新規(guī)定。美東時(shí)間10月17日,BIS在去年10月對(duì)AI芯片帶寬速度做出限制的基礎(chǔ)上,正式公布了把性能密度作為限制新標(biāo)準(zhǔn)的相關(guān)要求,并提供了30天緩沖期。
在新規(guī)影響下,英偉達(dá)原本針對(duì)中國(guó)市場(chǎng)推出的A100/H100的定制版芯片A800/H800,因?yàn)槌瑯?biāo)也將被全面禁售。
除此之外,BIS還希望借助對(duì)芯片性能密度的新限制,防止中國(guó)廠商通過Chiplet封裝技術(shù)進(jìn)行多個(gè)芯片的拼接,從而達(dá)到提升芯片整體性能的目的。華為在Mate 60 Pro上回歸的5G芯片,就曾一度被外界揣測(cè)為是通過Chiplet封裝技術(shù)實(shí)現(xiàn)了媲美7nm的工藝性能。
按照美國(guó)商務(wù)部長(zhǎng)雷蒙多的說法,AI芯片的出口管制規(guī)定將至少每年更新一次,以便盡可能封堵中國(guó)獲取先進(jìn)AI芯片的漏洞。
在李鵬見證A800芯片價(jià)格暴漲之際,英偉達(dá)針對(duì)游戲市場(chǎng)發(fā)行的RTX 4090顯卡,也走上了身價(jià)暴漲之路。
作為全球消費(fèi)級(jí)產(chǎn)品界配置最高、性能最強(qiáng)大的顯卡,RTX 4090因?yàn)樾阅苊芏瘸瑯?biāo)而被列入禁售名單。受此消息影響,從10月18日開始,國(guó)內(nèi)電商渠道的RTX 4090顯卡一度顯示缺貨,價(jià)格更是從原本的15000元左右,快速飆升至3萬-5萬元。
不過,在美國(guó)繼續(xù)執(zhí)行“小院高墻(small yard, high fence)”方針之下,BIS將限制鎖定在了有限范圍內(nèi),仍然允許出口用于筆記本、智能手機(jī)、游戲應(yīng)用等消費(fèi)類應(yīng)用的芯片,但對(duì)于少量高端游戲芯片則制定了許可通知要求。
英偉達(dá)能否順利申請(qǐng)到RTX 4090顯卡的出口許可,眼下仍存在變數(shù)。字母榜就此向英偉達(dá)在國(guó)內(nèi)的合作商之一七彩虹求證,后者表示暫時(shí)還不清楚后續(xù)能否繼續(xù)售賣RTX 4090顯卡產(chǎn)品。
但市場(chǎng)已經(jīng)率先給出了樂觀反饋。到10月20日,國(guó)內(nèi)電商渠道RTX 4090顯卡已經(jīng)很少顯示缺貨狀態(tài),價(jià)格也回落到2萬-3萬元。
相比有可能“虛驚一場(chǎng)”的RTX 4090顯卡被禁風(fēng)波,英偉達(dá)A800/H800芯片被禁,幾乎已是板上釘釘?shù)氖聦?shí)。
在回應(yīng)美國(guó)升級(jí)對(duì)中國(guó)AI芯片監(jiān)管措施的影響時(shí),英偉達(dá)在公告中提到,“考慮到全球?qū)τミ_(dá)產(chǎn)品需求強(qiáng)勁,預(yù)計(jì)不會(huì)對(duì)財(cái)務(wù)業(yè)績(jī)產(chǎn)生短期有意義的影響。”
但長(zhǎng)期來看,中國(guó)市場(chǎng)的缺失,將對(duì)英偉達(dá)造成無可避免的沖擊。在今年二季度財(cái)報(bào)會(huì)上,英偉達(dá)CEO黃仁勛就曾對(duì)此表態(tài),認(rèn)為一旦長(zhǎng)期向中國(guó)銷售數(shù)據(jù)中心GPU的禁令實(shí)施,將導(dǎo)致英偉達(dá)產(chǎn)業(yè)失去在全球最大市場(chǎng)之一競(jìng)爭(zhēng)和領(lǐng)先的機(jī)會(huì)。
將要遭遇長(zhǎng)期陣痛的不止英偉達(dá)。對(duì)于一眾國(guó)內(nèi)大模型廠商而言,英偉達(dá)芯片的斷供,或?qū)⒊蔀槠渥汾sChatGPT乃至GPT-4的最大阻力。
一
盡管有部分聲音認(rèn)為巨型人工智能模型的時(shí)代正在走向終結(jié),但在OpenAI CEO奧特曼看來,模型性能的縮放法則(scaling laws)仍然有效,增加模型的大小將繼續(xù)提高性能,奧特曼甚至提出了芯片需求每三四個(gè)月就要翻一番的大模型時(shí)代“摩爾定律”。
根據(jù)DeepMind聯(lián)合創(chuàng)始人、現(xiàn)Inflection AI CEO穆斯塔法?蘇萊曼爆料,OpenAI正在秘密訓(xùn)練的GPT-5,其所需英偉達(dá)芯片數(shù)量預(yù)估在30000—50000個(gè)H100。
哪怕國(guó)內(nèi)大廠如阿里、騰訊、百度等都表態(tài)稱在新規(guī)出臺(tái)之前,已經(jīng)提前采購(gòu)了一批芯片且部署到位,但面對(duì)仍在大模型技術(shù)上持續(xù)迭代中的OpenAI,不想在大模型競(jìng)爭(zhēng)中掉隊(duì)的國(guó)內(nèi)大廠,其芯片儲(chǔ)備是否足夠應(yīng)付未來的競(jìng)爭(zhēng),仍是個(gè)問題。
8月份,百度、騰訊、阿里、字節(jié)被爆出向英偉達(dá)下了一筆累計(jì)達(dá)10億美元的交付訂單,總共采購(gòu)約10萬個(gè)A800芯片,明年交付的AI芯片價(jià)值更是達(dá)到40億美元。明年的訂單大概率已經(jīng)沒有指望,即便年內(nèi)的10萬個(gè)A800芯片順利交付,分?jǐn)傁聛砻考掖髲S的份額也只有2.5萬個(gè),遠(yuǎn)不足以支撐它們跟上GPT-5的腳步。
且從BIS給英偉達(dá)預(yù)留的30天緩沖期來看,這也切斷了國(guó)內(nèi)大廠趕在禁令生效前搶購(gòu)一波的幻想。
據(jù)CoreWeave聯(lián)合創(chuàng)始人兼CTO Brian Venturo說法,今年一季度,獲取英偉達(dá)GPU還相對(duì)容易,但從4月份開始,市場(chǎng)忽然變得異常緊張,交貨時(shí)間已經(jīng)需要排到2024年一季度甚至二季度。
字母榜向李鵬求證,上述交貨時(shí)間得到驗(yàn)證,據(jù)其透露,向英偉達(dá)發(fā)出訂單需求后,要等待六七個(gè)月才能拿到貨。
更糟糕的情況還在于,英偉達(dá)還將繼續(xù)在“黃氏定律”指導(dǎo)下,每六個(gè)月推出一款新AI芯片,屆時(shí),連定制版都無法獲取的國(guó)內(nèi)大廠,在硬件配置上與美國(guó)競(jìng)爭(zhēng)對(duì)手的差距可能越拉越大。
一旦英偉達(dá)芯片全面斷供成真,留給大廠的替代方案或許只剩更換國(guó)產(chǎn)GPU廠商這一條路。
近期三季度財(cái)報(bào)發(fā)布會(huì)上,科大訊飛副總裁江濤就對(duì)此表示,訊飛星火大模型不受英偉達(dá)芯片斷供影響,其采用的華為昇騰910B能力已經(jīng)基本做到可對(duì)標(biāo)英偉達(dá)A100。
但頭部云廠商大模型研發(fā)工程師吳偉告訴字母榜,從單一芯片來看,部分國(guó)內(nèi)GPU芯片或許已經(jīng)可以媲美A800乃至A100,但在多卡串聯(lián)的并行計(jì)算環(huán)節(jié),仍然存在較大差距。
微軟大中華區(qū)Azure事業(yè)部總經(jīng)理陶然同樣秉持這樣的觀點(diǎn),認(rèn)為很多廠商沒有能力去實(shí)現(xiàn)多卡連接,但多卡并行運(yùn)算卻直接決定著大模型訓(xùn)練所需花費(fèi)的時(shí)間成本,“同樣的一套模型,如果訓(xùn)練一次需要花費(fèi)一周成本為100萬美元,但如果帶寬太小最終耗時(shí)兩周,那成本就將乘以2。”
在崇尚效率的大模型賽道,時(shí)間有時(shí)比金錢更重要。使用大廠自研芯片,同樣存在類似的費(fèi)效比問題。
在實(shí)際應(yīng)用中,據(jù)吳偉介紹,大廠自研芯片更多被用來執(zhí)行推理任務(wù),即在由英偉達(dá)芯片訓(xùn)練好的大模型上,大廠借助自研芯片,保證大模型的日常運(yùn)行。
即便是在更換國(guó)產(chǎn)GPU的過程中,大廠眼下也面臨無法使用更先進(jìn)制程工藝芯片的挑戰(zhàn)。BIS已經(jīng)將壁仞、摩爾線程等國(guó)產(chǎn)GPU公司列入實(shí)體清單,這意味著在沒有獲得許可情況下,它們既不能進(jìn)口含有美國(guó)公司的任何技術(shù)或產(chǎn)品,也不能通過臺(tái)積電等代工廠生產(chǎn)14nm以下的先進(jìn)芯片。
另一個(gè)不容忽視的影響是,更先進(jìn)芯片往往還會(huì)通過不斷的技術(shù)迭代,幫助降低大模型的運(yùn)行成本。黃仁勛就曾表示,“H100可以將大語(yǔ)言模型的處理成本降低一個(gè)數(shù)量級(jí)。”
一旦大模型訓(xùn)練成本變得更低,客戶調(diào)用大模型API接口的價(jià)格也將變得更便宜。屆時(shí),國(guó)內(nèi)大廠不僅要直面芯片性能落后的現(xiàn)實(shí),還將承擔(dān)起比海外競(jìng)爭(zhēng)對(duì)手更加高昂的大模型運(yùn)行成本。
二
國(guó)內(nèi)大廠并不是英偉達(dá)芯片斷供風(fēng)波中受影響最大的一方。相比大廠借助充沛資金提前儲(chǔ)備芯片的舉措,國(guó)內(nèi)大模型創(chuàng)業(yè)者所要迎接的震蕩,將更為劇烈。其中,又以研發(fā)通用大模型的創(chuàng)業(yè)者受沖擊更重。
近期,部分立志做通用大模型的創(chuàng)業(yè)公司,紛紛宣布融資消息:百川智能宣布完成3億美元新融資;智譜AI宣布完成超25億元累計(jì)融資。但眼下,這些原本可能用來購(gòu)買英偉達(dá)芯片的融資款,一時(shí)間沒了用武之地。
即便是那些盯著垂直領(lǐng)域研發(fā)行業(yè)大模型的創(chuàng)業(yè)公司,也同樣會(huì)受到波及。據(jù)李鵬介紹,部分參數(shù)量維持在數(shù)十億級(jí)別的行業(yè)大模型,理論上購(gòu)買大廠云資源就足以滿足需求。但對(duì)于想做出極致體驗(yàn)的創(chuàng)業(yè)公司來說,穩(wěn)定的算力仍是必不可少的條件。購(gòu)買大廠云資源,很可能遭遇公司算力需求擴(kuò)大而對(duì)方無法及時(shí)支援的情況。
但相比大廠,大模型創(chuàng)業(yè)公司在更換到國(guó)產(chǎn)GPU的過程中,除了需要付出更多時(shí)間成本的代價(jià)外,還可能因?yàn)樵谒惴ǚ矫娴亩贪?,人為制造出更大的追趕差距。
在人工智能專家丁磊博士看來,相比耗時(shí)一個(gè)月還是三個(gè)月訓(xùn)練好大模型,更大的挑戰(zhàn)在于當(dāng)前部分大模型創(chuàng)業(yè)公司“還不是那么會(huì)訓(xùn)練大模型……如果訓(xùn)練方法錯(cuò)的話,你有再多的GPU也沒用。”
在模型層創(chuàng)業(yè)之外,基于大模型的應(yīng)用層創(chuàng)業(yè)也可能會(huì)因?yàn)槊绹?guó)政府新的制裁措施,影響到業(yè)務(wù)發(fā)展。
據(jù)媒體爆料,美國(guó)政府還在考慮限制向中國(guó)AI公司出租云服務(wù),以堵上這些公司通過租賃微軟云的方式,從而規(guī)避對(duì)先進(jìn)制程芯片的出口禁令。
三
在國(guó)內(nèi)一眾大模型廠商業(yè)務(wù)遭遇沖擊或挑戰(zhàn)之際,作為風(fēng)暴中心的英偉達(dá),同樣難逃損失。
在美國(guó)政府傳出將對(duì)半導(dǎo)體技術(shù)實(shí)施新的出口限制,進(jìn)一步限制中國(guó)市場(chǎng)獲取A800和H800時(shí),黃仁勛曾在7月份接受采訪中表示,“如果我們被剝奪了中國(guó)市場(chǎng),我們沒有應(yīng)急措施。因?yàn)槭澜缟蠜]有其他中國(guó),只有一個(gè)中國(guó)。”
2022年,中國(guó)市場(chǎng)的營(yíng)收占到英偉達(dá)的約四成。美國(guó)半導(dǎo)體行業(yè)協(xié)會(huì)數(shù)據(jù)更是顯示,2022年,中國(guó)半導(dǎo)體采購(gòu)額為1800億美元,占全球半導(dǎo)體采購(gòu)總額5559億美元的三分之一以上,是最大的全球單一市場(chǎng)。
為了盡可能挽回?fù)p失,黃仁勛一度嘗試游說美國(guó)政府改變策略。今年7月份,黃仁勛曾連同英特爾CEO基辛格、高通CEO阿蒙與美國(guó)政府官員在華盛頓舉行會(huì)談。這些芯片巨頭們希望美國(guó)政府應(yīng)該進(jìn)一步評(píng)估“限制對(duì)華半導(dǎo)體出口”的影響,認(rèn)為出口管制將有損于美國(guó)在半導(dǎo)體行業(yè)的領(lǐng)導(dǎo)地位,希望停止實(shí)施新的對(duì)華限制。
黃仁勛更是直言,“限制英偉達(dá)在華芯片銷售,只會(huì)給其他品牌提供機(jī)會(huì)。”在黃仁勛看來,中國(guó)占據(jù)了美國(guó)科技產(chǎn)業(yè)約三分之一的市場(chǎng),令其作為半導(dǎo)體零部件來源地和產(chǎn)品終端市場(chǎng)的地位無可取代,退出中國(guó)市場(chǎng)不是一種可行選項(xiàng)。
盡管這場(chǎng)游說活動(dòng)在某種程度上推遲了美國(guó)政府對(duì)華芯片出口新規(guī)的出臺(tái)時(shí)間,但最終卻未能徹底讓美國(guó)政府改變心意。
待30天公示期結(jié)束,留給黃仁勛的挑戰(zhàn)之一,將是如何解決芯片重回中國(guó)市場(chǎng)的問題。
考慮到去年10月美國(guó)政府頒布出口禁令后,英偉達(dá)迅速調(diào)整了芯片帶寬速度,及時(shí)發(fā)布了符合禁令規(guī)定的定制版芯片A800。Spear Invest創(chuàng)始人Ivana Delevska認(rèn)為:“隨著時(shí)間的推移,會(huì)出現(xiàn)某種與此類似的解決方案,而不是完全禁止它們。”即英偉達(dá)或許會(huì)再次通過微調(diào)其芯片來滿足新的禁令要求,從而緩和這項(xiàng)AI芯片禁令帶來的營(yíng)收下滑等一系列影響。
受新規(guī)影響,英偉達(dá)股價(jià)已經(jīng)從10月17日的446美元,一路下跌至10月20日的414美元,總市值三天內(nèi)暴跌769億美元(約合人民幣5600億元)。
不過,一旦在A800/H800的基礎(chǔ)上再次進(jìn)行性能閹割,屆時(shí)英偉達(dá)推出的AI芯片,在中國(guó)市場(chǎng)是否還具備相當(dāng)程度的競(jìng)爭(zhēng)力,就要看“皮衣刀客”黃仁勛的刀法,這次精不精準(zhǔn)了。
編者按:本文轉(zhuǎn)載自微信公眾號(hào):字母榜(ID:wujicaijing),作者:趙晉杰
前瞻經(jīng)濟(jì)學(xué)人
專注于中國(guó)各行業(yè)市場(chǎng)分析、未來發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。