DeepSeek的「鯰魚效應(yīng)」
作者|Tim 來(lái)源|潮汐商業(yè)評(píng)論(ID:daily-case)
蛇年前夕,DeepSeek猶如一顆“原子彈”般震撼了全球人工智能領(lǐng)域。
這款主打“極致性價(jià)比”的大語(yǔ)言模型,不僅在性能上比肩OpenAI的頂尖模型o1,其成本更是僅為GPT-4o的十分之一,API調(diào)用成本更是低至OpenAI的三十分之一。
這證明了AI企業(yè)依靠燒錢卷“投流”“獲客”的路徑不可行,更凸顯了長(zhǎng)期主義地原始創(chuàng)新和低成本研發(fā)的重要性。
這也打破了技術(shù)閉源的OpenAI和英偉達(dá)的市場(chǎng)壟斷,更引發(fā)了全球科技巨頭的股價(jià)波動(dòng),英偉達(dá)市值一夜之間蒸發(fā)4.3萬(wàn)億元。
目前,DeepSeek累計(jì)用戶已經(jīng)超過(guò)了1.25億。它像鯰魚一樣,攪動(dòng)全球人工智能領(lǐng)域,讓國(guó)內(nèi)AI基建重拾信心,被稱為“國(guó)運(yùn)”級(jí)別的存在。
一
新路徑彎道搶跑
AI大模型是一個(gè)重資產(chǎn)行業(yè),2024年Scaling Law仍未失效,隨著模型不斷變大,訓(xùn)練新模型需要更多的數(shù)據(jù)、更多的算力。
這意味著需要充足的資金支撐。一位大廠高層給出判斷,做大模型,“一年低消也要20億-30億美元”。
DeepSeek的出現(xiàn),證明了AI企業(yè)依靠燒錢卷“投流”“獲客”的路徑是不可行的,以往中國(guó)AI大模型“卷”算力、“卷”價(jià)格、“卷”獲客、“卷”變現(xiàn)能力,如今人們更認(rèn)可長(zhǎng)期主義的原始創(chuàng)新,企業(yè)應(yīng)當(dāng)思考架構(gòu)創(chuàng)新和低成本研發(fā),而不是一味燒錢。
在過(guò)去的2024年,月之暗面的Kimi和字節(jié)跳動(dòng)的豆包輪番成為大眾追捧的AI應(yīng)用。它們背后是重金推廣和瘋狂卷算力。
以抖音為例,2024年字節(jié)跳動(dòng)才開始在大模型上發(fā)力,憑借此前的火山云基礎(chǔ)設(shè)施和人才團(tuán)隊(duì)積累,以及大規(guī)模資金投入和四處挖人。在互聯(lián)網(wǎng)四巨頭里,字節(jié)跳動(dòng)在AI領(lǐng)域的投入上高達(dá)800億人民幣,遠(yuǎn)超騰訊、阿里、百度。
字節(jié)跳動(dòng)旗下火山引擎支持多芯、多云架構(gòu),擁有超大規(guī)模算力,支持萬(wàn)卡集群組網(wǎng)、萬(wàn)億參數(shù)MoE大模型;提供超高性能網(wǎng)絡(luò),支持3.2TbpsRDMA網(wǎng)絡(luò),全球網(wǎng)絡(luò)POP覆蓋廣,時(shí)延優(yōu)化最高達(dá)75%,在算力資源上優(yōu)勢(shì)也很明顯。
DeepSeek的出現(xiàn)推動(dòng)了AI技術(shù)更加普及和高效,其崛起將推動(dòng)小型化模型即邊緣AI的推廣,使云端和邊緣處理的混合AI模型被認(rèn)為是AI未來(lái)的發(fā)展方向。
二
與友商們都“交個(gè)朋友”
DeepSeek解決了國(guó)產(chǎn)AI領(lǐng)域的困局,應(yīng)用的落地,激活了整個(gè)行業(yè)。國(guó)產(chǎn)芯片、軟硬件公司、云廠商紛紛接入DeepSeek“交個(gè)朋友”。
大模型企業(yè)們對(duì)于算力的需求不斷攀升,對(duì)于云服務(wù)的需求提升明顯。騰訊云、阿里云、華為云、百度智能云、火山引擎等數(shù)十家云計(jì)算服務(wù)龍頭,拆掉了圍墻,都推出限時(shí)優(yōu)惠、包年包月等選項(xiàng)。
在芯片領(lǐng)域,華為昇騰、沐曦科技、摩爾線程、壁仞科技等10多家國(guó)產(chǎn)AI芯片企業(yè),都表示適配了DeepSeek原版或“蒸餾”后的小尺寸版本。
同時(shí),國(guó)產(chǎn)手機(jī)品牌和新能源汽車品牌也紛紛接入DeepSeek。
另外,DeepSeek也刺激了阿里云通義團(tuán)隊(duì)發(fā)布旗艦?zāi)P?ldquo;Qwen2.5-Max”,成為第二家可以比肩美國(guó)OpenAI公司o1系列的國(guó)產(chǎn)大語(yǔ)言模型,讓行業(yè)內(nèi)外為之振奮。
DeepSeek的效應(yīng)還在持續(xù),將吸引以華為為代表(還包括寒武紀(jì)、海光、摩爾線程等)的國(guó)產(chǎn)算力廠商會(huì)投入更大資源支持國(guó)產(chǎn)大模型的適配,政府資源的支持力度也會(huì)加大,這有利于國(guó)內(nèi)人工智能的產(chǎn)業(yè)鏈更好發(fā)展。
同時(shí)也會(huì)加劇競(jìng)爭(zhēng),頭部?jī)?yōu)勢(shì)廠商變強(qiáng),一批原先瞄準(zhǔn)通用大模型為目標(biāo)的創(chuàng)業(yè)公司和互聯(lián)網(wǎng)公司將因?yàn)橘Y源無(wú)法支撐而退出角逐,轉(zhuǎn)而做特定方向的人工智能應(yīng)用落地,這有助于我們國(guó)內(nèi)人工智能產(chǎn)業(yè)資源的更合理分布。
DeepSeek驗(yàn)證的長(zhǎng)思維鏈模式,有助于整個(gè)產(chǎn)業(yè)鏈降低在數(shù)據(jù)推理路徑標(biāo)注的投入,未來(lái)大模型在需要復(fù)雜推理的應(yīng)用落地過(guò)程會(huì)進(jìn)一步加快。
從DeepSeek的推出到應(yīng)用端鋪開布局,再到投資者重新理解中國(guó)科技企業(yè)的技術(shù)潛力、對(duì)科技股價(jià)值重估,這種轉(zhuǎn)換讓人炫目。DeepSeek“國(guó)運(yùn)”系身一點(diǎn)都不夸張。
三
國(guó)產(chǎn)大模型有了新奔頭
DeepSeek的爆火出圈,也讓美國(guó)和歐洲看到,中國(guó)在大模型產(chǎn)業(yè)已經(jīng)形成一批頗具實(shí)力和影響力的公司,其中有字節(jié)跳動(dòng)、阿里、騰訊等大廠身影,也有月之暗面、智譜、MiniMax等初創(chuàng)企業(yè)。
客觀來(lái)講,國(guó)內(nèi)無(wú)論是DeepSeek V3/R1、訊飛星火X1,還是字節(jié)的豆包、阿里的通義千問(wèn)等國(guó)產(chǎn)大模型,目前和OpenAI的o3相比在現(xiàn)實(shí)物理規(guī)律的理解和運(yùn)用、超復(fù)雜科學(xué)問(wèn)題的求解、多模態(tài)視頻流輸入理解等高難度任務(wù)上還是有差距。
通用人工智能也不僅局限于此,在多模態(tài)大模型、具身智能、世界模型、環(huán)境模擬器等多個(gè)方面,中國(guó)的人工智能都有可挖掘的巨大空間,尤其是在高制程人工智能芯片的量產(chǎn)和演進(jìn)能力方面。
當(dāng)然,中國(guó)人工智能還是會(huì)面臨一些挑戰(zhàn)。
DeepSeek基于以英偉達(dá)算力取得的如此大的成就,勢(shì)必會(huì)引發(fā)海外針對(duì)芯片供應(yīng)的封鎖手段不斷升級(jí),給國(guó)產(chǎn)大模型的發(fā)展帶來(lái)更多限制。
尤其是美國(guó)大概率會(huì)對(duì)我國(guó)的英偉達(dá)算力獲取和國(guó)產(chǎn)算力海外投片采取更嚴(yán)苛的限制措施,H800、A100、H20等卡將會(huì)被全面禁止,給DeepSeek帶來(lái)的限制將日益增多。
所以實(shí)現(xiàn)國(guó)產(chǎn)算力的自主可控將更為關(guān)鍵。幸運(yùn)的是,國(guó)產(chǎn)所有大模型中已經(jīng)有一家公司憑借國(guó)產(chǎn)算力做出了成績(jī)。
訊飛星火大模型的訓(xùn)練和推理都在國(guó)產(chǎn)算力上進(jìn)行的,并且僅用了1萬(wàn)張910B國(guó)產(chǎn)算力卡??拼笥嶏w不僅用比友商少數(shù)倍的算力取得了大模型研發(fā)上的一些成果,而且還做了大量國(guó)產(chǎn)算力平臺(tái)上的無(wú)人區(qū)的適配和效率優(yōu)化,可以說(shuō)是真正把國(guó)產(chǎn)算力做到了極致效率,這比在英偉達(dá)上的實(shí)現(xiàn)更需要技術(shù)實(shí)力和勇氣,也更具有戰(zhàn)略意義。
如果訊飛星火能取得成功,將會(huì)像DeepSeek一樣,給予了我國(guó)同行們比以往更有信心和勇氣做底層的技術(shù)創(chuàng)新。
從這個(gè)角度上看,DeepSeek也只是為2025年中國(guó)人工智能拉開了大幕,真正的爆發(fā)正在迎面趕來(lái)。
潮汐編輯部的Jesse最近兩周已經(jīng)習(xí)慣了在成稿后來(lái)一場(chǎng)“人機(jī)對(duì)話”,以期獲得些意外的觀點(diǎn)。這次當(dāng)她把問(wèn)題輸入,只見對(duì)話框旋轉(zhuǎn)半天后,DeepSeek彈出了一行字:“服務(wù)器繁忙,請(qǐng)稍后再試。”
DeepSeek以“白菜價(jià)”技術(shù)打破壟斷,用開源生態(tài)凝聚產(chǎn)業(yè)鏈,最終引爆了國(guó)內(nèi)AI從技術(shù)到商業(yè)的全面升級(jí)。可這一切都來(lái)的太快了,烈火烹油,總要給Deepseek和整個(gè)AI行業(yè)一點(diǎn)時(shí)間適應(yīng)。
正如DeepSeek創(chuàng)始人梁文鋒在采訪中所說(shuō),“以后硬核創(chuàng)新會(huì)越來(lái)越多。當(dāng)這個(gè)社會(huì)讓硬核創(chuàng)新的人功成名就,群體性想法就會(huì)改變。我們只是還需要一堆事實(shí)和一個(gè)過(guò)程。”
你看,商業(yè)就是這樣。
編者按:本文轉(zhuǎn)載自微信公眾號(hào):潮汐商業(yè)評(píng)論(ID:daily-case),作者:Tim
前瞻經(jīng)濟(jì)學(xué)人
專注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。