AI大模型突圍戰(zhàn)
(圖片來(lái)源:攝圖網(wǎng))
作者|六金 來(lái)源|節(jié)點(diǎn)財(cái)經(jīng)(ID:jiedian2018)
最近,GPT賽道上爭(zhēng)議不斷,先是GPT-4的問(wèn)世,用一些亮眼的功能讓人類感嘆自己是不是要丟工作?緊接著又有一封聯(lián)名信刷屏,圖靈獎(jiǎng)得主、AI三巨頭之一的約書(shū)亞·本吉奧、埃隆·馬斯克等123個(gè)業(yè)界大佬,呼吁所有人工智能實(shí)驗(yàn)室應(yīng)暫停比GPT-4更強(qiáng)大的AI系統(tǒng)訓(xùn)練。
大語(yǔ)言模型的安全問(wèn)題已經(jīng)顯現(xiàn),ChatGPT被國(guó)內(nèi)廠商直接應(yīng)用并不現(xiàn)實(shí),國(guó)內(nèi)科技公司迎來(lái)了超車機(jī)會(huì),就像一直耕耘網(wǎng)絡(luò)安全的周鴻祎強(qiáng)調(diào)的那樣——不發(fā)展才是最大的不安全。
所以,當(dāng)人工智能領(lǐng)域的技術(shù)革命再次發(fā)生時(shí),我們要做的不是“因噎廢食”,而是努力儲(chǔ)備、趕上這一班車并且找機(jī)會(huì)超越,這也是國(guó)內(nèi)科技企業(yè)在AI大模型競(jìng)爭(zhēng)上“全員加速中”的原因。
一
技術(shù)革命已經(jīng)發(fā)生,重要的是儲(chǔ)備力量
在大模型的應(yīng)用上,OpenAI已經(jīng)完成了從0到1的突破,而互聯(lián)網(wǎng)行業(yè)有一個(gè)特點(diǎn),就是但凡有一人捅破窗戶紙,那么就是千軍萬(wàn)馬獨(dú)木橋,方向正確了大家就都能努力趕上。
國(guó)外科技巨頭中,微軟宣布將GPT-4、DALL-E等,全都整合在旗下的Bing搜索、office辦公套件、Teams聊天產(chǎn)品中;Adobe在老本行圖片處理上推出生成式AI Firefly生成圖像;谷歌也開(kāi)放了聊天式機(jī)器人Bard……
在國(guó)內(nèi),百度發(fā)布文心一言,成為中國(guó)第一個(gè)類ChatGPT產(chǎn)品;華為在2021年基于昇騰AI與鵬城實(shí)驗(yàn)室聯(lián)合發(fā)布了鵬程盤(pán)古大模型;阿里在2022年9月發(fā)布了“通義”大模型系列,包含NLP大模型AlicMind、視覺(jué)大模型、多模態(tài)大模型M6;騰訊和阿里思路差不多,在去年發(fā)布了混元AI大模型,其中包含NLP、CV和多模態(tài)等基礎(chǔ)模型和眾多行業(yè)/領(lǐng)域模型;京東也宣布研發(fā)產(chǎn)業(yè)版的ChatGPT—ChatJD;網(wǎng)易、360、字節(jié)跳動(dòng)等都官宣了自己在AI大模型方面的布局。
可以說(shuō),目前國(guó)內(nèi)的互聯(lián)網(wǎng)企業(yè)基本都擁有一個(gè)AI大模型,或者制定了相應(yīng)的計(jì)劃。
與國(guó)外企業(yè)專注于一個(gè)大模型并且在實(shí)驗(yàn)室訓(xùn)練研發(fā)不同,國(guó)內(nèi)科技企業(yè)在大模型方面的布局和儲(chǔ)備是一個(gè)組合拳,是直接從產(chǎn)業(yè)端實(shí)戰(zhàn)出來(lái)的。雖然消費(fèi)端的用戶感知并不強(qiáng)烈,但不代表咱們沒(méi)有大動(dòng)作。
當(dāng)你發(fā)現(xiàn)開(kāi)車時(shí),自動(dòng)駕駛對(duì)于障礙識(shí)別越來(lái)越精準(zhǔn)、倒車入庫(kù)踩線越來(lái)越細(xì)致,視覺(jué)大模型可能已經(jīng)迭代了好幾個(gè)版本;你發(fā)現(xiàn)家里的智能音箱越來(lái)越能get你的意思時(shí),NLP大模型可能在默默努力……許多生活中服務(wù)和應(yīng)用升級(jí)的背后,都有大模型的功勞。
在所有頭部廠商中,商湯則是大模型儲(chǔ)備上的佼佼者,而且商湯的AI大模型已經(jīng)歷過(guò)商業(yè)化驗(yàn)證。截至目前商湯的商用模型就超過(guò)了67000個(gè),據(jù)商湯財(cái)報(bào),其語(yǔ)言大模型、多模態(tài)大模型、AI內(nèi)容生成(AIGC)模型等正在從以前的“支持狀態(tài)”快速浮出水面。
行至2023年,對(duì)百度、商湯這種擁有大模型搭建能力的企業(yè),大家正在從“賣算力”走向“賣模型”,Maas也成為了AI企業(yè)發(fā)展的新商業(yè)路徑。
二
走穩(wěn)大模型的底層邏輯
在大模型這個(gè)賽道上,其實(shí)并無(wú)任何實(shí)質(zhì)性技術(shù)卡脖子。例如GPT的邏輯,是技術(shù)以及運(yùn)用算力進(jìn)行試錯(cuò)與暴力破解。李彥宏也坦言,語(yǔ)言大模型是算力和數(shù)據(jù)的“暴力美學(xué)”,只有當(dāng)訓(xùn)練的數(shù)據(jù)達(dá)到一定規(guī)模的情況下,才會(huì)出現(xiàn)智能涌現(xiàn)。
所以大模型繁榮式爆發(fā)的背后,是算力、算法、數(shù)據(jù)三大底層能力。在國(guó)內(nèi)科技廠商中,AI原生企業(yè)的積累不容小覷。
例如上文提到的商湯,已布局大模型領(lǐng)域5年之久,解決了不少大模型實(shí)際應(yīng)用中的問(wèn)題,順利打開(kāi)商業(yè)化的口子。
首先,在大模型的應(yīng)用領(lǐng)域上,商湯相比于單一的語(yǔ)言模型,有著更廣的半徑。
在CV領(lǐng)域,商湯研發(fā)了320億參數(shù)的全球最大通用視覺(jué)模型,實(shí)現(xiàn)高性能的目標(biāo)檢測(cè)、圖像分割和多物體識(shí)別算法等,在自動(dòng)駕駛、醫(yī)療影像等領(lǐng)域得到應(yīng)用。據(jù)悉,商湯在 2022 年環(huán)視感知算法BEVFormer++ 獲得了 Waymo 挑戰(zhàn)賽冠軍。
在AIGC文生圖領(lǐng)域,2022年商湯訓(xùn)練的AIGC文生圖模型,對(duì)文生圖的理解以及推理速度等具備強(qiáng)能力。在NLP自然語(yǔ)言處理領(lǐng)域,商湯今年年中即將推出千億參數(shù)量的NLP大模型,顯著提高了文本生成、人機(jī)對(duì)話等任務(wù)的性能。
在多模態(tài)大模型方面,商湯已經(jīng)把擁有30億參數(shù)的多模態(tài)大模型—書(shū)生2.5開(kāi)源。“書(shū)生2.5”不僅是世界上開(kāi)源模型中ImageNet準(zhǔn)確度最高、規(guī)模最大的模型,也是物體檢測(cè)標(biāo)桿數(shù)據(jù)集COCO中唯一超過(guò)65.0mAP的模型,推動(dòng)通用AI技術(shù)的規(guī)?;瘧?yīng)用。
這樣看來(lái),商湯在大模型訓(xùn)練上收獲頗豐,已然跑在了行業(yè)前列。能取得領(lǐng)先優(yōu)勢(shì),除了商湯跑得快以外,還因?yàn)槠鹋茳c(diǎn)不一樣,得益于其底層邏輯為“大裝置+大模型”。
這些年,商湯一直在打造SenseCore大裝置,2022年SenseCore大裝置持續(xù)擴(kuò)建,已完成2.7萬(wàn)塊GPU的部署,并實(shí)現(xiàn)了5.0exaFLOPS的算力輸出能力,有效支持20個(gè)千億參數(shù)量大模型(以千卡并行)同時(shí)訓(xùn)練,最高可支持萬(wàn)億參數(shù)超大模型的訓(xùn)練。
把上文翻譯一下,作為基礎(chǔ)設(shè)施,商湯大裝置可以把AI能力變成一個(gè)從輸入到輸出的機(jī)器,而且商湯一直在擴(kuò)大這個(gè)機(jī)器的能力,未來(lái)能應(yīng)用“機(jī)器”的領(lǐng)域更多,直至賦能千行百業(yè)。
還有業(yè)內(nèi)人士這樣拆解商湯“大裝置+大模型 ”的優(yōu)勢(shì):
每次訓(xùn)練模型,相當(dāng)于給模型喂飯,既然要做飯,你需要采購(gòu)數(shù)據(jù)中心、芯片、算力等,然后自己加工喂到模型嘴里,這是“食堂模式”。
但是有了SenseCore大裝置后,給模型喂飯就不用擔(dān)驚受怕今天買不到米、明天買不到菜,大裝置相當(dāng)于一片菜地,不需要出去采購(gòu),直接摘了果實(shí)做成食物就能喂給模型進(jìn)行訓(xùn)練,這是商湯搭建大模型范圍廣、數(shù)量多的重要原因。
此外,大裝置還從算力、算法、平臺(tái)方面,帶動(dòng)AI模型生產(chǎn)在規(guī)模、性能、速度等方面的提升,大幅降低AI模型的生產(chǎn)成本、加速大模型的研發(fā)。
例如前文提到,到2022年底,商湯的累計(jì)商用模型已經(jīng)達(dá)到了67000個(gè),同比增加了93%;2022年人均研發(fā)模型數(shù)量9.35個(gè),效率也比前年翻倍??梢赃@樣理解,從自家菜地里摘果實(shí)要比外采便宜得多也方便得多,大家給模型喂飯也有底氣了也更高效了、研發(fā)速度也提高了。有了這個(gè)基礎(chǔ),未來(lái)建立大模型的能力也有望從頭部玩家轉(zhuǎn)向中小入局者。同樣這也能解決AI模型生產(chǎn)成本高昂、AI模型定制化開(kāi)發(fā)效率低,無(wú)法滿足市場(chǎng)的大量需求、難以訓(xùn)練高性能AI模型等問(wèn)題。
據(jù)商湯最新財(cái)報(bào)的披露,公司已經(jīng)將SenseCore AI大裝置的能力向行業(yè)客戶開(kāi)放,目前服務(wù)了8家客戶進(jìn)行大模型訓(xùn)練,已訓(xùn)練超過(guò)10個(gè)大模型,其中就包括了CV大模型、NLP大模型和多模態(tài)大模型等。2022年,商湯SenseCore大裝置對(duì)外服務(wù)收入占到智慧商業(yè)整體收入的20%以上,商湯預(yù)計(jì),今年這一收入規(guī)模及占比將大幅增加。
三
未來(lái)大模型
可以給商湯帶來(lái)多少紅利?
國(guó)際貨幣基金組織前副總裁朱民在不久前的一次會(huì)議中表示,AI大模型不是你說(shuō)一句話、寫(xiě)一首詩(shī)、作一幅畫(huà)的問(wèn)題,它改變了全球未來(lái)競(jìng)爭(zhēng)的格局,這個(gè)我們必須爭(zhēng)。
對(duì)于商湯來(lái)說(shuō),擁有大裝置+大模型,到底能為商湯贏來(lái)多少未來(lái)?我們不妨回到財(cái)報(bào)里細(xì)細(xì)拆解。
2022年,商湯業(yè)績(jī)?cè)鲩L(zhǎng)最快的是智慧生活和智能汽車兩大業(yè)務(wù)板塊,皆是在大裝置+大模型的基礎(chǔ)上破局商業(yè)化。
商湯的智慧生活收入同比增長(zhǎng)130%,機(jī)構(gòu)分析增長(zhǎng)原因是擁有AIGC全棧能力的SenseMARS平臺(tái),在200多個(gè)移動(dòng)應(yīng)用中被持續(xù)使用,頭部客戶續(xù)約率超過(guò)95%,線下也覆蓋到了大型游樂(lè)園區(qū)、大型商場(chǎng)等120個(gè)場(chǎng)景。
不久前,SenseMARS還為房產(chǎn)營(yíng)銷提供了AIGC的解決方案,相較于傳統(tǒng)VR看房,SenseMARS帶來(lái)了像素級(jí)的場(chǎng)景復(fù)刻,讓大家解鎖如同親臨現(xiàn)場(chǎng)般地漫游看房感受。
截至2022年底,商湯智慧生活的客戶數(shù)達(dá)到317個(gè),同比增長(zhǎng)23%,單客戶ARPU也同比增長(zhǎng)了86%。值得一提的是,智慧生活板塊在AI傳感器、AI ISP芯片、智慧醫(yī)療等方面都有了商業(yè)化突破。
在另一個(gè)高增長(zhǎng)板塊智能汽車上,商湯的表現(xiàn)在機(jī)構(gòu)的預(yù)料之內(nèi),因?yàn)槠噺S家的結(jié)構(gòu)并不復(fù)雜。
2022年,商湯的絕影智能車艙和智能駕駛產(chǎn)品完成了27款車型的適配和量產(chǎn)交付,量產(chǎn)交付數(shù)量超過(guò)50萬(wàn);座艙客戶包括蔚來(lái)、廣汽、比亞迪、長(zhǎng)安等;L2+/L2++ADAS等產(chǎn)品主要交付給廣汽、合眾的旗艦車型;新增定點(diǎn)數(shù)超800萬(wàn)輛,覆蓋30余家車企的80多款車型。
另外,基于多個(gè)AI模型上的積淀并且借助激光雷達(dá)、攝像頭、毫米波雷達(dá)等基礎(chǔ)感知設(shè)備,商湯還推出了“絕影車路協(xié)同平臺(tái)”,可以對(duì)車端、路端的信息進(jìn)行融合處理,實(shí)現(xiàn)“車-路-云”一體化決策控制。例如它能解決99%以上的單車盲區(qū)問(wèn)題;借助AI云計(jì)算和云控平臺(tái),還可以實(shí)現(xiàn)車輛感知范圍的千倍擴(kuò)展;另外通過(guò)提供精準(zhǔn)路徑導(dǎo)航、車速建議和碳排放優(yōu)化等功能,更能顯著降低路口平均延誤時(shí)間和綠燈空放現(xiàn)象,提升交通效能超過(guò)20%。
中金公司在研報(bào)中稱,商湯的汽車業(yè)務(wù)依托于在視覺(jué)領(lǐng)域的多年積累,已具備客戶群基礎(chǔ),ADAS的標(biāo)桿案例也有望為后續(xù)拿單帶來(lái)示范效應(yīng);智慧生活與智能汽車占比在2025年有望達(dá)50-60%,遠(yuǎn)超當(dāng)前33%的水平,成為強(qiáng)勁驅(qū)動(dòng)力。
四
寫(xiě)在最后
AI領(lǐng)域的投資邏輯一直都是“投資前置,收益后置”。投資規(guī)模大,盈利周期長(zhǎng)。
馬斯克當(dāng)年給了OpenAI一筆錢后就拂袖離去,坊間傳言沒(méi)有繼續(xù)投資,因此OpenAI無(wú)法支付在超級(jí)計(jì)算機(jī)上訓(xùn)練人工智能模型所需的巨額費(fèi)用。再到OpenAI功成名就后,馬斯克和OpenAI之間又基于“摘桃子”battle了好幾個(gè)回合。
我們?cè)贏I賽道上也不能短視,特別是在大模型競(jìng)爭(zhēng)上,任何企業(yè)都需要與具體的行業(yè)結(jié)合,才能形成確定性的商業(yè)模式,這才是長(zhǎng)期投入帶來(lái)的“高技術(shù)門(mén)檻,強(qiáng)競(jìng)爭(zhēng)壁壘”。對(duì)于深耕大模型已久的商湯來(lái)說(shuō),一家AI原生公司在講故事層面或許不如互聯(lián)網(wǎng)大廠那般豐富多彩;但在大模型研發(fā)落地上,則值得被注入新的期待。
編者按:本文轉(zhuǎn)載自微信公眾號(hào):節(jié)點(diǎn)財(cái)經(jīng)(ID:jiedian2018),作者:六金
前瞻經(jīng)濟(jì)學(xué)人
專注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。