朱嘯虎VS傅盛,懟出了大模型創(chuàng)業(yè)的兩個共識
作者|趙晉杰 來源|字母榜(ID:wujicaijing)
刷到知名投資人朱嘯虎給大模型創(chuàng)業(yè)潑的一盆冷水后,正在著手推進ChatGPT與原有機器人創(chuàng)業(yè)項目結合的傅盛,開始坐不住了。
近日,傅盛在朋友圈轉發(fā)朱嘯虎對外演講的一篇文章(《朱嘯虎:ChatGPT對創(chuàng)業(yè)公司很不友好,未來兩三年內請大家放棄融資幻想》),并評論道:“硅谷一半的創(chuàng)業(yè)企業(yè)都圍繞ChatGPT開始了,我們的投資人還能這么無知者無畏。”
圍繞“大模型創(chuàng)業(yè)價值到底有多大”“大模型創(chuàng)業(yè)機會到底有多少”等問題,雙方展開了一場隔空爭辯。
杜克大學電子與計算機工程系教授、計算進化智能中心主任陳怡然總結了兩人的不同立場:
朱嘯虎覺得大模型摧毀了創(chuàng)業(yè),因為模型、算力和數據,三大支柱都向大廠集中,看不到創(chuàng)業(yè)公司的機會,且直接在大模型上做應用護城河太低。傅盛反而認為大模型催生了很多新的架構在大模型之上的創(chuàng)業(yè)機會,包括直接在大模型上搭建的不同應用和由于數據私有帶來的垂直領域的大模型等等。
為了消解外界對金沙江創(chuàng)投在大模型投資領域的誤解,在與傅盛朋友圈爭辯后的當晚,朱嘯虎又特意發(fā)了條朋友圈解釋,稱金沙江創(chuàng)投應該是國內投資垂直AIGC創(chuàng)業(yè)項目最多的早期投資人,自己并非否定大模型領域創(chuàng)業(yè)機會,而是希望提醒創(chuàng)業(yè)者不要迷信通用大模型。
朱嘯虎的上述觀點基本已成為當下國內投資圈的共識。恒業(yè)資本創(chuàng)始合伙人江一告訴字母榜,國內最終能夠存活下來的通用大模型玩家,“可能有個3家就已經不錯了。因為訓練大模型需要大量投入,要燒很多錢,而且還不一定能追得上ChatGPT或者GPT-4。”
將通用大模型從創(chuàng)業(yè)方向中篩掉之后,朱嘯虎和傅盛其實在另一個維度上也達成了共識,即行業(yè)大模型以及基于大模型的應用開發(fā),才是大部分創(chuàng)業(yè)者真正能夠抓住的機會。
垂直領域的大模型需求強勁到什么程度?杜克大學教授陳怡然表示,“幾乎每周都會有人問我相關的技術可能性,國內國外都有,涵蓋了各種行業(yè)。當務之急是趕緊deliver所期望的性能,否則就會和上一波AI發(fā)展一樣,投資者和用戶會逐漸地失去耐心。”
在今年6月份的奇績創(chuàng)壇春季創(chuàng)業(yè)路演上,奇績創(chuàng)壇創(chuàng)始人陸奇分享過一組數據:創(chuàng)業(yè)營最終錄取的60個項目中,大模型項目39個,占比高達65%,幾乎都圍繞垂直大模型應用開發(fā)展開。
接下來,考驗這些垂直大模型領域創(chuàng)業(yè)者的,將是誰能率先找到落地場景,并持續(xù)不斷獲取高質量行業(yè)數據。
一
在OpenAI爆火之后,擺脫對國外大模型提供商的依賴,打造中國版OpenAI就成了中國IT產業(yè)勢在必行的一件大事。
但通用大模型的訓練并非一朝一夕之功,每前進一步都需要耗費巨大的資源,包括更強的算力、更豐富的數據,和更先進的算法。
調研機構TrendForce在一份報告中指出,OpenAI訓練ChatGPT的前身GPT-3時,大概用到2萬個英偉達A100 GPU的算力,以每塊A100芯片售價約1萬美元計算,這就相當于2億美元的投入。有業(yè)內人士估計,ChatGPT所需的GPU數量,達到了3萬個以上。
英偉達A100 GPU 圖源:英偉達官網
大規(guī)模投入的另一面,OpenAI不僅連年虧損,甚至虧損額還在逐年增加。據媒體爆料,OpenAI去年虧損額翻倍,達到5.4億美元左右。為了開發(fā)足夠先進的通用AI,同時維持公司的正常運轉,OpenAI CEO 山姆·阿爾特曼(Sam Altman)更是表示,OpenAI可能需要在未來幾年嘗試籌集多達1000億美元的資金。
高昂的前期投入成本讓不少公司在大模型研發(fā)上望而卻步。金山辦公CEO章慶元在解釋自己不做大模型時就提到,緊缺的英偉達GPU芯片,昂貴的算力成本,以及自研大模型商業(yè)化上的不確定性,都決定了這不是任何公司都愿意承擔的風險。
創(chuàng)業(yè)公司不適合研發(fā)通用大模型的認知,不僅僅局限在朱嘯虎和他的金沙江創(chuàng)投,越來越多投資機構在這一點上達成了共識。
線性資本創(chuàng)始合伙人兼CEO王淮坦陳,創(chuàng)業(yè)公司的機會相對很小,“歷史上創(chuàng)業(yè)公司能夠成功,很大的緣故是你‘為別人所不敢為’,或者做別人認為不會起來、不太看得重的東西,這一類的創(chuàng)業(yè)模式我們稱之為‘桃花源式的創(chuàng)業(yè)’。而大模型需要一些必須成功的要素,要有算力,要有錢等。”
遠望資本程浩則更為直接,認為中國版的ChatGPT只會在5家公司里產生:BAT+字節(jié)+華為。在程浩看來,創(chuàng)業(yè)者只有在具有先發(fā)優(yōu)勢的情況下,才有可能跑贏大廠。
正是因為當初谷歌等國外大廠并不看好OpenAI的大語言模型路線,才讓ChatGPT借助先發(fā)勢能跑了出來。但是,當下研發(fā)大模型已經成為中國科技大廠的共識,甚至百度、阿里推出產品的動作,比創(chuàng)業(yè)公司還快。
傅盛此前也發(fā)表過類似的看法,認為國內未來的大模型競爭會朝著兩個方面走:一個是大公司主攻通用大模型;另一個則是創(chuàng)業(yè)者在大模型基礎上開發(fā)各式各樣的行業(yè)大大模型應用,做平民化的大模型。
二
在通用大模型上比拼不過大廠的創(chuàng)業(yè)者,只能被迫選擇做行業(yè)大模型或者垂類應用,以此來避開前期大模型訓練的無底洞式投入。
頭部云廠商大模型研發(fā)工程師吳偉向字母榜解釋道,不同的參數量對于數據和算力的要求,完全不一樣,數據量越少,需要的算力也越低,就能帶動整體訓練成本的下降。
而且,大部分的企業(yè)場景,也并不需要ChatGPT那樣參數量過千億的通用大模型來滿足需要。“像邏輯推理、數學推理等,確實要用到百億甚至千億參數量,才能實現比較理想的能力提升,但是一些開放問答等,維持在數十億參數量的大模型,就可以滿足客戶用大模型提升現有業(yè)務能力的需求。”吳偉表示。
如何在合理成本下,能夠選擇到性價比最高的模型,這才是B端客戶做出最終決策的核心依據。
對于依賴外部大模型打造垂類應用的創(chuàng)業(yè)者來說,其調用大模型的成本將變得越來越低,已成為可預見的趨勢。
阿里云表示,希望未來企業(yè)在阿里云上訓練一個模型的成本,“能夠降低到現在的十分之一,甚至是百分之一。即使是中小企業(yè),也能通過云平臺獲得AI大模型的能力和服務。”
百度大模型服務在推出三個月后,已經實現了超過十倍的成本下降,“價格應該不會成為大家所使用或者是擁抱大模型的瓶頸。”百度云表示。
除了成本考量之外,通用大模型也并非滿足所有行業(yè)場景需求的最優(yōu)解。遠望資本程浩指出,這方面更核心的問題是各行各業(yè)都有自己的Know-How。這些最有價值的Know-How很可能不在互聯網上,而是在企業(yè)的私有數據庫里,甚至在一部分專家的腦子里。
科技大廠即便通過燒錢提升通用大模型能力,也難以跨越上述這道數據門檻,這也恰恰是擁有行業(yè)資源積累的創(chuàng)業(yè)者,有針對性開發(fā)行業(yè)大模型和垂類應用的機會所在。
還有一點值得注意的是,正如同樣在做大模型的360創(chuàng)始人周鴻祎所言,通用大模型在落地政府、城市、行業(yè)和企業(yè)場景時并不能直接使用,存在著缺乏行業(yè)深度、易帶來數據安全隱患、無法保障內容真正可信及無法實現成本可控等痛點。這都給行業(yè)大模型創(chuàng)業(yè)留出了生長空間。
正是基于此,在百度、阿里搶發(fā)通用大模型產品之后,騰訊反而率先選擇了行業(yè)大模型的落地方案,在爭奪B端客戶上與百度、阿里展開了同頻競爭。
三
但留給行業(yè)大模型和垂類應用創(chuàng)業(yè)者的挑戰(zhàn)同樣不少。除了需要應對來自BAT的競爭之外,更重要的考驗在于,如何提前大廠一步,找到適合自己產品的落地場景,并挖掘到行業(yè)數據。
如同朱嘯虎在與傅盛爭辯中所說,投資機構同樣在找擁有上述特征的創(chuàng)業(yè)項目,但符合要求的很少。
相比創(chuàng)業(yè)公司重構新的場景,大模型反而更加利好每個行業(yè)中的現有玩家。在朱嘯虎看來,已經擁有使用場景的玩家,通過ChatGPT很容易就能為自己的產品加上人工智能的功能,如眼下的智能客服。
如何獲取差異化競爭優(yōu)勢,一家即將發(fā)布大模型產品的公司給出了自己的解決方案。該公司負責人李振告訴字母榜,自己即將推出的行業(yè)大模型方案,已經全部被客戶買過單了,“沒被買過單的我們還沒發(fā)。”
除此之外,在與大廠的同位競爭中,李振祭出的另一殺手锏是簽署獨家合作,目前其服務的快消飲料前十廠商中,基本都已經達成了獨家大模型開發(fā)方案。
留給行業(yè)大模型創(chuàng)業(yè)者的另一重挑戰(zhàn),則在于數據。在李振看來,算法和算力都可以短時間追趕或者復制,但對數據的處理,反而可能是對整個行業(yè)大模型影響最大的一個因素。“在以數據為中心(data-centric)的AI新時代,模型能不能出彩實際上主要是靠數據。”李振表示,數據里面潛藏的諸多魔鬼細節(jié),甚至決定著大模型產品的成敗。
谷歌就是前車之鑒。不管從算力還是算法,谷歌并不比OpenAI差,甚至還要強,但恰恰是借助基于人類反饋的強化數據訓練工作,OpenAI最終趕在谷歌前面做出了ChatGPT。
根據OpenAI公開的資料,旗下數據團隊被建設成為不同水平的層級,數據量大、標注要求簡單明確的淺層數據,交給肯尼亞等廉價外包勞工,高等級的數據則交給更高素質標記人員,不少都是訓練有素的高校博士。“OpenAI在數據采集方面的有效探索,目前沒有任何一個團隊可以匹敵。”李振說道。
在解決了場景落地和數據采集問題之后,生產出來的行業(yè)大模型,還面臨另一個急迫的問題——知識產權歸誰。
吳偉表示,與某一企業(yè)合作研發(fā)的大模型,能不能復用給其他行業(yè)內的企業(yè),要看客戶的意愿,只能逐個談判解決。
但走到與企業(yè)客戶利益綁定后的行業(yè)大模型,在獲取確定性商業(yè)回報之外,也同時失去了大規(guī)模擴張的可能性,很容易成為朱嘯虎口中“零零散散的小機會”。
失去通用大模型創(chuàng)業(yè)機會后,留給創(chuàng)業(yè)者做出下一個BAT的機會也無限渺茫,傅盛在這方面顯然已經有了足夠清醒的認識,“我已經放棄BAT的創(chuàng)業(yè)夢了,那的確沒機會。”
編者按:本文轉載自微信公眾號:字母榜(ID:wujicaijing),作者:趙晉杰
品牌、內容合作請點這里:尋求合作 ››
前瞻經濟學人
專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關注。