大模型創(chuàng)業(yè),李彥宏公布標準答案
(圖片來源:攝圖網(wǎng))
作者|陳平安 來源|伯虎財經(jīng)(ID:bohuFN)
日前,原阿里首席AI科學家賈揚清的一條朋友圈截圖在社交媒體傳得沸沸揚揚。截圖指出某國產(chǎn)大模型其實是LLaMA架構(gòu),只是更換了幾個變量名而已。
這也不是業(yè)內(nèi)人士第一次發(fā)聲質(zhì)疑,在幾個月前的Waves大會上,中國人民大學高瓴人工智能學院盧志武教授也曾表示,所謂“國產(chǎn)大模型的春天”,不過是很多公司在“微調(diào)國外底座模型”的假象。
雖然后續(xù)也有其他學者表達了不同的看法,但爭論之下,一條有關(guān)大模型的暗線已然浮出水面——大模型,越多越好嗎?
關(guān)于這個問題,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在11月15日舉行的深圳2023西麗湖論壇上給出了自己的答案:
“目前中國的大模型太多,而模型之上開發(fā)的AI原生應(yīng)用太少。”
“人類進入AI時代的標志,是出現(xiàn)大量的AI原生應(yīng)用,而不是出現(xiàn)大量的大模型。”
大模型狂飆
要想回答開頭的問題,首先需要搞清楚,我們需要怎樣的大模型。
以去年11月底 ChatGPT的橫空出世為分界線,國內(nèi)大模型發(fā)展經(jīng)歷了從寒冬到盛夏的兩級反轉(zhuǎn)。不只是阿里、百度等巨頭公司,越來越多的創(chuàng)業(yè)公司開始涌入這個賽道:截止今年10月,國內(nèi)已經(jīng)發(fā)布了238個大模型,而6月份的時候這個數(shù)字是79個,相當于4個月就翻了3倍。
但正如開頭專家們所質(zhì)疑的,大模型的風口并不好追。大模型的顛覆性來自其“智能涌現(xiàn)”的能力:簡單解釋就是觸類旁通,通過訓練,即便是沒有教過的東西,大模型也會。以百度的文心一言為例,在此前的演示中,當李彥宏要求其現(xiàn)場根據(jù)一些關(guān)鍵詞為一輛新能源汽車生成廣告時,文心一言僅僅花了三分鐘就生成了豎版廣告、5條文案和一段30秒的數(shù)字人廣告。
獲得這樣能力的前提是模型的參數(shù)規(guī)模足夠大,訓練數(shù)據(jù)量足夠多并且能夠不斷投入,進行迭代。
一方面,這決定了大模型是典型的資金密集型賽道,要開發(fā)好用、可用的大模型,存在很高的技術(shù)和成本門檻。據(jù)OpenAI聯(lián)合創(chuàng)始人布羅克曼等測算,訓練大模型消耗的計算量,每 3、4 個月會翻一倍。據(jù)多位業(yè)內(nèi)人士估算,OpenAI 訓練 GPT-3 一年,僅算力成本就有 2000 萬美元。
另一方面,這也使得缺乏“智能涌現(xiàn)”能力的專用大模型難言價值。在會上,李彥宏曾提到一個現(xiàn)象,很多行業(yè)、企業(yè),甚至很多城市都在買卡、囤芯片,建立智算中心,想要從頭訓練自己的專用大模型,但大模型的產(chǎn)業(yè)化模式,應(yīng)該是把基礎(chǔ)模型的通用能力和行業(yè)領(lǐng)域的專有知識相結(jié)合。大模型更通用,但是成本高,小模型雖然只能應(yīng)對特定場景的任務(wù),但勝在成本低,實時性較強。在訓練的過程中,大模型能夠幫助小模型提升快速生成、標記樣本的能力,而小模型則幫助大模型快速收斂,從而提升算法性能。
一個例證在于,文心大模型的API調(diào)用量。李彥宏表示:“自從8月31號開放以來,文心大模型的API調(diào)用量,呈現(xiàn)了指數(shù)級的增長。國內(nèi)有200多個大模型,文心大模型一家的調(diào)用量比這200多家大模型的調(diào)用量加起來還要多。”
讀到這里其實不難發(fā)現(xiàn),大模型本質(zhì)是一個基礎(chǔ)底座,有些類似pc時代的Windows操作系統(tǒng)或者移動互聯(lián)網(wǎng)時代的安卓或者ios系統(tǒng)。它的門檻和特性決定了,未來的競爭格局一定是一到兩個技術(shù)底座占據(jù)行業(yè)的統(tǒng)治地位。這也是為什么李彥宏會強調(diào):“不斷地重復開發(fā)基礎(chǔ)大模型是對社會資源的極大浪費”。
大模型的價值錨點
業(yè)界之所以把大模型視為第四次工業(yè)革命真正進入快車道的標志,是期待其所帶來的效果和效率的躍遷。
還是以百度的文心大模型為例,自今年三月正式發(fā)布后基于文心大模型3.0的文心一言產(chǎn)品后,上個月,百度又發(fā)布了文心4.0版本。和前代相比,4.0是迄今為止最強大的文心大模型,在理解、生成、邏輯和記憶四大能力上,都有明顯提升。比如,在生成能力上,文心一言除了生成文字內(nèi)容,更包括了圖片、視頻、數(shù)字人等多模態(tài)內(nèi)容,可實現(xiàn)的創(chuàng)作體裁超過200種,涵蓋了幾乎所有寫作需求。在邏輯和記憶能力上,相比之前的版本也有了成倍提升。
但和過去誕生的許多新技術(shù)一樣,大模型也需要解決應(yīng)用場景的桎梏,尋找兌現(xiàn)商業(yè)價值的路徑。就如同pc時代改變我們辦公、游戲方式的軟件,以及在根植于移動終端的抖音、微信這樣的應(yīng)用一樣,同樣具備技術(shù)底座屬性的大模型如果不能形成繁榮的生態(tài),那么也就難言價值。這也是大模型真正的價值錨點所在。
李彥宏在會上表示,“AI原生時代,我們需要的是100萬量級的AI原生應(yīng)用,而不是100個所謂的大模型。”
這需要從業(yè)者們共同努力。比如李彥宏提到一個情況,和國內(nèi)百模大戰(zhàn)的情況相比,國外雖然涌現(xiàn)了幾十個基礎(chǔ)大模型,但對于AI原生應(yīng)用的探索也很火熱,目前已經(jīng)有上千個AI原生應(yīng)用。例如微軟、Adobe都根據(jù)自身業(yè)務(wù)推出了相對應(yīng)的AI原生應(yīng)用。
發(fā)力生態(tài)建設(shè)也是百度一直在做的事情, 目前百度智能云千帆大模型平臺2.0月活企業(yè)數(shù)近萬家,覆蓋了金融、教育、制造、能源、政務(wù)、交通等多個行業(yè)的400多個場景,擁有了800萬AI開發(fā)者。
無論是PC時代還是移動互聯(lián)網(wǎng)時代,技術(shù)變革往往也意味著那些大機會,比如通訊、娛樂、購物、工作等。這些人們最本質(zhì)的需求往往會因為技術(shù)而煥發(fā)新的形式和生機,就好比當人們滿足于互聯(lián)網(wǎng)時代的圖文閱讀模式時,一定不會想到未來有一個叫抖音的APP改變了數(shù)以億計人群的娛樂方式。
正如李彥宏所言,直到今天,無論是中國也好,美國也好,最好的AI原生應(yīng)用還有沒出現(xiàn)。就像移動時代誕生了像微信、抖音、Uber這樣的“mobile-native”的應(yīng)用一樣,AI原生時代一定會有優(yōu)秀的AI原生應(yīng)用是基于這些大模型開發(fā)出來的。
也因此,對于大模型從業(yè)者們而言,和花大力氣用于開發(fā)大模型相比,如何做出更好的AI原生應(yīng)用顯然是更大的機會。
如何迎接AI時代
在此前的百度世界大會上,李彥宏曾表示“企業(yè)競爭,不是大魚吃小魚,而是快魚吃慢魚,比競爭對手更快決策,很可能你就贏了。”
和這段發(fā)言相印證的,是過去 7 個月里,百度在大模型方面的推進速度——文心大模型大大小小的更新有數(shù)十次,提出了多個大模型生態(tài)計劃,率先向全社會開放了大模型應(yīng)用。
這里的邏輯有兩個。
首先是CEO對于業(yè)務(wù)驅(qū)動的關(guān)鍵作用。現(xiàn)在AI和大模型會成為新的變革技術(shù)幾乎已經(jīng)成為共識,咨詢機構(gòu)麥肯錫預測:大模型和它掀起的生成式人工智能有望為全球經(jīng)濟貢獻約 7 萬億美元價值。
但是作為企業(yè)應(yīng)該如何擁抱AI時代呢?李彥宏表示,雖然許多企業(yè)上上下下都很重視這次機會,但對于問題的本質(zhì)了解不深,“以為自己搞個基礎(chǔ)模型,或者按照網(wǎng)上傳播的評測方法來挑選一款評分高的大模型,就是擁抱AI時代了”。
實際上,大模型有沒有對互聯(lián)網(wǎng)公司的DAU、時長、用戶留存這些指標產(chǎn)生正向影響,有沒有對企業(yè)的收入、利潤、成本產(chǎn)生影響,才是問題的本質(zhì),而這些是只有CEO才會關(guān)心的問題,做最適合自己公司業(yè)務(wù)的選擇。
其次,強大的基礎(chǔ)大模型,是AI原生應(yīng)用的底層驅(qū)動力,而AI原生應(yīng)用則會帶動市場,倒逼市場變化。
基于自家的文心大模型,百度不僅把旗下各產(chǎn)品線進行了AI原生化重構(gòu),也孵化了全新的AI原生應(yīng)用。比如智能代碼助手Comate。百度現(xiàn)在每新增100行代碼,就有20行是AI生成的。同時,得益于智能化的提升,AI原生化重構(gòu)后的產(chǎn)品也取得了新的進展,比如百度文庫的付費率提升明顯。
這里李彥宏舉出新能源汽車去做類比:“中國新能源車在全球的市場份額達到65%。因為國家政策扶持的就是應(yīng)用端,通過減免車輛購置稅,上路不限號不限行等手段,有效拉動了新能源汽車產(chǎn)業(yè)的快速增長。AI產(chǎn)業(yè)也是需求驅(qū)動,所以應(yīng)該是在需求側(cè)、應(yīng)用層發(fā)力,就像補貼新能源汽車用戶一樣,鼓勵企業(yè)調(diào)用大模型來開發(fā)人工智能原生應(yīng)用,用市場推動產(chǎn)業(yè)發(fā)展。”
如果說此前幾次工業(yè)革命,中國的主題是錯過和追趕,那在大模型風起的當下,我們起碼已經(jīng)和國外站在了同一起跑線。在這場競爭中,我們有足夠的技術(shù)和資源去做比拼,而更值得思考的,則是選擇一條怎樣的路。和百模大戰(zhàn)相比,通過類比過去的技術(shù)浪潮,強調(diào)AI 原生應(yīng)用或許是一個更好的路徑。
畢竟就在當下,如何平衡收入和支出,已經(jīng)成為大模型企業(yè)們頭疼的問題。
編者按:本文轉(zhuǎn)載自微信公眾號:伯虎財經(jīng)(ID:bohuFN),作者:陳平安
前瞻經(jīng)濟學人
專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。