報(bào)告服務(wù)熱線400-068-7188

中國(guó)大模型:后中爭(zhēng)先,不走捷徑

分享到:
20 數(shù)字力場(chǎng) ? 2023-09-14 19:00:43  來(lái)源:數(shù)字力場(chǎng) E5850G1

作者|數(shù)字力場(chǎng) 來(lái)源|數(shù)字力場(chǎng)(ID:shuzilichang)

在《5000天后的世界》中,著名未來(lái)學(xué)家凱文·凱利預(yù)言:「在未來(lái)的50年里,AI將成為可以與自動(dòng)化和產(chǎn)業(yè)革命相提并論的,不,應(yīng)該是影響更為深遠(yuǎn)的趨勢(shì)?!?/p>

而今,大模型似乎就是那根杠桿。

自ChatGPT問(wèn)世以來(lái),「工業(yè)革命級(jí)的生產(chǎn)力工具」「有史以來(lái)最大的平臺(tái)革命」「新范式的新拐點(diǎn)」之類的說(shuō)法,已將大模型「封神」。

公開(kāi)數(shù)據(jù)顯示,截至今年7月底,國(guó)內(nèi)已經(jīng)有130個(gè)大模型產(chǎn)品亮相或宣布?!赴倌4髴?zhàn)」中的「百」,已非虛指。

有意思的是,在大廠們爭(zhēng)前恐后入局之時(shí),騰訊卻一直保持著自己的節(jié)奏。

9月7日,在2023騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊混元大模型正式亮相,騰訊宣告全面擁抱大模型。

▲9月7日,騰訊宣告全面擁抱大模型。

在廠商們爭(zhēng)搶頭啖湯時(shí)不出來(lái),在大模型密集發(fā)布期不出來(lái),等大模型的喧鬧消退后終于現(xiàn)身。

與其說(shuō)這是「遲」,不如說(shuō)它更是「實(shí)」——以實(shí)促實(shí),不騖虛聲,保持自己節(jié)奏,不被外界左右。這里的實(shí),是實(shí)用,是實(shí)干,也是實(shí)誠(chéng)。 

01  

說(shuō)到「混元」,許多人可能會(huì)想到道家的「混元即無(wú)極,無(wú)極生太極」。混元所指,是鴻蒙狀態(tài),是萬(wàn)物根源。

道可道,非常道。道家始祖老子曾說(shuō)過(guò)「我有三寶,持而保之」,其中之一就是信奉敢為天下后。

而在「中國(guó)巴菲特」段永平的闡釋中,「敢為天下后」還有后半句:后中爭(zhēng)先。

騰訊早在2021年就推出了千億和萬(wàn)億參數(shù)的NLP(自然語(yǔ)言處理)稀疏大模型,打破了CLUE三大榜單記錄。

馬拉松長(zhǎng)跑中,方向?qū)Α⒉呗詼?zhǔn)往往比起步快更重要。在通用大模型發(fā)布節(jié)奏上,騰訊更像是以慢為快,不走捷徑。

騰訊董事會(huì)主席兼首席執(zhí)行官馬化騰就說(shuō):「我們最開(kāi)始以為這(指AI大模型)是互聯(lián)網(wǎng)十年不遇的機(jī)會(huì),但是越想越覺(jué)得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇?!?/p>

他認(rèn)為,「對(duì)于工業(yè)革命來(lái)講,早一個(gè)月把電燈泡拿出來(lái),在長(zhǎng)的時(shí)間跨度上來(lái)看是不那么重要的。關(guān)鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實(shí)實(shí)做好?!?/p>

都說(shuō)「做三四月的事情,在八九月自有答案?!褂行┩婕伊?xí)慣了在打通概念炒作跟對(duì)韭當(dāng)割鏈路后一哄而上,「三四月」的事情剛開(kāi)始做就掏出了PPT、半成品,騰訊卻在「六七月」里不事張揚(yáng),直到「八九月」有了答案才讓其面世。

▲騰訊混元大模型參數(shù)規(guī)模超千億,預(yù)訓(xùn)練語(yǔ)料超2萬(wàn)億tokens。

混元大模型參數(shù)展示的樸實(shí),可堪佐證——沒(méi)有狂堆參數(shù),也沒(méi)展示打了多少榜,騰訊方面主要披露了兩個(gè)數(shù)字:超千億參數(shù)規(guī)模,幾乎是當(dāng)前通用大模型的標(biāo)配;預(yù)訓(xùn)練語(yǔ)料超2萬(wàn)億tokens,和目前最強(qiáng)開(kāi)源模型Llama 2持平。

樸實(shí)反映的,不是能力的讓渡,而是求實(shí)的態(tài)度:不追求Chat(聊天)上的花哨,而追求應(yīng)用場(chǎng)景上的實(shí)效;不是基于國(guó)外開(kāi)源模型訓(xùn)練求快,而是從零開(kāi)始、全鏈路自研。

02  

實(shí)用導(dǎo)向,指向的是讓大模型從「可用」變?yōu)椤负糜谩埂?/p>

不得不說(shuō),當(dāng)下的大模型正陷入「又強(qiáng)大,又弱雞」的悖論:一方面,很多大模型在問(wèn)答時(shí)能秀得一手好打油詩(shī)、抖出一番機(jī)靈,另一方面,在行業(yè)應(yīng)用中又沒(méi)太多實(shí)質(zhì)性用處。

大模型研究者李莉就認(rèn)為,現(xiàn)在很多模型的研究者和應(yīng)用的制作者,考慮的是如何讓別人記住自己,所以效果特別視覺(jué)化,「每個(gè)視頻讓人看得血脈賁張,我們紛紛表示太酷炫了,但是靜下心來(lái),我們對(duì)于技術(shù)該怎么用一般都沒(méi)有答案……如果真正放到經(jīng)濟(jì)中,你會(huì)發(fā)現(xiàn)根本用不上?!?/p>

這正是ChatGPT熱度滑坡的主要原因:前不久,Newsweek調(diào)查顯示,ChatGPT的用戶數(shù)量已經(jīng)比今年年初高峰時(shí)期下降了近95%。用戶選的最多的理由就是,感覺(jué)「ChatGPT對(duì)工作的促進(jìn)能力沒(méi)有想象那么強(qiáng)」。

這難言奇怪:在行業(yè)應(yīng)用場(chǎng)景中,用戶在意的,可不是大模型能玩什么梗、扯什么淡,而是能否提供專業(yè)知識(shí)和行業(yè)數(shù)據(jù)。「大」并不是最重要的,「?!共攀恰hatGPT上生成的很多回答,就被指看上去專業(yè),專業(yè)人士一看卻似是而非。

而今,隨著大模型進(jìn)入Gartner曲線的相對(duì)冷靜階段,越來(lái)越多的人已意識(shí)到,應(yīng)用場(chǎng)景是決定大模型能否走遠(yuǎn)的關(guān)鍵因素。沒(méi)有落地場(chǎng)景,就沒(méi)商業(yè)前景,也就難以走遠(yuǎn)。

正因如此,大模型行業(yè)正在從拼參數(shù)變?yōu)槠绰涞?,B端行業(yè)應(yīng)用已成主戰(zhàn)場(chǎng)。這勾勒出的,是大模型正從「技術(shù)力」轉(zhuǎn)向「生產(chǎn)力」的商業(yè)化圖譜。

▲應(yīng)用場(chǎng)景是大模型產(chǎn)業(yè)鏈上的重要一環(huán)。

騰訊對(duì)此就早有清晰認(rèn)知:大模型的長(zhǎng)期價(jià)值將通過(guò)行業(yè)應(yīng)用來(lái)體現(xiàn),絕不僅限于聊天機(jī)器人這樣簡(jiǎn)單的問(wèn)答場(chǎng)景。

這次發(fā)布會(huì)上,騰訊就強(qiáng)調(diào)面向產(chǎn)業(yè),明確要以提效為第一要義。騰訊高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生就表示,「大模型需要基于產(chǎn)業(yè)場(chǎng)景,與企業(yè)數(shù)據(jù)融合,才能釋放出最大的價(jià)值?!?/p>

以垂(垂直大模型)應(yīng)垂(垂直細(xì)分行業(yè)的需求),方為實(shí)用。今年6月,騰訊云從產(chǎn)業(yè)客戶需求場(chǎng)景出發(fā),依托騰訊云TI平臺(tái)打造模型精選商店。

這次發(fā)布的混元大模型,則將作為騰訊云MaaS服務(wù)的底座,為各業(yè)務(wù)領(lǐng)域提供支持。

推出的是為應(yīng)用而生的「從實(shí)踐中來(lái),到實(shí)踐中去」的實(shí)用級(jí)大模型,而非花里胡哨的AI「大玩具」,本就是「實(shí)」的體現(xiàn)。

03  

實(shí)干做派,著眼的是讓大模型更成熟更靠譜。

大模型要走入行業(yè)產(chǎn)業(yè)場(chǎng)景,就得減少「幻覺(jué)(即胡言亂語(yǔ))」、避免「誘導(dǎo)(即誘導(dǎo)偏見(jiàn)或欺騙等)」。

克勞德·香農(nóng)認(rèn)為,信息的本質(zhì)是消除不確定性。但體驗(yàn)過(guò)的用戶都知道,當(dāng)下的大模型都有著很強(qiáng)的「不確定性」——它經(jīng)常會(huì)變成CheatGPT,給你胡編亂造一通。

若這只是大模型跟用戶相互「調(diào)戲」,那無(wú)非是提供了些笑料,可行業(yè)場(chǎng)景專業(yè)度要求高、邊際容錯(cuò)率低,若提供了錯(cuò)誤信息,很可能引發(fā)嚴(yán)重后果。

正因如此,面向產(chǎn)業(yè)的大模型必須變得更專業(yè)更成熟更靠譜,不能是初看什么都懂、細(xì)看什么都不「專」。

騰訊為此采取的策略可以歸結(jié)為兩點(diǎn):1,全鏈路自研;2,將內(nèi)部業(yè)務(wù)場(chǎng)景當(dāng)「磨刀石」。

騰訊的混元大模型,從高速網(wǎng)絡(luò)、底層服務(wù)器到網(wǎng)卡、高速組網(wǎng)和平臺(tái)、模型、算法都是自研,AI基礎(chǔ)設(shè)施、機(jī)器學(xué)習(xí)框架、語(yǔ)料庫(kù)與模型算法等也是從零訓(xùn)練。

▲混元大模型是全鏈路自主研發(fā)。

騰訊解鎖全鏈路自研,瞄準(zhǔn)的既是運(yùn)用自身的技術(shù)棧體系,實(shí)現(xiàn)根本的業(yè)務(wù)技術(shù)能力突破,也是利用自主體系的研發(fā)道路,更好地應(yīng)對(duì)旗下海量高并發(fā)業(yè)務(wù)的沖擊。

客觀上講,基于國(guó)外開(kāi)源模型進(jìn)行「本土化改良」固然是一條更容易的路子,可大模型既然是工業(yè)革命級(jí)的機(jī)會(huì),只依靠國(guó)外的「開(kāi)源模型」遠(yuǎn)不夠。

騰訊集團(tuán)副總裁蔣杰說(shuō):「外界其實(shí)一般多會(huì)用到知識(shí)圖譜,甚至搜索外掛來(lái)讓模型的檢索支持能力變得更強(qiáng),騰訊也會(huì)用,但不能用的比例很高。我們一定要在整個(gè)的大模型的預(yù)訓(xùn)練階段把這個(gè)問(wèn)題解決掉,控制掉。」依托自研的「探真」算法,混元大模型幻覺(jué)比例比其他開(kāi)源大模型下降了30%到50%。

騰訊還在向外部推出大模型前,將其在騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等50多個(gè)內(nèi)部業(yè)務(wù)中先行驗(yàn)證。

先打磨好大模型產(chǎn)品,再拿出來(lái)服務(wù)行業(yè)產(chǎn)業(yè),個(gè)中的創(chuàng)新探索與審慎務(wù)實(shí),也是主打一個(gè)「實(shí)」。

04  

實(shí)誠(chéng)態(tài)度,立足的是讓大模型回歸服務(wù)屬性。

湯道生說(shuō):「從一個(gè)大模型,到提供一個(gè)用戶可以感受到的服務(wù),中間有很多的環(huán)節(jié)和工序。騰訊其實(shí)是提供整個(gè)端到端的AI服務(wù)流程中所需要的‘全鏈條工具’。我們的TI平臺(tái)就是一個(gè)能滿足整個(gè)工序、環(huán)節(jié)的需求,給客戶提供高效模型搭建服務(wù)的重要工具。這可能是大家比較少?gòu)挠焉棠抢锫?tīng)到的。」

將基于自研的大模型技術(shù)能力開(kāi)放,將其用在從田間到產(chǎn)線的很多角落,這需要「以實(shí)干促實(shí)用」。

迄今為止,騰訊已和1萬(wàn)1千家生態(tài)伙伴展開(kāi)緊密合作,推出了覆蓋100多個(gè)產(chǎn)業(yè)場(chǎng)景的行業(yè)解決方案,共同服務(wù)千行百業(yè)。

中國(guó)科學(xué)院自動(dòng)化研究所權(quán)威學(xué)者王飛躍就說(shuō),「促進(jìn)原始創(chuàng)新,確保自主可控,是大模型時(shí)代我國(guó)人工智能發(fā)展的當(dāng)務(wù)之急?!乖紕?chuàng)新也是為了更好地助益產(chǎn)業(yè)。

▲B(niǎo)AT大模型的對(duì)照。

大模型迭代優(yōu)化,也得直面社會(huì)多方對(duì)數(shù)據(jù)安全的顧慮:一直以來(lái),有些人對(duì)大模型訓(xùn)練過(guò)程中涉及的數(shù)據(jù)安全問(wèn)題表示擔(dān)憂。

但主流大模型在「喂」數(shù)據(jù)時(shí),其實(shí)需要的是那些沉淀后留下的專業(yè)性強(qiáng)、知識(shí)密度高的數(shù)據(jù),而非真假難辨且缺乏知識(shí)含量的個(gè)人隱私信息,或是極度瑣碎且偏口語(yǔ)化的聊天內(nèi)容。

特別是那些專業(yè)大模型,在對(duì)采集到的數(shù)據(jù)加以甄別時(shí),會(huì)對(duì)那些涉隱私信息進(jìn)行清洗。

蔣杰表示,「我們可以向大家保證,我們做的小模型、大模型還是大語(yǔ)言模型,都絕不會(huì)使用個(gè)人隱私數(shù)據(jù)?!?/p>

不封閉,不逾矩,方顯實(shí)。

05  

大模型很熱,但本質(zhì)上,大模型是信息化的下一幕。過(guò)去十多年的信息化對(duì)應(yīng)的時(shí)代大幕上,寫著的主題是「數(shù)字化」。大模型同樣是數(shù)智化變革的助推器。

只不過(guò),以往互聯(lián)網(wǎng)發(fā)展撬動(dòng)的是流通環(huán)節(jié)減少、流通效率提升,以AI為代表的數(shù)字化工具要介入的層次更深——其核心是要增加基礎(chǔ)價(jià)值。

這就需要,將數(shù)字化觸角伸向生產(chǎn)端與供應(yīng)側(cè),覆蓋包括從工業(yè)制造到冶金采礦、從港口運(yùn)輸?shù)睫r(nóng)林牧副漁的各行各業(yè)。

這對(duì)國(guó)內(nèi)大模型的發(fā)展不無(wú)啟示:自從ChatGPT面世后,中國(guó)大模型廠商跟OpenAI差距有多遠(yuǎn),就成了行業(yè)關(guān)心的話題。

應(yīng)用場(chǎng)景或許正是中國(guó)大模型彎道超車的突破口。

國(guó)家信息中心專家張振翼就指出,當(dāng)前美國(guó)在大模型發(fā)展中具備一定的領(lǐng)先優(yōu)勢(shì),我國(guó)需要加強(qiáng)自身獨(dú)特優(yōu)勢(shì)的探索。在他看來(lái),當(dāng)前我國(guó)發(fā)展大模型人工智能主要有三個(gè)方面的優(yōu)勢(shì):應(yīng)用場(chǎng)景資源極為豐富、數(shù)據(jù)要素政策設(shè)計(jì)較為領(lǐng)先、在相關(guān)領(lǐng)域的技術(shù)創(chuàng)新上已經(jīng)具有一定積累等。

▲中國(guó)大模型已是百花齊放。接下來(lái),應(yīng)用場(chǎng)景或許是彎道超車的關(guān)鍵。

可以看到,在移動(dòng)互聯(lián)網(wǎng)時(shí)代,中國(guó)互聯(lián)網(wǎng)企業(yè)就憑著衣食住行康樂(lè)教和產(chǎn)業(yè)領(lǐng)域的豐富場(chǎng)景,跑通了模式,做大了規(guī)模。

在今天,中國(guó)龐大市場(chǎng)上積累了海量數(shù)據(jù),包括制造、物流、電商、醫(yī)療等各個(gè)領(lǐng)域的,各個(gè)行業(yè)數(shù)字化轉(zhuǎn)型的強(qiáng)烈需要,又為大模型落地提供了需求端支撐。

順勢(shì)而為,以實(shí)用實(shí)干實(shí)誠(chéng)之「實(shí)」,加速大模型的產(chǎn)業(yè)應(yīng)用,中國(guó)大模型從跟跑到并跑再到領(lǐng)跑的圖景,才會(huì)愈發(fā)可期。

編者按:本文轉(zhuǎn)載自微信公眾號(hào):數(shù)字力場(chǎng)(ID:shuzilichang),作者:數(shù)字力場(chǎng) 

本文來(lái)源數(shù)字力場(chǎng),內(nèi)容僅代表作者本人觀點(diǎn),不代表前瞻網(wǎng)的立場(chǎng)。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問(wèn)題,請(qǐng)聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請(qǐng)聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p45 q1 我要投稿

分享:
標(biāo)簽: 中國(guó)大模型 AI

品牌、內(nèi)容合作請(qǐng)點(diǎn)這里:尋求合作 ››

前瞻經(jīng)濟(jì)學(xué)人

專注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國(guó)產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫(kù)
企查貓
前瞻經(jīng)濟(jì)學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟(jì)學(xué)家互動(dòng)交流讓您成為更懂趨勢(shì)的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟(jì)學(xué)人》APP提問(wèn)

 
在線咨詢
×
在線咨詢

項(xiàng)目熱線 0755-33015070

AAPP
前瞻經(jīng)濟(jì)學(xué)人APP下載二維碼

下載前瞻經(jīng)濟(jì)學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號(hào)

掃一掃關(guān)注我們

我要投稿

×
J