當前位置：前瞻產(chǎn)業(yè)研究院 ? 經(jīng)濟學人 ? 觀察家專欄

中國大模型：后中爭先，不走捷徑

分享到：

數(shù)字力場 ? 2023-09-14 19:00:43 　來源：數(shù)字力場　E6305G1

作者|數(shù)字力場來源|數(shù)字力場(ID：shuzilichang)

在《5000天后的世界》中，著名未來學家凱文·凱利預言：「在未來的50年里，AI將成為可以與自動化和產(chǎn)業(yè)革命相提并論的，不，應該是影響更為深遠的趨勢?！?/p>

而今，大模型似乎就是那根杠桿。

自ChatGPT問世以來，「工業(yè)革命級的生產(chǎn)力工具」「有史以來最大的平臺革命」「新范式的新拐點」之類的說法，已將大模型「封神」。

公開數(shù)據(jù)顯示，截至今年7月底，國內(nèi)已經(jīng)有130個大模型產(chǎn)品亮相或宣布?！赴倌４髴?zhàn)」中的「百」，已非虛指。

有意思的是，在大廠們爭前恐后入局之時，騰訊卻一直保持著自己的節(jié)奏。

9月7日，在2023騰訊全球數(shù)字生態(tài)大會上，騰訊混元大模型正式亮相，騰訊宣告全面擁抱大模型。

▲9月7日，騰訊宣告全面擁抱大模型。

在廠商們爭搶頭啖湯時不出來，在大模型密集發(fā)布期不出來，等大模型的喧鬧消退后終于現(xiàn)身。

與其說這是「遲」，不如說它更是「實」——以實促實，不騖虛聲，保持自己節(jié)奏，不被外界左右。這里的實，是實用，是實干，也是實誠。

說到「混元」，許多人可能會想到道家的「混元即無極，無極生太極」?；煸?，是鴻蒙狀態(tài)，是萬物根源。

道可道，非常道。道家始祖老子曾說過「我有三寶，持而保之」，其中之一就是信奉敢為天下后。

而在「中國巴菲特」段永平的闡釋中，「敢為天下后」還有后半句：后中爭先。

騰訊早在2021年就推出了千億和萬億參數(shù)的NLP（自然語言處理）稀疏大模型，打破了CLUE三大榜單記錄。

馬拉松長跑中，方向?qū)?、策略準往往比起步快更重要。在通用大模型發(fā)布節(jié)奏上，騰訊更像是以慢為快，不走捷徑。

騰訊董事會主席兼首席執(zhí)行官馬化騰就說：「我們最開始以為這（指AI大模型）是互聯(lián)網(wǎng)十年不遇的機會，但是越想越覺得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機遇?！?/p>

他認為，「對于工業(yè)革命來講，早一個月把電燈泡拿出來，在長的時間跨度上來看是不那么重要的。關鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實實做好?！?/p>

都說「做三四月的事情，在八九月自有答案?！褂行┩婕伊晳T了在打通概念炒作跟對韭當割鏈路后一哄而上，「三四月」的事情剛開始做就掏出了PPT、半成品，騰訊卻在「六七月」里不事張揚，直到「八九月」有了答案才讓其面世。

▲騰訊混元大模型參數(shù)規(guī)模超千億，預訓練語料超2萬億tokens。

混元大模型參數(shù)展示的樸實，可堪佐證——沒有狂堆參數(shù)，也沒展示打了多少榜，騰訊方面主要披露了兩個數(shù)字：超千億參數(shù)規(guī)模，幾乎是當前通用大模型的標配；預訓練語料超2萬億tokens，和目前最強開源模型Llama 2持平。

樸實反映的，不是能力的讓渡，而是求實的態(tài)度：不追求Chat（聊天）上的花哨，而追求應用場景上的實效；不是基于國外開源模型訓練求快，而是從零開始、全鏈路自研。

實用導向，指向的是讓大模型從「可用」變?yōu)椤负糜谩埂?/p>

不得不說，當下的大模型正陷入「又強大，又弱雞」的悖論：一方面，很多大模型在問答時能秀得一手好打油詩、抖出一番機靈，另一方面，在行業(yè)應用中又沒太多實質(zhì)性用處。

大模型研究者李莉就認為，現(xiàn)在很多模型的研究者和應用的制作者，考慮的是如何讓別人記住自己，所以效果特別視覺化，「每個視頻讓人看得血脈賁張，我們紛紛表示太酷炫了，但是靜下心來，我們對于技術該怎么用一般都沒有答案……如果真正放到經(jīng)濟中，你會發(fā)現(xiàn)根本用不上?！?/p>

這正是ChatGPT熱度滑坡的主要原因：前不久，Newsweek調(diào)查顯示，ChatGPT的用戶數(shù)量已經(jīng)比今年年初高峰時期下降了近95%。用戶選的最多的理由就是，感覺「ChatGPT對工作的促進能力沒有想象那么強」。

這難言奇怪：在行業(yè)應用場景中，用戶在意的，可不是大模型能玩什么梗、扯什么淡，而是能否提供專業(yè)知識和行業(yè)數(shù)據(jù)?！复蟆共⒉皇亲钪匾?，「?！共攀恰hatGPT上生成的很多回答，就被指看上去專業(yè)，專業(yè)人士一看卻似是而非。

而今，隨著大模型進入Gartner曲線的相對冷靜階段，越來越多的人已意識到，應用場景是決定大模型能否走遠的關鍵因素。沒有落地場景，就沒商業(yè)前景，也就難以走遠。

正因如此，大模型行業(yè)正在從拼參數(shù)變?yōu)槠绰涞兀珺端行業(yè)應用已成主戰(zhàn)場。這勾勒出的，是大模型正從「技術力」轉(zhuǎn)向「生產(chǎn)力」的商業(yè)化圖譜。

▲應用場景是大模型產(chǎn)業(yè)鏈上的重要一環(huán)。

騰訊對此就早有清晰認知：大模型的長期價值將通過行業(yè)應用來體現(xiàn)，絕不僅限于聊天機器人這樣簡單的問答場景。

這次發(fā)布會上，騰訊就強調(diào)面向產(chǎn)業(yè)，明確要以提效為第一要義。騰訊高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生就表示，「大模型需要基于產(chǎn)業(yè)場景，與企業(yè)數(shù)據(jù)融合，才能釋放出最大的價值?！?/p>

以垂（垂直大模型）應垂（垂直細分行業(yè)的需求），方為實用。今年6月，騰訊云從產(chǎn)業(yè)客戶需求場景出發(fā)，依托騰訊云TI平臺打造模型精選商店。

這次發(fā)布的混元大模型，則將作為騰訊云MaaS服務的底座，為各業(yè)務領域提供支持。

推出的是為應用而生的「從實踐中來，到實踐中去」的實用級大模型，而非花里胡哨的AI「大玩具」，本就是「實」的體現(xiàn)。

實干做派，著眼的是讓大模型更成熟更靠譜。

大模型要走入行業(yè)產(chǎn)業(yè)場景，就得減少「幻覺（即胡言亂語）」、避免「誘導（即誘導偏見或欺騙等）」。

克勞德·香農(nóng)認為，信息的本質(zhì)是消除不確定性。但體驗過的用戶都知道，當下的大模型都有著很強的「不確定性」——它經(jīng)常會變成CheatGPT，給你胡編亂造一通。

若這只是大模型跟用戶相互「調(diào)戲」，那無非是提供了些笑料，可行業(yè)場景專業(yè)度要求高、邊際容錯率低，若提供了錯誤信息，很可能引發(fā)嚴重后果。

正因如此，面向產(chǎn)業(yè)的大模型必須變得更專業(yè)更成熟更靠譜，不能是初看什么都懂、細看什么都不「專」。

騰訊為此采取的策略可以歸結(jié)為兩點：1，全鏈路自研；2，將內(nèi)部業(yè)務場景當「磨刀石」。

騰訊的混元大模型，從高速網(wǎng)絡、底層服務器到網(wǎng)卡、高速組網(wǎng)和平臺、模型、算法都是自研，AI基礎設施、機器學習框架、語料庫與模型算法等也是從零訓練。

▲混元大模型是全鏈路自主研發(fā)。

騰訊解鎖全鏈路自研，瞄準的既是運用自身的技術棧體系，實現(xiàn)根本的業(yè)務技術能力突破，也是利用自主體系的研發(fā)道路，更好地應對旗下海量高并發(fā)業(yè)務的沖擊。

客觀上講，基于國外開源模型進行「本土化改良」固然是一條更容易的路子，可大模型既然是工業(yè)革命級的機會，只依靠國外的「開源模型」遠不夠。

騰訊集團副總裁蔣杰說：「外界其實一般多會用到知識圖譜，甚至搜索外掛來讓模型的檢索支持能力變得更強，騰訊也會用，但不能用的比例很高。我們一定要在整個的大模型的預訓練階段把這個問題解決掉，控制掉?！挂劳凶匝械摹柑秸妗顾惴?，混元大模型幻覺比例比其他開源大模型下降了30%到50%。

騰訊還在向外部推出大模型前，將其在騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等50多個內(nèi)部業(yè)務中先行驗證。

先打磨好大模型產(chǎn)品，再拿出來服務行業(yè)產(chǎn)業(yè)，個中的創(chuàng)新探索與審慎務實，也是主打一個「實」。

實誠態(tài)度，立足的是讓大模型回歸服務屬性。

湯道生說：「從一個大模型，到提供一個用戶可以感受到的服務，中間有很多的環(huán)節(jié)和工序。騰訊其實是提供整個端到端的AI服務流程中所需要的‘全鏈條工具’。我們的TI平臺就是一個能滿足整個工序、環(huán)節(jié)的需求，給客戶提供高效模型搭建服務的重要工具。這可能是大家比較少從友商那里聽到的?！?/p>

將基于自研的大模型技術能力開放，將其用在從田間到產(chǎn)線的很多角落，這需要「以實干促實用」。

迄今為止，騰訊已和1萬1千家生態(tài)伙伴展開緊密合作，推出了覆蓋100多個產(chǎn)業(yè)場景的行業(yè)解決方案，共同服務千行百業(yè)。

中國科學院自動化研究所權威學者王飛躍就說，「促進原始創(chuàng)新，確保自主可控，是大模型時代我國人工智能發(fā)展的當務之急?！乖紕?chuàng)新也是為了更好地助益產(chǎn)業(yè)。

▲BAT大模型的對照。

大模型迭代優(yōu)化，也得直面社會多方對數(shù)據(jù)安全的顧慮：一直以來，有些人對大模型訓練過程中涉及的數(shù)據(jù)安全問題表示擔憂。

但主流大模型在「喂」數(shù)據(jù)時，其實需要的是那些沉淀后留下的專業(yè)性強、知識密度高的數(shù)據(jù)，而非真假難辨且缺乏知識含量的個人隱私信息，或是極度瑣碎且偏口語化的聊天內(nèi)容。

特別是那些專業(yè)大模型，在對采集到的數(shù)據(jù)加以甄別時，會對那些涉隱私信息進行清洗。

蔣杰表示，「我們可以向大家保證，我們做的小模型、大模型還是大語言模型，都絕不會使用個人隱私數(shù)據(jù)?！?/p>

不封閉，不逾矩，方顯實。

大模型很熱，但本質(zhì)上，大模型是信息化的下一幕。過去十多年的信息化對應的時代大幕上，寫著的主題是「數(shù)字化」。大模型同樣是數(shù)智化變革的助推器。

只不過，以往互聯(lián)網(wǎng)發(fā)展撬動的是流通環(huán)節(jié)減少、流通效率提升，以AI為代表的數(shù)字化工具要介入的層次更深——其核心是要增加基礎價值。

這就需要，將數(shù)字化觸角伸向生產(chǎn)端與供應側(cè)，覆蓋包括從工業(yè)制造到冶金采礦、從港口運輸?shù)睫r(nóng)林牧副漁的各行各業(yè)。

這對國內(nèi)大模型的發(fā)展不無啟示：自從ChatGPT面世后，中國大模型廠商跟OpenAI差距有多遠，就成了行業(yè)關心的話題。

應用場景或許正是中國大模型彎道超車的突破口。

國家信息中心專家張振翼就指出，當前美國在大模型發(fā)展中具備一定的領先優(yōu)勢，我國需要加強自身獨特優(yōu)勢的探索。在他看來，當前我國發(fā)展大模型人工智能主要有三個方面的優(yōu)勢：應用場景資源極為豐富、數(shù)據(jù)要素政策設計較為領先、在相關領域的技術創(chuàng)新上已經(jīng)具有一定積累等。

▲中國大模型已是百花齊放。接下來，應用場景或許是彎道超車的關鍵。

可以看到，在移動互聯(lián)網(wǎng)時代，中國互聯(lián)網(wǎng)企業(yè)就憑著衣食住行康樂教和產(chǎn)業(yè)領域的豐富場景，跑通了模式，做大了規(guī)模。

在今天，中國龐大市場上積累了海量數(shù)據(jù)，包括制造、物流、電商、醫(yī)療等各個領域的，各個行業(yè)數(shù)字化轉(zhuǎn)型的強烈需要，又為大模型落地提供了需求端支撐。

順勢而為，以實用實干實誠之「實」，加速大模型的產(chǎn)業(yè)應用，中國大模型從跟跑到并跑再到領跑的圖景，才會愈發(fā)可期。

編者按：本文轉(zhuǎn)載自微信公眾號：數(shù)字力場(ID：shuzilichang)，作者：數(shù)字力場

本文來源數(shù)字力場，內(nèi)容僅代表作者本人觀點，不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應用建議。（若存在內(nèi)容、版權或其它問題，請聯(lián)系：service@qianzhan.com）　品牌合作與廣告投放請聯(lián)系：0755-33015062 或 hezuo@qianzhan.com

p45 q1 我要投稿