報(bào)告服務(wù)熱線400-068-7188

文心一言全面開放,屬于百度的“iPhone時(shí)刻”

分享到:
20 解碼Decode ? 2023-09-01 09:40:38  來源:解碼Decode E3850G0

1

(圖片來源:攝圖網(wǎng))

作者|解碼工作室 來源|解碼Decode(ID:kankeji001)

8月31日凌晨,百度宣布文心一言首批獲批上線,正式向公眾開放服務(wù)。目前用戶已經(jīng)可以在App Store(免費(fèi)榜第一)、官網(wǎng)下載/體驗(yàn),無需申請(qǐng)內(nèi)測(cè)資格即可使用。

大模型獲批,意味著文心一言將向所有用戶全面開放,并在用戶積累、數(shù)據(jù)獲取和產(chǎn)品迭代上占有優(yōu)勢(shì)。

李彥宏的表態(tài)也直截了當(dāng),當(dāng)文心一言向數(shù)以億計(jì)互聯(lián)網(wǎng)用戶大規(guī)模開放服務(wù)后,能夠獲得大量真實(shí)世界中的人工反饋,這將進(jìn)一步改進(jìn)基礎(chǔ)模型,并以更快速度迭代文心一言,創(chuàng)造更好的用戶體驗(yàn)。

與此同時(shí),大模型也將逐漸從參數(shù)之爭演變到以AI應(yīng)用和產(chǎn)業(yè)落地為主的生態(tài)之爭。而百度此前啟動(dòng)的大模型領(lǐng)域首個(gè)創(chuàng)業(yè)大賽,據(jù)悉將在10月17日宣布結(jié)果。

據(jù)稱百度內(nèi)部對(duì)此非常重視,李彥宏甚至直接過問并指揮百度戰(zhàn)投與參賽者接洽,對(duì)優(yōu)秀產(chǎn)品給予資源和資金支持。

受開放消息提振,百度今夜凌晨美股盤中一度漲超5%。給予資本市場(chǎng)信心的一方面是文心一言的開放,另一方面也有此前被視為文心一言直接競(jìng)對(duì)的阿里通義千問、360智腦、訊飛星火等均不在首批獲批名單中。

某種程度上,這是對(duì)百度和文心一言的認(rèn)可,但同時(shí)也是一種鞭策。

信心從哪來?

本質(zhì)上,大模型就不是一個(gè)一蹴而就的事。

以百度為例,早在2019年就推出了知識(shí)增強(qiáng)的文心大模型1.0,2021年,百度又發(fā)布了全球首個(gè)百億參數(shù)的對(duì)話大模型PLATO-XL。

文心大模型系列經(jīng)過不斷迭代,為推出大語言模型“文心一言”打下了基礎(chǔ)。后來的故事大家都知道了,文心大模型在產(chǎn)品能力、生態(tài)能力方面處于國內(nèi)第一梯隊(duì)的水平。

從模型來看,文心一言是高度本土化的大語言模型,更加匹配中文環(huán)境的使用習(xí)慣,作為百度基本盤的搜索業(yè)務(wù),不僅能夠提供巨大的基礎(chǔ)數(shù)據(jù),而且在中文搜索上具有顯著優(yōu)勢(shì)。

1

甚至此前,在AGIEval、C-Eval等中英文權(quán)威測(cè)試集和MMLU英文權(quán)威測(cè)試集中,文心大模型3.5取得了超過ChatGPT和LLaMa、ChatGLM等其他大模型的分?jǐn)?shù)表現(xiàn),在中文評(píng)測(cè)中甚至有超越GPT-4的表現(xiàn)。

而文心一言之所以能取得這樣的成績,自然離不開百度壓強(qiáng)式、馬拉松式的研發(fā)投入。

數(shù)據(jù)顯示,過去十年來,百度已投入了超千億的研發(fā)費(fèi)用,研發(fā)費(fèi)用率從15%提升至去年的22.4%。對(duì)比海外互聯(lián)網(wǎng)大廠,百度的研發(fā)投入占比也為較高水平。在高強(qiáng)度的研發(fā)投入下,百度取得的成果也是顯著的。

如果仔細(xì)剖析這些成果,又是另外一層故事了。

任何一個(gè)行業(yè)都不能沒有創(chuàng)新,但并不是每一個(gè)行業(yè)都需要持續(xù)性的大規(guī)模研發(fā)投入。比如新能源汽車市場(chǎng),寧德時(shí)代的研發(fā)費(fèi)用就比小米還要低,這其中涉及到產(chǎn)業(yè)特征、環(huán)境、創(chuàng)新周期等多重因素。

百度在研發(fā)上的持續(xù)投入,一方面是因?yàn)榧夹g(shù)型企業(yè)本身就要保持不斷地迭代;另一方面也是因?yàn)榍罢靶圆季帧?/p>

百度布局AI最早可追溯到2010年,在移動(dòng)互聯(lián)網(wǎng)和智能手機(jī)尚未普及的年代布局AI,沒有點(diǎn)魄力和前瞻性真的不行。

那么這么多年持續(xù)性的投入又給百度帶來了什么呢?

表層上我們看到的是大模型、智能云等產(chǎn)品,而本質(zhì)上百度其實(shí)構(gòu)建了一個(gè)圍繞技術(shù)迭代不斷創(chuàng)新的周期穿越能力。

這種能力在其它科技巨頭身上也有,比如亞馬遜的長期主義、微軟堅(jiān)定不移的投資OpenAI,相較下來靠為大模型提供彈藥從而股價(jià)暴漲的英偉達(dá)多少有些躺賺的意思了。

而百度這種能力的的具象表現(xiàn),可以用其改變和引領(lǐng)的四層技術(shù)棧變革舉例:芯片層、框架層、模型層和應(yīng)用層,百度針對(duì)每一層都都有領(lǐng)先業(yè)界的關(guān)鍵自研技術(shù)。

在芯片層有昆侖芯、在框架層有飛槳、在模型層是文心大模型、在應(yīng)用層是搜索等等。

并且這些產(chǎn)品或技術(shù)仍在不斷迭代進(jìn)化,以文心一言為例,根據(jù)官方數(shù)據(jù),自3月發(fā)布以來,文心一言熟練掌握的創(chuàng)作體裁超過200個(gè),內(nèi)容豐富度是發(fā)布初期的1.6倍,思維鏈長度是初期的2.1倍,知識(shí)點(diǎn)覆蓋達(dá)到初期的8.3倍。

其他方面,飛槳深度學(xué)習(xí)平臺(tái)已凝聚800萬開發(fā)者,服務(wù)22萬家企事業(yè)單位;“飛槳AI Studio”(星河社區(qū))已囊括609萬開發(fā)項(xiàng)目,成中國最大的AI社區(qū);并且百度還推出了降低開發(fā)門檻的插件開發(fā)工具集(ERNIE Bot SDK),可支持信息服務(wù)類、工具類、基于大語言模型創(chuàng)新類等多種類型的插件開發(fā),這些都是百度交出的實(shí)打?qū)嵉某煽儐巍?/p>

遠(yuǎn)方:真正的“飛輪”

關(guān)于文心一言向公眾開放,其實(shí)背后的產(chǎn)業(yè)邏輯仍舊是時(shí)間成本問題。大模型與大模型之間的差異,如果去除設(shè)備、數(shù)據(jù)等不同因素,最主要的差異就在訓(xùn)練的時(shí)間成本不同。

而在向公眾開放這件事上也是如此,大語言模型LLM特點(diǎn)是Generative pre-training(生成性預(yù)訓(xùn)練),其目標(biāo)是根據(jù)現(xiàn)有數(shù)據(jù)提高模型生成新且準(zhǔn)確信息的能力。

這種方法包括兩個(gè)主要步驟:預(yù)訓(xùn)練和微調(diào)。預(yù)訓(xùn)練階段使用大量未標(biāo)注數(shù)據(jù)訓(xùn)練模型的生成能力,通常采用自監(jiān)督學(xué)習(xí)技術(shù),模型嘗試預(yù)測(cè)數(shù)據(jù)中的缺失信息或關(guān)系;微調(diào)階段則針對(duì)特定任務(wù)或數(shù)據(jù)集進(jìn)行調(diào)整。

而越早開放,意味著大模型能夠?qū)W習(xí)更多,產(chǎn)品進(jìn)步迭代也會(huì)更快。例如,從GPT-3.5到GPT-4的迭代時(shí)間只用了三個(gè)月。

但大模型真正的“飛輪”嚴(yán)格意義上來說并不是其本身,而是圍繞大模型即將誕生的“AI時(shí)代操作系統(tǒng)”,也可以理解為黃仁勛口中的“iPhone時(shí)刻”。

我們可以將其視作圍繞AI展開的操作系統(tǒng)或底層平臺(tái),類比移動(dòng)互聯(lián)網(wǎng)時(shí)代誕生的操作系統(tǒng)iOS及安卓。不同之處在于,大模型并不是依靠硬件終端變化來實(shí)現(xiàn)代際變革,而是依靠人工智能技術(shù)為用戶提供的實(shí)際便利場(chǎng)景去完成用戶習(xí)慣的遷移。

具體來說,上述代際變革的實(shí)現(xiàn)依靠的是IT技術(shù)棧中的應(yīng)用層。而在大模型平臺(tái)化的邏輯下,有兩類廠商值得關(guān)注:

1 有一定技術(shù)實(shí)力能夠獨(dú)立開發(fā)大模型的科技巨頭,比如谷歌、百度、Meta、華為、阿里等,這類公司一般技術(shù)積累相對(duì)雄厚,應(yīng)用場(chǎng)景也更加直觀。其通用人工智能領(lǐng)域的想象空間不會(huì)止于SaaS軟件服務(wù),內(nèi)容消費(fèi)、社交娛樂等巨頭更擅長的領(lǐng)域會(huì)迅速接棒;

2 有能力快速接入大模型生態(tài),將自身應(yīng)用插件化/原生化的廠商:用戶基礎(chǔ)大、有實(shí)際應(yīng)用場(chǎng)景的公司會(huì)盡快接入,先發(fā)優(yōu)勢(shì)下,這類廠商的估值將直接受益于大模型的波浪式創(chuàng)新。

而在可預(yù)見的未來,會(huì)有更多的外部成熟應(yīng)用將向AI平臺(tái)遷移,開啟“手轉(zhuǎn)AI”浪潮。

隨著外部成熟應(yīng)用的交互圈層擴(kuò)大,大模型與用戶日常生活將結(jié)合得更加緊密,參考移動(dòng)互聯(lián)網(wǎng)時(shí)代的端轉(zhuǎn)手趨勢(shì),主流應(yīng)用即將展開向AI平臺(tái)的遷移,即探索AI 加持下自身應(yīng)用的新場(chǎng)景。

今年的中關(guān)村論壇,李彥宏其實(shí)已經(jīng)提到過,大模型會(huì)催生AI原生應(yīng)用。百度也的確在這方面走的比較超前,正在用AI原生思維重構(gòu)所有的產(chǎn)品、服務(wù)和工作流程。百度要做第一個(gè)把全部產(chǎn)品重做一遍的公司,不是整合,不是接入,是重做,重構(gòu)。

這是整個(gè)業(yè)界都非常期待的,特別是其中一點(diǎn),“不是整合,不是接入,是重做,重構(gòu)”。從這點(diǎn)來看,百度應(yīng)該是有過思考的,這個(gè)思路和AI原生所表達(dá)的一樣。

以往的AI產(chǎn)品更多的是整合或接入,即用AI來改造現(xiàn)有系統(tǒng),期待現(xiàn)有系統(tǒng)有一定的智能水平。但AI原生不是這樣,是需要在產(chǎn)品設(shè)計(jì)中就考慮每一個(gè)組件都直接或間接來使用AI,來實(shí)現(xiàn)數(shù)據(jù)和知識(shí)的驅(qū)動(dòng)。如果沒有重做或重構(gòu),是無法實(shí)現(xiàn)的。

比如OpenAI正考慮為AI軟件創(chuàng)建一個(gè)應(yīng)用商店,以及估值超2億美元的DoNotPay這樣的應(yīng)用已經(jīng)展現(xiàn)出繁榮的趨勢(shì)。好消息是,百度將在Baidu World 2023上發(fā)布多款A(yù)I原生應(yīng)用,并分享如何通過AI原生思維與產(chǎn)業(yè)界實(shí)現(xiàn)共贏。

而且,為加速實(shí)現(xiàn)大模型在產(chǎn)業(yè)端的應(yīng)用落地,挖掘國內(nèi)AI原生的產(chǎn)品,百度也已經(jīng)宣布將舉辦大模型領(lǐng)域首個(gè)創(chuàng)業(yè)大賽,將以百度全棧式技術(shù)優(yōu)勢(shì)加持,同時(shí)設(shè)立基金規(guī)模10億元的文心投資基金,致力于推動(dòng)大模型賦能千行百業(yè)。

尾聲

正如巴里施瓦茨在《選擇的悖論》中提到:“我們要面對(duì)的選擇不斷增加,需要評(píng)估的信息也在相應(yīng)增長,我們發(fā)現(xiàn)自己越來越依賴那些二手資料,而不是一手的個(gè)人經(jīng)驗(yàn)”。

生成式AI正在扮演這樣一個(gè)角色。

今天往后,所有人都可以通過文心一言獲取最符合自己的搜索答案,未來也可以在百度網(wǎng)盤、百度文庫、小度等更多產(chǎn)品中使用到AI能力。

但這只是一個(gè)開始,AIGC真正的魅力在于生態(tài)的成型,更多的外部開發(fā)者甚至更多的普通用戶,可以借助文心大模型的能力構(gòu)建屬于自己的產(chǎn)品或服務(wù)。換言之,AI將真正成為普世化、低門檻、高效率的生產(chǎn)力工具。

從這個(gè)角度看,文心一言向公眾開放或許是一個(gè)新時(shí)代到來的轉(zhuǎn)折點(diǎn)。

參考資料

[1] 八家互聯(lián)網(wǎng)大廠大模型,從通用模型到應(yīng)用落地,零壹智庫

[2] ChatGPT對(duì)外開放插件,行業(yè)格局將迎來重塑,華西證券

[3] OpenAI擬打造AI應(yīng)用商店,智能助理生態(tài)初現(xiàn)雛形,國盛證券

[4] 百度李彥宏:人工智能時(shí)代,IT技術(shù)棧發(fā)生了根本性變化,每日經(jīng)濟(jì)新聞

[5] 海外ChatGPT/GPT-4 如何賦能應(yīng)用,華泰證券

[6] 李彥宏提及的AI原生應(yīng)用是什么?知乎@wgwang

編者按:本文轉(zhuǎn)載自微信公眾號(hào):解碼Decode(ID:kankeji001),作者:解碼工作室 

本文來源解碼Decode,內(nèi)容僅代表作者本人觀點(diǎn),不代表前瞻網(wǎng)的立場(chǎng)。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問題,請(qǐng)聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請(qǐng)聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p50 q0 我要投稿

分享:
標(biāo)簽: 文心一言 百度

品牌、內(nèi)容合作請(qǐng)點(diǎn)這里:尋求合作 ››

前瞻經(jīng)濟(jì)學(xué)人

專注于中國各行業(yè)市場(chǎng)分析、未來發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫
企查貓
作者 解碼Decode
科技自媒體
59137
關(guān)注
85
文章
前瞻經(jīng)濟(jì)學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟(jì)學(xué)家互動(dòng)交流讓您成為更懂趨勢(shì)的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟(jì)學(xué)人》APP提問

 
在線咨詢
×
在線咨詢

項(xiàng)目熱線 0755-33015070

AAPP
前瞻經(jīng)濟(jì)學(xué)人APP下載二維碼

下載前瞻經(jīng)濟(jì)學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號(hào)

掃一掃關(guān)注我們

我要投稿

×
J