李彥宏給AI開發(fā)者搭了一把梯子
作者|解碼工作室 來源|解碼Decode(ID:kankeji001)
1725年,法國(guó)的紡織工人Basile Bouchon發(fā)明了一種織布機(jī),可以根據(jù)送入的穿孔卡片指令編織圖案。打孔的是“1”,沒有打孔是“0”。這幾乎是最早出現(xiàn)的二進(jìn)制代碼,雖然此后執(zhí)行的機(jī)器發(fā)生了很大變化,但代碼的基本構(gòu)建塊卻就此延續(xù)了下來。
三百年后,編程已成為改變世界的無形力量。今天我們手中的智能手機(jī)、辦公室的自動(dòng)化系統(tǒng)甚至工廠的智能制造,它無處不在。
但AI浪潮的席卷速度,不僅超過了以往任何一場(chǎng)技術(shù)革命,也讓編程有了另外一種可能——按照李彥宏的說法,大模型和生成式AI將徹底改變開發(fā)者這個(gè)群體。
而在這背后,是百模大戰(zhàn)后徐徐鋪開的AI原生應(yīng)用建設(shè),以及在這關(guān)鍵的賽道上,中國(guó)企業(yè)已經(jīng)率先站上了起跑線。
1
AI原生應(yīng)用開發(fā),沒那么復(fù)雜
到目前為止,全世界已經(jīng)發(fā)展出超過600門的編程語(yǔ)言。從語(yǔ)法簡(jiǎn)單只有32個(gè)keywords的C語(yǔ)言,到以但丁《地獄》中第八層地獄命名的Malbolge(第一個(gè)程序花了兩年時(shí)間才被寫出來)。
但無論是哪種編程語(yǔ)言,開發(fā)者想要?jiǎng)?chuàng)建程序就要敲下海量的代碼。隨著代碼量越來越大,程序開發(fā)工作也變得無比繁雜。
例如Windows 95只有1500萬(wàn)行,Windows XP為3500萬(wàn)行,而目前程序員寫出來的最大軟件是Google在線服務(wù),大概是20億行代碼,大概是一名程序員正常發(fā)量的13000倍。
而當(dāng)前正值移動(dòng)互聯(lián)網(wǎng)轉(zhuǎn)向AI時(shí)代,按照李彥宏的觀點(diǎn),AI時(shí)代需要100萬(wàn)量級(jí)的原生應(yīng)用,趨近2021年手機(jī)App總量的三分之一。
如果參考支付寶僅2019年一年就增加了4億行代碼(相當(dāng)于80個(gè)魔獸世界)的話,AI原生應(yīng)用需要程序員敲下的代碼量可想而知。
而且AI原生應(yīng)用在邏輯上完全不同于Native App,需要以AI為出發(fā)點(diǎn),將AI作為核心驅(qū)動(dòng)力,重新設(shè)計(jì)和構(gòu)建應(yīng)用。
不久前,一位開發(fā)者在論壇上發(fā)布了一則AI原生應(yīng)用速通指南,雖然開發(fā)流程只有5條,但對(duì)于開發(fā)者來說工作量并不低,僅數(shù)據(jù)準(zhǔn)備一項(xiàng)就要耗費(fèi)大量的人力物力,更別提需要用到的關(guān)鍵技術(shù)。
但隨著Transformer推開大模型時(shí)代的大門,不僅AI應(yīng)用的轉(zhuǎn)機(jī)來了,程序員開發(fā)者的轉(zhuǎn)機(jī)也出現(xiàn)了。
在AI時(shí)代,科技巨頭們不僅在意如何讓技術(shù)更容易地被用戶接受,同時(shí)也在思考如何簡(jiǎn)化程序員的工作。
去年OpenAI推出的GPTs和今年Hugging Face發(fā)布的HuggingChat助手,它們通過將能力封裝,把開發(fā)門檻拉低,進(jìn)而創(chuàng)造了一個(gè)新的職業(yè)——不會(huì)編程的開發(fā)者、任何一個(gè)普通用戶都能創(chuàng)建自己的AI應(yīng)用。
如今,給普通人搭梯子的名單上又多了一家科技巨頭,并且是使用中文作為自然語(yǔ)言prompt。
2
“人人都是開發(fā)者”
「打開開發(fā)界面,第一步給應(yīng)用起名,第二步填寫角色指令,第三步再插入需要的工具組件?!?/p>
這是出現(xiàn)在今年Create2024百度AI開發(fā)者大會(huì)上的一幕。在零代碼的情況下,一個(gè)AI原生應(yīng)用就生成了。
開發(fā)者借助百度發(fā)布的AI原生應(yīng)用開發(fā)工具AppBuilder,不寫一行代碼,最快只需三步,就可以用自然語(yǔ)言開發(fā)出一個(gè)應(yīng)用,并且還能便捷地發(fā)布、集成到各種各樣的業(yè)務(wù)環(huán)境中。
在AppBuilder上面,百度也提供了一定的跨模態(tài)能力,開發(fā)者只需要給一段文字,或者幾句話,就可以快速創(chuàng)建繪畫類應(yīng)用。百度文庫(kù)最新推出的漫畫生成和繪本生成功能,就利用了AppBuilder上提供的這類組件。
關(guān)鍵,類似這樣的開發(fā)工具,百度一口氣發(fā)布了三款,除了AppBuilder,還有智能體開發(fā)工具AgentBuilder和面向?qū)I(yè)開發(fā)者的ModelBuilder,主打一個(gè)「開箱即用」。
其中,AgentBuilder也是零代碼開發(fā),整個(gè)過程完全不需要編程,通過類似prompt(提示詞)的信息輸入,和簡(jiǎn)單的幾步操作調(diào)優(yōu),就能迅速生成一個(gè)智能體。目前百度已經(jīng)與攜程合作,提供酒店、景點(diǎn)、票務(wù)等旅游服務(wù)工具。
而為專業(yè)開發(fā)者準(zhǔn)備的ModelBuilder,可以根據(jù)開發(fā)者的需求定制任意尺寸的模型,并根據(jù)細(xì)分場(chǎng)景對(duì)模型進(jìn)一步精調(diào),達(dá)到更好的效果。
ModelBuilder中既包括適合通用復(fù)雜場(chǎng)景的旗艦版ERNIE3.5和ERNIE4.0,也有Speed、Lite、Tiny三個(gè)輕量級(jí)大模型和ERNIE Character、ERNIE Functions兩個(gè)垂直場(chǎng)景模型,也覆蓋了國(guó)內(nèi)外其它第三方主流模型,預(yù)置量多達(dá)77個(gè)大模型,是國(guó)內(nèi)擁有大模型數(shù)量最多的開發(fā)平臺(tái)。
前兩款工具可實(shí)現(xiàn)“人人都是開發(fā)者”,相當(dāng)于是AI原生應(yīng)用的沖量擔(dān)當(dāng),而后一款工具則是保質(zhì)擔(dān)當(dāng)。
李彥宏判斷,未來絕大多數(shù)的AI原生應(yīng)用都是MoE的,也就是大小模型混用,不依賴一個(gè)模型來解決所有問題。
而ModelBuilder也是參考MoE思路,開發(fā)者在一個(gè)平臺(tái)上可調(diào)用多個(gè)大模型,意味著開發(fā)成本和產(chǎn)品性能都能達(dá)到相對(duì)最優(yōu)。
大會(huì)上展示的小度添添AI機(jī)器人日程規(guī)劃功能,就是調(diào)用了不同的模型。
先是由小模型ERNIE Tiny執(zhí)行“模型路由”工作,把晨跑中的天氣問題分配給基于ERNIE Lite打造的精調(diào)模型,快速查出氣溫25度、天氣晴朗這些信息;同時(shí),又把更復(fù)雜的日程安排,分配給性能最好的文心4.0大模型,來計(jì)算一天各項(xiàng)事項(xiàng)安排。
總的來說,MoE架構(gòu)既能提升開發(fā)平臺(tái)的“寬度”,也能兼顧“深度”,大大降低開發(fā)時(shí)的算力消耗,降低應(yīng)用門檻。
對(duì)多模態(tài)大模型而言,百度推出的三大AI開發(fā)神器,將會(huì)加速killer App的出現(xiàn)時(shí)間,而對(duì)于視覺大模型來說,其最大應(yīng)用場(chǎng)景——自動(dòng)駕駛,早已被市場(chǎng)驗(yàn)真了。
百度在視覺大模型的發(fā)展有目共睹,不只是訓(xùn)練AI如何生成視頻,更是訓(xùn)練AI理解和生成一個(gè)真實(shí)的場(chǎng)景或世界。
基于超過1億公里的中國(guó)復(fù)雜城市道路測(cè)試?yán)锍虜?shù)據(jù),百度訓(xùn)練出來的Apollo視覺感知大模型,具備檢測(cè)、跟蹤、理解、建圖四大基礎(chǔ)能力。百度也將這些能力下放到了具體產(chǎn)品,比如已在武漢實(shí)現(xiàn)7X24小時(shí)全天候運(yùn)營(yíng)的蘿卜快跑,以及將視覺感知大模型應(yīng)用到了制圖領(lǐng)域的百度地圖。
3
梯子要穩(wěn)固
去年,著名計(jì)算機(jī)科學(xué)家吳恩達(dá)曾在斯坦福做過一場(chǎng)題演講。他認(rèn)為AI其實(shí)和電力、互聯(lián)網(wǎng)一樣,是一項(xiàng)通用技術(shù),更多的機(jī)會(huì)在于大規(guī)模應(yīng)用落地。
這與李彥宏此前的觀點(diǎn)不謀而合。在基礎(chǔ)模型之上,要有千千萬(wàn)萬(wàn)甚至數(shù)以百萬(wàn)計(jì)的AI原生應(yīng)用,大模型的價(jià)值才能被體現(xiàn)出來。
而今天百度發(fā)布的三大AI開發(fā)神器,相當(dāng)于搭了一把梯子,讓開發(fā)者和企業(yè)能夠不費(fèi)力的進(jìn)入AGI時(shí)代。但這里面一個(gè)重要的前提是,這把梯子要足夠的穩(wěn)固。
而所謂穩(wěn)固,指的就是基礎(chǔ)大模型的技術(shù)水平要過硬。
從數(shù)據(jù)上看,相比一年前文心大模型的算法訓(xùn)練效率提升了5.1倍,周均訓(xùn)練有效率超過了98%,推理性能提升了105倍,推理的成本降到了原來的1%。也就是說,客戶原來一天調(diào)用1萬(wàn)次,同樣成本現(xiàn)在可以調(diào)用100萬(wàn)次。
發(fā)布一年零一個(gè)月以來,文心一言用戶數(shù)突破2億,API日均調(diào)用量也突破了2億,服務(wù)的客戶數(shù)達(dá)到了8.5萬(wàn),利用千帆平臺(tái)開發(fā)的AI原生應(yīng)用數(shù)超過了19萬(wàn)。
對(duì)于企業(yè)和開發(fā)者來說,基于文心大模型開發(fā)原生應(yīng)用、做二次開發(fā),都能夠擁有更低的推理成本和更高的訓(xùn)練效率。
這主要基于李彥宏此前對(duì)大模型一個(gè)精準(zhǔn)判斷,與模型開源會(huì)越來越落后不同,閉源有真正商業(yè)模式,能夠賺到錢,且在成本上有優(yōu)勢(shì),只要是同等能力,閉源模型的推理成本一定是更低的,響應(yīng)速度一定是更快的。
事實(shí)上,有了強(qiáng)大的基礎(chǔ)大模型,百度能提供很多低門檻,甚至零門檻的開發(fā)工具,大大提高開發(fā)者的生產(chǎn)力。比如三大AI開發(fā)工具之外,基于文心大模型的智能代碼助手Comate。
不僅支持100多種語(yǔ)言和所有主流IDE平臺(tái),可以推薦代碼、生成代碼注釋、進(jìn)行代碼續(xù)寫、查找代碼缺陷、給出優(yōu)化方案,還可以深度解讀代碼庫(kù)、關(guān)聯(lián)私域知識(shí)生成新的代碼。
上崗一年多以來,Comate已經(jīng)走入了喜馬拉雅、三菱電梯、軟通動(dòng)力等上萬(wàn)家企業(yè),生成的代碼采納率達(dá)到了46%,百度每天新增的代碼中,已經(jīng)有27%是由Comate生成的。
顯然,想要壯大AI原生應(yīng)用生態(tài),僅靠某一家公司遠(yuǎn)遠(yuǎn)不夠,需要發(fā)動(dòng)更多人一起參與創(chuàng)新。
去年5月,百度啟動(dòng)了“文心杯”創(chuàng)業(yè)大賽,幫助創(chuàng)業(yè)者、開發(fā)者開發(fā)各種AI原生應(yīng)用。在第一屆大賽中,百度為15支優(yōu)勝團(tuán)隊(duì)提供了數(shù)千萬(wàn)元的資金支持,并在技術(shù)、團(tuán)隊(duì)和資源上持續(xù)提供全方位扶持。今年將擴(kuò)大項(xiàng)目篩選范圍、設(shè)置分賽場(chǎng),加大對(duì)創(chuàng)業(yè)者的支持力度,特別優(yōu)秀的項(xiàng)目將有機(jī)會(huì)獲得最高5000萬(wàn)人民幣的現(xiàn)金和資源支持。
4
尾聲
2023年6月,Open AI安全系統(tǒng)負(fù)責(zé)人&前應(yīng)用研究負(fù)責(zé)人Lilian Weng在博客中發(fā)表了一篇文章《大模型驅(qū)動(dòng)的自主代理(LLM Powered Autonomous Agents)》。
Lilian Weng將AI發(fā)展路徑類比自動(dòng)駕駛L1-L5,而人類當(dāng)前所處的位置正好從Copilot向Agent過渡。
這對(duì)人類社會(huì)而言,意味著一次巨大的變革正在孕育,它將惠及產(chǎn)業(yè)和生活的方方面面。而在這個(gè)過渡階段里,如何讓更多“高樓大廈”在大模型的地基上拔地而起,正是中國(guó)在生成式AI的賽道上,實(shí)現(xiàn)反超的最大機(jī)會(huì)。
與此同時(shí)也是百度的巨大機(jī)會(huì)。文心一言、百度文庫(kù)、百度新搜索等,AI原生應(yīng)用釋放出的新變現(xiàn)機(jī)會(huì),將開啟長(zhǎng)期增長(zhǎng)空間。
中國(guó)有10億互聯(lián)網(wǎng)用戶,有強(qiáng)大的基礎(chǔ)大模型,有足夠多的AI應(yīng)用場(chǎng)景,有全球最完備的產(chǎn)業(yè)體系,國(guó)家也在大力鼓勵(lì)和支持“人工智能+”行動(dòng),每一個(gè)人,每一個(gè)企業(yè),只需要充分利用這些工具,就可以釋放無限的創(chuàng)造力和生產(chǎn)力。
免責(zé)聲明:本文基于已公開的資料信息或受訪人提供的信息撰寫,但解碼Decode及文章作者不保證該等信息資料的完整性、準(zhǔn)確性。在任何情況下,本文中的信息或所表述的意見均不構(gòu)成對(duì)任何人的投資建議。
編者按:本文轉(zhuǎn)載自微信公眾號(hào):解碼Decode(ID:kankeji001),作者:解碼工作室
前瞻經(jīng)濟(jì)學(xué)人
專注于中國(guó)各行業(yè)市場(chǎng)分析、未來發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。