云計(jì)算迎來中場(chǎng)戰(zhàn)役,MaaS或?qū)⒊蔀閺澋莱嚒靶沦慄c(diǎn)”
(圖片來源:攝圖網(wǎng))
作者|科技云報(bào)道 來源|科技云報(bào)到(ID:ITCloud-BD)
沒有人能預(yù)見未來,但我們可以因循常識(shí),去捕捉技術(shù)創(chuàng)新演進(jìn)的節(jié)奏韻腳。
2023年最火的風(fēng)口莫過于大模型。
2022年底,由美國(guó)初創(chuàng)企業(yè)OpenAI開發(fā)的聊天應(yīng)用ChatGPT引爆市場(chǎng),生成式AI成為科技市場(chǎng)熱點(diǎn),ChatGPT背后是深度學(xué)習(xí)大模型,其理解和生成文字的能力超過以往AI產(chǎn)品。
全球主要云計(jì)算公司加入其中,爭(zhēng)奪算力、下場(chǎng)開發(fā)和銷售大模型,云計(jì)算市場(chǎng)迎來新一輪競(jìng)爭(zhēng)熱潮,覆蓋AI計(jì)算所需的算力、算法、數(shù)據(jù)各層面。
如今,大模型這把火已經(jīng)從自然語(yǔ)言燒到千行百業(yè)。相較于花力氣讓大模型更流暢地應(yīng)對(duì)各種刁鉆問題,MaaS正成為AI大模型比拼的重點(diǎn)。
一
企業(yè)大模型
落地挑戰(zhàn)重重
目前,行業(yè)大模型跟產(chǎn)業(yè)的結(jié)合,還處在比較早期的階段。
一方面,大模型技術(shù)的發(fā)展日新月異,無論是算力層面、模型小型化、數(shù)據(jù)標(biāo)注、數(shù)據(jù)訓(xùn)練還是開元模型層面,都在快速變化的過程中;另一方面,整個(gè)產(chǎn)業(yè)對(duì)大模型能力和應(yīng)用方式的理解,也還在初級(jí)階段。
通常來說,一家企業(yè)想要搭建行業(yè)大模型,有幾個(gè)環(huán)節(jié)必不可少:挑選適合自己使用場(chǎng)景的模型,使用云廠商專業(yè)工具搭建一體化模型服務(wù),梳理測(cè)試用例、建立服務(wù)質(zhì)量評(píng)估流程,確保數(shù)據(jù)及模型應(yīng)用安全、合規(guī)和可控。
而企業(yè)想要在實(shí)際業(yè)務(wù)場(chǎng)景中部署使用大模型服務(wù),則面臨著成本、數(shù)據(jù)和安全等諸多落地難題。
首先,計(jì)算資源少。大模型需要比較高的計(jì)算資源和存儲(chǔ)資源。與一般服務(wù)器相比,GPU服務(wù)器的穩(wěn)定性比較低,大模型訓(xùn)練需要的GPU經(jīng)常達(dá)到上千張卡。
同時(shí),在訓(xùn)練集群里,連接幾百臺(tái)GPU服務(wù)器所需要的網(wǎng)絡(luò)速度極高,一旦網(wǎng)絡(luò)產(chǎn)生擁堵,就會(huì)影響訓(xùn)練效率。所以很多算法團(tuán)隊(duì)傾向于選擇專業(yè)的云服務(wù)廠商進(jìn)行云服務(wù)運(yùn)維支持。
其次,數(shù)據(jù)質(zhì)量比較差。
搭建大模型本身就是一項(xiàng)成本極高的系統(tǒng)工程,需要大量的高質(zhì)量數(shù)據(jù)進(jìn)行訓(xùn)練和優(yōu)化,還需要經(jīng)過清洗和預(yù)處理,以消除噪聲、填補(bǔ)缺失值并確保數(shù)據(jù)質(zhì)量。如果導(dǎo)入的數(shù)據(jù)質(zhì)量低,那訓(xùn)練出來的模型也會(huì)有問題。
第三,投入成本高,這也是大模型落地面臨的主要困難之一。大模型需要投入大量的數(shù)據(jù)、計(jì)算資源、專業(yè)技術(shù)和時(shí)間來訓(xùn)練、調(diào)試、優(yōu)化并部署實(shí)施。
第四,專業(yè)經(jīng)驗(yàn)少。大模型的開發(fā)落地需要比較多的技術(shù)和人力資源,部署大模型需要考慮到計(jì)算資源、網(wǎng)絡(luò)帶寬和安全性等多方面問題,很多企業(yè)比較缺乏相關(guān)技術(shù)和人才,導(dǎo)致大模型無法順利落地應(yīng)用。
二
MaaS重塑
云計(jì)算服務(wù)范式
MaaS,即“Model as a Service,模型即服務(wù)”,是通過云服務(wù)將數(shù)據(jù)處理和機(jī)器學(xué)習(xí)模型的功能集成到現(xiàn)有業(yè)務(wù)中,為企業(yè)提供智能化、自動(dòng)化的解決方案。MaaS的大模型可以通過從海量的、多類型的場(chǎng)景數(shù)據(jù)中學(xué)習(xí),總結(jié)學(xué)習(xí)不同場(chǎng)景業(yè)務(wù)下的通用特征和規(guī)則,成為具有泛化能力的模型底座。
數(shù)據(jù)集倉(cāng)庫(kù)、模型倉(cāng)庫(kù)、算力平臺(tái)通過提供零門檻模型體驗(yàn)、快捷的模型使用、完整鏈路的模型定制和云端模型部署向每個(gè)人開放。
從形式上看,MaaS是典型的云智一體。所謂“云智一體”,是三年前百度智能云在戰(zhàn)略發(fā)布中提出的理念,通過云計(jì)算和人工智能融合創(chuàng)新,把算力、框架、模型,場(chǎng)景應(yīng)用打造成標(biāo)準(zhǔn)化產(chǎn)品,進(jìn)而降低企業(yè)獲取和使用人工智能的門檻。
百度、阿里乃至更多云計(jì)算企業(yè),如今將目光投向“云智一體”,印證了AI應(yīng)用能力是云計(jì)算產(chǎn)業(yè)基礎(chǔ)設(shè)施成熟后的核心能力。這種能力更在于“智”的水平,在智能基礎(chǔ)設(shè)施之上的通用型AI產(chǎn)品能力。
從云計(jì)算服務(wù)范式看,大模型的迭代升級(jí)也重塑了傳統(tǒng)的云計(jì)算服務(wù)。以往,云計(jì)算更專注算力能力,服務(wù)模型集中在IaaS、PaaS、SaaS三層;如今,云計(jì)算在大模型驅(qū)動(dòng)下具備了更強(qiáng)的集成能力,在算力、算法和應(yīng)用層中嵌入大模型,進(jìn)而強(qiáng)化云計(jì)算的“智”,以智能底座集成應(yīng)用并統(tǒng)一對(duì)外輸出,實(shí)現(xiàn)場(chǎng)景端的生產(chǎn)力解放。
雖然MaaS目前針對(duì)的場(chǎng)景還處在基于自然語(yǔ)言處理(NLP)的領(lǐng)域,但是隨著技術(shù)的迭代,遵循其核心思想進(jìn)行延展,廣義的MaaS恰恰有可能針對(duì)上述的難點(diǎn),發(fā)揮重要作用。
在數(shù)據(jù)清洗和整合方面,MaaS可以幫助企業(yè)將來自不同系統(tǒng)和部門的數(shù)據(jù)進(jìn)行清洗、整合和轉(zhuǎn)換,形成完整、可靠的數(shù)據(jù)集。
通過將來自不同部門的數(shù)據(jù)整合到一個(gè)數(shù)據(jù)倉(cāng)庫(kù)中,MaaS可以確保數(shù)據(jù)的完整性和一致性。此外,MaaS還可以對(duì)海量數(shù)據(jù)進(jìn)行自動(dòng)化處理和分析,快速發(fā)現(xiàn)業(yè)務(wù)的異常情況和趨勢(shì)變化。
在數(shù)據(jù)分析和挖掘方面,MaaS可以對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分析和挖掘,從中發(fā)現(xiàn)業(yè)務(wù)之間的關(guān)聯(lián)和規(guī)律,為企業(yè)提供更全面、準(zhǔn)確的財(cái)務(wù)數(shù)據(jù),并支持更好的決策和管理。
例如,當(dāng)企業(yè)需要進(jìn)行銷售訂單和庫(kù)存的分析時(shí),MaaS需要輸入銷售訂單和庫(kù)存數(shù)據(jù),這些數(shù)據(jù)可以來自企業(yè)的不同部門,比如銷售部門、庫(kù)存管理部門等。之后,MaaS會(huì)使用NLP技術(shù)自動(dòng)化處理和分析這些數(shù)據(jù),例如,識(shí)別和分類訂單的狀態(tài)、計(jì)算庫(kù)存周轉(zhuǎn)率等。
在數(shù)據(jù)處理的過程中,MaaS會(huì)快速發(fā)現(xiàn)業(yè)務(wù)的異常情況和趨勢(shì)變化,如訂單的滯銷和庫(kù)存的積壓等。
在智能化決策支持方面,MaaS可以為企業(yè)提供智能化的決策支持,通過機(jī)器學(xué)習(xí)模型預(yù)測(cè)未來的業(yè)務(wù)走勢(shì)和財(cái)務(wù)狀況,幫助企業(yè)做出更明智的決策。
MaaS會(huì)將分析結(jié)果轉(zhuǎn)化為易于理解和操作的報(bào)告和圖表,并提供定制化的業(yè)務(wù)解決方案。企業(yè)可以根據(jù)自身的業(yè)務(wù)需求和數(shù)據(jù)特點(diǎn),選擇不同的機(jī)器學(xué)習(xí)模型和數(shù)據(jù)處理算法,以實(shí)現(xiàn)更智能化、個(gè)性化的業(yè)務(wù)流程。
三
MaaS市場(chǎng)競(jìng)爭(zhēng)激烈
今年3月,百度率先推出文心一言大模型。百度CTO王海峰在中關(guān)村論壇期間表示,未來MaaS將成為云計(jì)算的主流商業(yè)模式,各類應(yīng)用將基于大模型來開發(fā),每個(gè)行業(yè)需要打造行業(yè)自己的大模型。
大模型將與實(shí)體經(jīng)濟(jì)深度融合,賦能千行百業(yè),加速產(chǎn)業(yè)轉(zhuǎn)型升級(jí),促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展。
4月,阿里也推出了自己的通義千問大模型。時(shí)任阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇當(dāng)時(shí)宣布,阿里巴巴所有產(chǎn)品未來都將接入通義千問大模型,進(jìn)行全面改造。
阿里云CTO周靖人在今年5月的中關(guān)村會(huì)議上也提出,MaaS概念正在被廣泛接受,模型會(huì)作為業(yè)務(wù)和開發(fā)系統(tǒng)開發(fā)的重要生產(chǎn)元素。
這背后,AI一直背負(fù)著商業(yè)化這個(gè)難題。而B端市場(chǎng)近年來越發(fā)成為互聯(lián)網(wǎng)大廠的增量市場(chǎng)。
5月,騰訊發(fā)布的今年一季度財(cái)報(bào)顯示,當(dāng)期其營(yíng)收1500億元,同比增長(zhǎng)11%;凈利潤(rùn)258.4億元,同比增長(zhǎng)10%。
凈利潤(rùn)(Non-IFRS)325.38億元,同比增長(zhǎng)27%。其中,身處B端市場(chǎng)的金融科技與企業(yè)服務(wù)板塊今年一季度營(yíng)收同比增長(zhǎng)14%達(dá)到487億元。據(jù)記者了解,該板塊已連續(xù)八個(gè)季度在騰訊總收入中占比超過30%。
而此前各家云業(yè)務(wù)紛紛下調(diào)價(jià)格,不僅體現(xiàn)了B端業(yè)務(wù)的激烈競(jìng)爭(zhēng),在某種程度上也提現(xiàn)了大模型的開發(fā)對(duì)B端業(yè)務(wù)成本的影響。
張勇曾表示,未來希望在阿里云上訓(xùn)練一個(gè)模型的成本,能夠降低到現(xiàn)在的十分之一,甚至是百分之一。即使是中小企業(yè),也能通過云平臺(tái)獲得AI大模型的能力和服務(wù)。
目前,行業(yè)大模型的前景有賴于行業(yè)大模型的技術(shù)成熟度,大家的競(jìng)爭(zhēng)點(diǎn)主要集中在行業(yè)數(shù)據(jù)源。行業(yè)不同,所形成的語(yǔ)料不同。廠商所在的優(yōu)勢(shì)行業(yè),能夠形成訓(xùn)練AI所需要的語(yǔ)料庫(kù),越完備的語(yǔ)料,意味著越有優(yōu)勢(shì)的AI產(chǎn)品。
同時(shí),在大模型這一賽道上,從來就不是“后來者居上”。只有越豐富的供應(yīng),才能帶來越多的客戶;更多的客戶,才能在數(shù)據(jù)反饋中幫助精進(jìn)和迭代,從而產(chǎn)生“飛輪效應(yīng)”。
如長(zhǎng)期在機(jī)器學(xué)習(xí)模型有積累的社區(qū)Hugging Face,就基于社區(qū)已有的開源模型推出了HuggingGPT,以一個(gè)大模型調(diào)用多個(gè)AI模型的方式,迅速將長(zhǎng)期積累的模型生態(tài)轉(zhuǎn)變成更大的行業(yè)影響力。
這個(gè)階段開始,生態(tài)的作用就會(huì)顯現(xiàn)。而這也是為什么構(gòu)建一個(gè)生態(tài),決定了MaaS的高度。但無論處在哪個(gè)階段,最核心的是,大模型依然是一個(gè)成本高昂的新事物。
不論在研發(fā)、迭代還是使用階段,大模型都是一個(gè)消耗資源巨大、使用成本也不低的“奢侈品”。
所以只有構(gòu)建一個(gè)生態(tài),才能真正通過規(guī)模效應(yīng)降低成本、幫助迭代精進(jìn),最后實(shí)現(xiàn)大模型和MaaS真正的商業(yè)可持續(xù),這更需要生態(tài)。所以真正重視大模型,真正重視MaaS的玩家,一定會(huì)不遺余力打造生態(tài)。
在MaaS新范式的游戲規(guī)則中,大模型決定了一開始走多快,生態(tài)決定了最后走多遠(yuǎn)。
編者按:本文轉(zhuǎn)載自微信公眾號(hào):科技云報(bào)到(ID:ITCloud-BD),作者:科技云報(bào)道
前瞻經(jīng)濟(jì)學(xué)人
專注于中國(guó)各行業(yè)市場(chǎng)分析、未來發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。