報告服務(wù)熱線400-068-7188

大模型的浪頭卷到了金融業(yè)

分享到:
20 數(shù)科社 ? 2023-07-28 12:08:34  來源:數(shù)科社 E3925G1

1

(圖片來源:攝圖網(wǎng))

作者|聚焦數(shù)字 科技的 來源|數(shù)科社(ID:sktxs0)

就在由ChatGPT引爆的國內(nèi)“千模大戰(zhàn)”激戰(zhàn)正酣之際,與AIGC有著諸多契合場景的金融領(lǐng)域踏上了一條探尋行業(yè)大模型的變革之路。

今年3月,彭博社針對金融業(yè)推出大型語言模型BloombergGPT,立即引起國內(nèi)市場對金融垂直領(lǐng)域大模型應(yīng)用的廣泛關(guān)注。繼各互聯(lián)網(wǎng)巨頭躬身入局后,金融科技賽道的頭部玩家們也開始馬不停蹄的探路大語言模型。

5月,星環(huán)科技推出第一款面向金融量化領(lǐng)域的生成式大語言模型“無涯Infinity”,度小滿開源國內(nèi)首個千億參數(shù)金融大模型“軒轅”;6月,恒生電子發(fā)布金融行業(yè)大模型LightGPT,將于9月底開放試用接口;最近,馬上消費的自研金融大模型箭在弦上即將發(fā)布……

在近百款大模型產(chǎn)品的激烈交鋒下,通用大模型的求解能力日益趨近同質(zhì)化,也讓大模型在特定行業(yè)的落地奔跑成為新賽點。

那么,“金融大模型”這條路究竟如何走通?又將給金融行業(yè)帶來哪些驚喜和挑戰(zhàn)?

探路“金融大模型”

月初剛剛在上海落幕的WAIC上,“大模型”無疑成為今年廠商、與會者屢屢提及的熱詞。大會期間,來自各家廠商的30多個基礎(chǔ)大模型、垂直大模型集中亮相,讓眼下這場“千模大戰(zhàn)”的硝煙味又重了一分。

在讓人眼花繚亂的通用大模型之中,垂直于行業(yè)的大模型可謂是今年大會的亮點之一。馬上消費CTO蔣寧在現(xiàn)場接受媒體采訪時表示,大語言模型技術(shù)出世后,對金融行業(yè)的人工智能技術(shù)應(yīng)用無異于“強心劑”。

在他看來,金融行業(yè)有著數(shù)據(jù)密集型、技術(shù)密集型的天然屬性,一直在探索數(shù)據(jù)資產(chǎn)化,挖掘數(shù)據(jù)價值,同時又面臨著如銀行線下網(wǎng)點的價值傳遞效率問題、用戶體驗問題,需要機構(gòu)持續(xù)創(chuàng)新。

基于這些行業(yè)特點,也注定了大語言模型技術(shù)將會為其帶來新的賦能。3月底,BloombergGPT的發(fā)布標(biāo)志著ChatGPT引爆的AI熱潮已一路蔓延到了金融圈。

據(jù)彭博社發(fā)布的報告指出,這一專門訓(xùn)練用于金融領(lǐng)域的大語言模型(LLM),訓(xùn)練中在金融任務(wù)上的表現(xiàn)遠超過現(xiàn)有模型,且在通用場景上的表現(xiàn)與現(xiàn)有模型也能一較高下。

這將意味著,LLM正在邁向結(jié)合具體行業(yè)和特定場景進行垂直落地的新階段,不僅是其實現(xiàn)商業(yè)化躍遷的關(guān)鍵,更是整個產(chǎn)業(yè)大爆發(fā)的重要一步,這也引來國內(nèi)金融科技廠商迅速跟進。

“對比于通用大模型的能力而言,金融行業(yè)非常需要垂直行業(yè)大模型。”在不久前召開的2023全球數(shù)字經(jīng)濟大會上,度小滿CTO許冬亮也給出了自己的看法。

他認為,囿于金融行業(yè)在數(shù)據(jù)安全隱私、風(fēng)控、精度以及實時性等方面要求較高,使得通用大模型在金融能力上缺乏必要的訓(xùn)練數(shù)據(jù),從而對金融常識、生成的可控性和準(zhǔn)確性都達不到這個行業(yè)的最低要求,因此需要針對金融機構(gòu)定制的行業(yè)大模型去發(fā)揮效力。

作為搶先一步試水的頭部玩家之一,度小滿在5月下旬推出了國內(nèi)首個垂直金融行業(yè)的開源大模型“軒轅”。該模型基于1760億參數(shù)的Bloom(決定輸入數(shù)據(jù)如何轉(zhuǎn)換為輸出內(nèi)容的變量)大模型基礎(chǔ)訓(xùn)練而來,相較于通用大模型,在金融名詞理解、金融市場評論、金融數(shù)據(jù)分析和金融新聞理解等金融場景任務(wù)上的表現(xiàn)可圈可點。

下水的顯然不止度小滿一家。6月28日,恒生電子金融行業(yè)大模型LightGPT也首次對外亮相。恒生電子董事長劉曙峰表示,大模型是信息技術(shù)的最新突破,刷新了人們對機器智能的認知,同時也在刷新行業(yè)應(yīng)用傳統(tǒng)AI模型的模式。

在“千模大戰(zhàn)”背景下,隨著各路金融科技企業(yè)在大模型的不斷試水,金融業(yè)數(shù)智化的發(fā)展也悄然走向了一個從量變到質(zhì)變的新階段。

生成式AI浪潮能力涌現(xiàn)

大模型時代,算力、算法、數(shù)據(jù)構(gòu)成了新范式的“三駕馬車”,其中,數(shù)據(jù)更可視為決定大模型質(zhì)量和商業(yè)化落地的核心要素。作為一個業(yè)務(wù)流程規(guī)范、數(shù)據(jù)和知識沉淀完備的行業(yè),金融業(yè)天然具有應(yīng)用大模型的基礎(chǔ)優(yōu)勢。

回顧過去十年金融業(yè)的發(fā)展浪潮,是一場涉及到整個金融產(chǎn)業(yè)的信息化和數(shù)字化革命,為人工智能的滲透融入奠定了基礎(chǔ)。近年來,在智能營銷、智能風(fēng)控、智能投研、智能客服等領(lǐng)域,基于機器學(xué)習(xí)驅(qū)動的建模能力都是金融機構(gòu)數(shù)智化轉(zhuǎn)型翻涌的浪花。

當(dāng)下以生成式AI為代表的第二波人工智能浪潮席卷至金融業(yè),大模型所積聚的“三駕馬車”也已從量變走向質(zhì)變。

在近日恒生聚源主辦的“大模型在金融行業(yè)的應(yīng)用與展望”研討會上,恒生電子高級副總裁、恒生聚源董事長王鋒表示:“傳統(tǒng)的AI模型,參數(shù)量少,通過大量的數(shù)據(jù)標(biāo)注、大規(guī)模的模板配置來實現(xiàn)。換一個場景就要再重新來過一遍,泛化性不足,被詬病為有多少人工,才有多少智能。而大模型基于GPT——生成式預(yù)訓(xùn)練tranformer技術(shù)路線,通過預(yù)訓(xùn)練、微調(diào)、獎勵模型、強化學(xué)習(xí)四個主要步驟和千億級別參數(shù)規(guī)模,做到了令人驚艷的效果,也就是我們所說的能力涌現(xiàn)。”

這種能力涌現(xiàn)如今正賦能在金融云產(chǎn)品的方方面面。

如在AI開發(fā)層面,大模型展現(xiàn)出強大的代碼自動化生成能力,顛覆了傳統(tǒng)的“手工作坊式”模型,極大提升了機器學(xué)習(xí)的開發(fā)效率和生產(chǎn)模式;在智能交互方面,大模型的語音識別率不僅精準(zhǔn),還能憑借著深度語義理解與生成能力,快速解答客戶復(fù)雜且專業(yè)性的問題;在分析決策方面,有著強大信息挖掘能力的大模型,能在風(fēng)險決策、信用評估、反欺詐等場景,觸及小模型無法覆蓋到的區(qū)域。

申萬宏源證券研究所所長助理劉洋認為,在算力、算法、數(shù)據(jù)“三駕馬車”的推動下,工程化能力變得尤為重要,特別是在券商、基金這樣的垂類大模型應(yīng)用場景下,率先為客戶提供服務(wù)的廠商將搶占先機。

因此,金融大模型的落地應(yīng)用也成了市場當(dāng)下所聚焦的關(guān)鍵一步。

落地商業(yè)化尚需時日

盡管業(yè)內(nèi)普遍認為,大模型將是開啟金融領(lǐng)域“iPhone時刻”的按鈕,但擺在眼前的事實是,現(xiàn)下的“金融大模型”主要停留在工具層和應(yīng)用層,更類似于業(yè)務(wù)流程優(yōu)化助手,在核心金融業(yè)務(wù)場景的落地之路任重而道遠。

作為一個受到強監(jiān)管的行業(yè),金融業(yè)首先對于技術(shù)應(yīng)用的安全性、穩(wěn)定性、可控性等要求遠比其他行業(yè)更為嚴格。尤其是在考慮到數(shù)據(jù)的安全與合規(guī)問題,意味著前期的數(shù)據(jù)采集和“清洗”等工作,廠商可能需要花費更多的時間和精力。

在馬上消費CTO蔣寧看來,挑戰(zhàn)主要現(xiàn)有大模型難以在金融特定領(lǐng)域?qū)崿F(xiàn)落地的挑戰(zhàn)主要來自四個方面:

一是當(dāng)前的大模型在面對動態(tài)且不可預(yù)期變化的金融各項業(yè)務(wù)時,還并不能做到每一份決策都穩(wěn)定、精確;二是金融行業(yè)往往希望為用戶提供個性化的服務(wù)體驗,但這需要個人隱私數(shù)據(jù)和大模型相融合,涉及到合規(guī)和安全問題;三是金融行業(yè)一直存在的“數(shù)據(jù)孤島”問題,大模型要求構(gòu)建增強學(xué)習(xí)的網(wǎng)絡(luò)化平臺,并持續(xù)貢獻數(shù)據(jù)和反饋,但目前背后市場的數(shù)據(jù)生態(tài)是割裂的,仍然需要持續(xù)性的探索;四是金融行業(yè)大模型應(yīng)用對底層設(shè)備、基礎(chǔ)架構(gòu)等軟硬件設(shè)施提出更高的要求。

對于上述挑戰(zhàn),他認為可從強化學(xué)習(xí)和持續(xù)學(xué)習(xí)技術(shù)、魯棒性決策、組合式AI系統(tǒng)技術(shù)等三個大模型領(lǐng)域的關(guān)鍵技術(shù)入手。

他進一步解釋道,強化和持續(xù)學(xué)習(xí)會讓系統(tǒng)越用越聰明,這就在于大模型幕后自適應(yīng)的生態(tài)能力建設(shè),魯棒性決策則是實現(xiàn)關(guān)鍵決策的持續(xù)穩(wěn)定和合規(guī)可信的核心環(huán)節(jié),組合式AI系統(tǒng)技術(shù)可以有效結(jié)合各種垂直領(lǐng)域的判別式模型的可用性和專業(yè)性,助其真正發(fā)揮大模型的泛化能力優(yōu)勢。

基于上述認知,馬上消費在探路金融大模型方面制定了“三橫三豎”戰(zhàn)略。據(jù)蔣寧透露,目前公司已開發(fā)了智能生成報表的工具產(chǎn)品,在智能客服場景上也有所涉獵,并即將發(fā)布自研的金融大模型。

最后關(guān)于行業(yè)最受掣肘的數(shù)據(jù)質(zhì)量和合規(guī)問題,奇富科技首席算法科學(xué)家費浩峻此前在接受《中國經(jīng)營報》采訪時表示,對于數(shù)據(jù)質(zhì)量問題,可以從數(shù)字化改造的源頭進行標(biāo)準(zhǔn)化建設(shè),并且設(shè)置有嚴格一致性的評估指標(biāo)和方法。而在合規(guī)方面,商用級需要重點解決的問題是輕量級和易用性。

顯然,對于剛剛邁入數(shù)智化“深水區(qū)”的金融業(yè)而言,尚需要一個適應(yīng)到不斷完善的過程,這也需要身處水中的廠商們擁抱合作互通,共同迎接大模型時代的到來。

編者按:本文轉(zhuǎn)載自微信公眾號:數(shù)科社(ID:sktxs0),作者:聚焦數(shù)字 科技的 

本文來源數(shù)科社,內(nèi)容僅代表作者本人觀點,不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p16 q1 我要投稿

分享:

品牌、內(nèi)容合作請點這里:尋求合作 ››

前瞻經(jīng)濟學(xué)人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫
企查貓
作者 數(shù)科社
科技自媒體
12954
關(guān)注
38
文章
0
前瞻經(jīng)濟學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟學(xué)家互動交流讓您成為更懂趨勢的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟學(xué)人》APP提問

 
在線咨詢
×
在線咨詢

項目熱線 0755-33015070

AAPP
前瞻經(jīng)濟學(xué)人APP下載二維碼

下載前瞻經(jīng)濟學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號

掃一掃關(guān)注我們

我要投稿

×
J