當前位置：前瞻產(chǎn)業(yè)研究院 ? 經(jīng)濟學(xué)人 ? 觀察家專欄

大模型的浪頭卷到了金融業(yè)

分享到：

數(shù)科社 ? 2023-07-28 12:08:34 　來源：數(shù)科社　E4062G1

（圖片來源：攝圖網(wǎng)）

作者|聚焦數(shù)字科技的來源|數(shù)科社(ID：sktxs0)

就在由ChatGPT引爆的國內(nèi)“千模大戰(zhàn)”激戰(zhàn)正酣之際，與AIGC有著諸多契合場景的金融領(lǐng)域踏上了一條探尋行業(yè)大模型的變革之路。

今年3月，彭博社針對金融業(yè)推出大型語言模型BloombergGPT，立即引起國內(nèi)市場對金融垂直領(lǐng)域大模型應(yīng)用的廣泛關(guān)注。繼各互聯(lián)網(wǎng)巨頭躬身入局后，金融科技賽道的頭部玩家們也開始馬不停蹄的探路大語言模型。

5月，星環(huán)科技推出第一款面向金融量化領(lǐng)域的生成式大語言模型“無涯Infinity”，度小滿開源國內(nèi)首個千億參數(shù)金融大模型“軒轅”；6月，恒生電子發(fā)布金融行業(yè)大模型LightGPT，將于9月底開放試用接口；最近，馬上消費的自研金融大模型箭在弦上即將發(fā)布……

在近百款大模型產(chǎn)品的激烈交鋒下，通用大模型的求解能力日益趨近同質(zhì)化，也讓大模型在特定行業(yè)的落地奔跑成為新賽點。

那么，“金融大模型”這條路究竟如何走通？又將給金融行業(yè)帶來哪些驚喜和挑戰(zhàn)？

一

探路“金融大模型”

月初剛剛在上海落幕的WAIC上，“大模型”無疑成為今年廠商、與會者屢屢提及的熱詞。大會期間，來自各家廠商的30多個基礎(chǔ)大模型、垂直大模型集中亮相，讓眼下這場“千模大戰(zhàn)”的硝煙味又重了一分。

在讓人眼花繚亂的通用大模型之中，垂直于行業(yè)的大模型可謂是今年大會的亮點之一。馬上消費CTO蔣寧在現(xiàn)場接受媒體采訪時表示，大語言模型技術(shù)出世后，對金融行業(yè)的人工智能技術(shù)應(yīng)用無異于“強心劑”。

在他看來，金融行業(yè)有著數(shù)據(jù)密集型、技術(shù)密集型的天然屬性，一直在探索數(shù)據(jù)資產(chǎn)化，挖掘數(shù)據(jù)價值，同時又面臨著如銀行線下網(wǎng)點的價值傳遞效率問題、用戶體驗問題，需要機構(gòu)持續(xù)創(chuàng)新。

基于這些行業(yè)特點，也注定了大語言模型技術(shù)將會為其帶來新的賦能。3月底，BloombergGPT的發(fā)布標志著ChatGPT引爆的AI熱潮已一路蔓延到了金融圈。

據(jù)彭博社發(fā)布的報告指出，這一專門訓(xùn)練用于金融領(lǐng)域的大語言模型（LLM），訓(xùn)練中在金融任務(wù)上的表現(xiàn)遠超過現(xiàn)有模型，且在通用場景上的表現(xiàn)與現(xiàn)有模型也能一較高下。

這將意味著，LLM正在邁向結(jié)合具體行業(yè)和特定場景進行垂直落地的新階段，不僅是其實現(xiàn)商業(yè)化躍遷的關(guān)鍵，更是整個產(chǎn)業(yè)大爆發(fā)的重要一步，這也引來國內(nèi)金融科技廠商迅速跟進。

“對比于通用大模型的能力而言，金融行業(yè)非常需要垂直行業(yè)大模型。”在不久前召開的2023全球數(shù)字經(jīng)濟大會上，度小滿CTO許冬亮也給出了自己的看法。

他認為，囿于金融行業(yè)在數(shù)據(jù)安全隱私、風控、精度以及實時性等方面要求較高，使得通用大模型在金融能力上缺乏必要的訓(xùn)練數(shù)據(jù)，從而對金融常識、生成的可控性和準確性都達不到這個行業(yè)的最低要求，因此需要針對金融機構(gòu)定制的行業(yè)大模型去發(fā)揮效力。

作為搶先一步試水的頭部玩家之一，度小滿在5月下旬推出了國內(nèi)首個垂直金融行業(yè)的開源大模型“軒轅”。該模型基于1760億參數(shù)的Bloom（決定輸入數(shù)據(jù)如何轉(zhuǎn)換為輸出內(nèi)容的變量）大模型基礎(chǔ)訓(xùn)練而來，相較于通用大模型，在金融名詞理解、金融市場評論、金融數(shù)據(jù)分析和金融新聞理解等金融場景任務(wù)上的表現(xiàn)可圈可點。

下水的顯然不止度小滿一家。6月28日，恒生電子金融行業(yè)大模型LightGPT也首次對外亮相。恒生電子董事長劉曙峰表示，大模型是信息技術(shù)的最新突破，刷新了人們對機器智能的認知，同時也在刷新行業(yè)應(yīng)用傳統(tǒng)AI模型的模式。

在“千模大戰(zhàn)”背景下，隨著各路金融科技企業(yè)在大模型的不斷試水，金融業(yè)數(shù)智化的發(fā)展也悄然走向了一個從量變到質(zhì)變的新階段。

二

生成式AI浪潮能力涌現(xiàn)

大模型時代，算力、算法、數(shù)據(jù)構(gòu)成了新范式的“三駕馬車”，其中，數(shù)據(jù)更可視為決定大模型質(zhì)量和商業(yè)化落地的核心要素。作為一個業(yè)務(wù)流程規(guī)范、數(shù)據(jù)和知識沉淀完備的行業(yè)，金融業(yè)天然具有應(yīng)用大模型的基礎(chǔ)優(yōu)勢。

回顧過去十年金融業(yè)的發(fā)展浪潮，是一場涉及到整個金融產(chǎn)業(yè)的信息化和數(shù)字化革命，為人工智能的滲透融入奠定了基礎(chǔ)。近年來，在智能營銷、智能風控、智能投研、智能客服等領(lǐng)域，基于機器學(xué)習驅(qū)動的建模能力都是金融機構(gòu)數(shù)智化轉(zhuǎn)型翻涌的浪花。

當下以生成式AI為代表的第二波人工智能浪潮席卷至金融業(yè)，大模型所積聚的“三駕馬車”也已從量變走向質(zhì)變。

在近日恒生聚源主辦的“大模型在金融行業(yè)的應(yīng)用與展望”研討會上，恒生電子高級副總裁、恒生聚源董事長王鋒表示：“傳統(tǒng)的AI模型，參數(shù)量少，通過大量的數(shù)據(jù)標注、大規(guī)模的模板配置來實現(xiàn)。換一個場景就要再重新來過一遍，泛化性不足，被詬病為有多少人工，才有多少智能。而大模型基于GPT——生成式預(yù)訓(xùn)練tranformer技術(shù)路線，通過預(yù)訓(xùn)練、微調(diào)、獎勵模型、強化學(xué)習四個主要步驟和千億級別參數(shù)規(guī)模，做到了令人驚艷的效果，也就是我們所說的能力涌現(xiàn)。”

這種能力涌現(xiàn)如今正賦能在金融云產(chǎn)品的方方面面。

如在AI開發(fā)層面，大模型展現(xiàn)出強大的代碼自動化生成能力，顛覆了傳統(tǒng)的“手工作坊式”模型，極大提升了機器學(xué)習的開發(fā)效率和生產(chǎn)模式；在智能交互方面，大模型的語音識別率不僅精準，還能憑借著深度語義理解與生成能力，快速解答客戶復(fù)雜且專業(yè)性的問題；在分析決策方面，有著強大信息挖掘能力的大模型，能在風險決策、信用評估、反欺詐等場景，觸及小模型無法覆蓋到的區(qū)域。

申萬宏源證券研究所所長助理劉洋認為，在算力、算法、數(shù)據(jù)“三駕馬車”的推動下，工程化能力變得尤為重要，特別是在券商、基金這樣的垂類大模型應(yīng)用場景下，率先為客戶提供服務(wù)的廠商將搶占先機。

因此，金融大模型的落地應(yīng)用也成了市場當下所聚焦的關(guān)鍵一步。

三

落地商業(yè)化尚需時日

盡管業(yè)內(nèi)普遍認為，大模型將是開啟金融領(lǐng)域“iPhone時刻”的按鈕，但擺在眼前的事實是，現(xiàn)下的“金融大模型”主要停留在工具層和應(yīng)用層，更類似于業(yè)務(wù)流程優(yōu)化助手，在核心金融業(yè)務(wù)場景的落地之路任重而道遠。

作為一個受到強監(jiān)管的行業(yè)，金融業(yè)首先對于技術(shù)應(yīng)用的安全性、穩(wěn)定性、可控性等要求遠比其他行業(yè)更為嚴格。尤其是在考慮到數(shù)據(jù)的安全與合規(guī)問題，意味著前期的數(shù)據(jù)采集和“清洗”等工作，廠商可能需要花費更多的時間和精力。

在馬上消費CTO蔣寧看來，挑戰(zhàn)主要現(xiàn)有大模型難以在金融特定領(lǐng)域?qū)崿F(xiàn)落地的挑戰(zhàn)主要來自四個方面：

一是當前的大模型在面對動態(tài)且不可預(yù)期變化的金融各項業(yè)務(wù)時，還并不能做到每一份決策都穩(wěn)定、精確；二是金融行業(yè)往往希望為用戶提供個性化的服務(wù)體驗，但這需要個人隱私數(shù)據(jù)和大模型相融合，涉及到合規(guī)和安全問題；三是金融行業(yè)一直存在的“數(shù)據(jù)孤島”問題，大模型要求構(gòu)建增強學(xué)習的網(wǎng)絡(luò)化平臺，并持續(xù)貢獻數(shù)據(jù)和反饋，但目前背后市場的數(shù)據(jù)生態(tài)是割裂的，仍然需要持續(xù)性的探索；四是金融行業(yè)大模型應(yīng)用對底層設(shè)備、基礎(chǔ)架構(gòu)等軟硬件設(shè)施提出更高的要求。

對于上述挑戰(zhàn)，他認為可從強化學(xué)習和持續(xù)學(xué)習技術(shù)、魯棒性決策、組合式AI系統(tǒng)技術(shù)等三個大模型領(lǐng)域的關(guān)鍵技術(shù)入手。

他進一步解釋道，強化和持續(xù)學(xué)習會讓系統(tǒng)越用越聰明，這就在于大模型幕后自適應(yīng)的生態(tài)能力建設(shè)，魯棒性決策則是實現(xiàn)關(guān)鍵決策的持續(xù)穩(wěn)定和合規(guī)可信的核心環(huán)節(jié)，組合式AI系統(tǒng)技術(shù)可以有效結(jié)合各種垂直領(lǐng)域的判別式模型的可用性和專業(yè)性，助其真正發(fā)揮大模型的泛化能力優(yōu)勢。

基于上述認知，馬上消費在探路金融大模型方面制定了“三橫三豎”戰(zhàn)略。據(jù)蔣寧透露，目前公司已開發(fā)了智能生成報表的工具產(chǎn)品，在智能客服場景上也有所涉獵，并即將發(fā)布自研的金融大模型。

最后關(guān)于行業(yè)最受掣肘的數(shù)據(jù)質(zhì)量和合規(guī)問題，奇富科技首席算法科學(xué)家費浩峻此前在接受《中國經(jīng)營報》采訪時表示，對于數(shù)據(jù)質(zhì)量問題，可以從數(shù)字化改造的源頭進行標準化建設(shè)，并且設(shè)置有嚴格一致性的評估指標和方法。而在合規(guī)方面，商用級需要重點解決的問題是輕量級和易用性。

顯然，對于剛剛邁入數(shù)智化“深水區(qū)”的金融業(yè)而言，尚需要一個適應(yīng)到不斷完善的過程，這也需要身處水中的廠商們擁抱合作互通，共同迎接大模型時代的到來。

編者按：本文轉(zhuǎn)載自微信公眾號：數(shù)科社(ID：sktxs0)，作者：聚焦數(shù)字科技的

本文來源數(shù)科社，內(nèi)容僅代表作者本人觀點，不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。（若存在內(nèi)容、版權(quán)或其它問題，請聯(lián)系：service@qianzhan.com）　品牌合作與廣告投放請聯(lián)系：0755-33015062 或 hezuo@qianzhan.com

p16 q1 我要投稿

標簽：大模型金融業(yè) 金融行業(yè)

品牌、內(nèi)容合作請點這里：尋求合作 ››

產(chǎn)業(yè)規(guī)劃
園區(qū)規(guī)劃
產(chǎn)業(yè)招商
可行性研究
低空經(jīng)濟
高端裝備
生物醫(yī)藥

前瞻經(jīng)濟學(xué)人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者，專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領(lǐng)域解決方案，掃一掃關(guān)注。