報(bào)告服務(wù)熱線400-068-7188

科大訊飛,布局ChatGPT玩家里的中堅(jiān)力量

分享到:
20 錦緞 ? 2023-02-20 15:00:10  來源:錦緞 E7699G1

1

圖源:攝圖網(wǎng)

作者|革鼎 來源|錦緞(ID:jinduan006)

本文系基于公開資料撰寫,僅作為信息交流之用,不構(gòu)成任何投資建議。

當(dāng)AI以一個(gè)特定的主題,在30秒內(nèi)完成一篇文章的寫作,并在高中甚至大學(xué)某個(gè)年級(jí)的課堂里獲得第一名的最終評(píng)價(jià)時(shí),我們知道,對(duì)于我們的下一代來說,這個(gè)世界已經(jīng)永遠(yuǎn)改變了。

不止是寫作。當(dāng)時(shí)當(dāng)下,在全球各地各個(gè)產(chǎn)業(yè)領(lǐng)域內(nèi),一場(chǎng)以生成式AI為內(nèi)核的人工智能革命,正在以不可逆的態(tài)勢(shì)深入蔓延。ChatGPT為代表的生成式AI,已成為全球科技競(jìng)爭(zhēng)的制高點(diǎn)。

隨之而來的是關(guān)鍵命題是:中國AI科技領(lǐng)域,誰將是這場(chǎng)全球性科技競(jìng)賽的中堅(jiān)破局力量?

這個(gè)問題的答案,出離不了算力、算法以及數(shù)據(jù)三個(gè)維度構(gòu)成的產(chǎn)業(yè)規(guī)律。那些在人工智能領(lǐng)域持續(xù)耕耘的中國科技公司們,凜冬之后,終于捱到了自己的黃金時(shí)代。

比如科大訊飛(SZ:002230)。

作為ChatGPT主題研究的第二篇,本文將以訊飛為樣本,透視中國生成式AI產(chǎn)業(yè)的當(dāng)下與未來。

01

中國AI進(jìn)入無人區(qū)

“在做通用AI范式的時(shí)候可以想象站在一個(gè)沼澤地上,四面沒有光,也沒有手電,這時(shí)候咱都不說走多遠(yuǎn),往哪邊走都是個(gè)問題。這種情況下大家都選擇了相對(duì)光明的道路,就是專用AI范式。不得不佩服美國人,他把這個(gè)事情(AGI,通用人工智能)從0到1的道路硬生生的走出來了。”這是日前一場(chǎng)專家電話會(huì)中,一位產(chǎn)業(yè)人士對(duì)于ChatGPT及其背后的OpenAI團(tuán)隊(duì)的感慨。

從專用AI到通用AI,即使OpenAI已成功闖關(guān),但對(duì)中國的AI公司來說挑戰(zhàn)仍然巨大,說是走入無人區(qū)毫不為過。不信你瞧谷歌:

ChatGPT火爆之后,被觸及商業(yè)模式核心利益的谷歌最為著急。單純從理論上來看,它做這個(gè)事情好像不難。畢竟就連ChatGPT的底層架構(gòu)Transformer模型,都是來自谷歌。

但現(xiàn)實(shí)很殘酷。谷歌的類ChatGPT項(xiàng)目Bard出師不利,員工通過內(nèi)部論壇Memegen批評(píng)管理層最近推出的Bard:倉促、拙劣、毫無谷歌風(fēng)范(un-Googley)。

ChatGPT的通關(guān)之路難度可見一斑。

但即使如此國內(nèi)參與者也不得不跟。因?yàn)镃hatGPT會(huì)對(duì)眾多產(chǎn)業(yè)帶來顛覆性變革,包括且不限于:

1)改變現(xiàn)有人機(jī)交互模式。

2)改變現(xiàn)有信息分發(fā)獲取模式。

3)改變內(nèi)容生產(chǎn)模式。

4)加速“AI for Science”的發(fā)展。

直觀一點(diǎn)來說,互聯(lián)網(wǎng)的核心價(jià)值是連接,ChatGPT代表的生成式AI的核心價(jià)值則是嵌入。如果嵌入至制造業(yè),生成式AI的強(qiáng)大遠(yuǎn)景——存、算、編碼生成一體化所帶來的“隨心所欲”效應(yīng),無疑意味著人類生產(chǎn)力能力文明級(jí)的跨越。但在這個(gè)質(zhì)變發(fā)生(在以制造業(yè)為核心的工業(yè)領(lǐng)域,質(zhì)變發(fā)生仍受制于材料與能源)過程中,生成式AI作為機(jī)器智能超算,最大化價(jià)值的用途還是嵌入到科研領(lǐng)域,將在基礎(chǔ)學(xué)科研究、新材料、新能源、新藥物的研發(fā)過程中扮演關(guān)鍵角色。

02

科大訊飛的比較優(yōu)勢(shì)

目前諸多中國科技公司都在加緊布局類ChatGPT項(xiàng)目。所有謀局者之中,科大訊飛是比較優(yōu)勢(shì)較為突出的一個(gè)。主要體現(xiàn)在以下幾個(gè)方面:

【1】數(shù)據(jù)卡位

前文我們提到,谷歌Bard背靠海量數(shù)據(jù)出師不利,反觀ChatGPT當(dāng)前最具產(chǎn)業(yè)價(jià)值的編程能力,很大功勞來自于GitHub。OpenAI在ChatGPT中引入了它830G代碼文本,那是一億程序員的智慧涌現(xiàn),編程能力不強(qiáng)才怪。

圖:GitHub的用戶增長(zhǎng)曲線,來源:網(wǎng)絡(luò)

科大訊飛憑什么布局ChatGPT?OpenAI上述產(chǎn)業(yè)實(shí)踐,以及在醫(yī)療領(lǐng)域的突破,也許能得出一些啟示,那就是數(shù)據(jù)質(zhì)量的重要性。

目前國內(nèi)參與者在算法、算力上跟ChatGPT是有差距,但優(yōu)質(zhì)數(shù)據(jù)在一定程度上彌補(bǔ)了這個(gè)差距。比如ChatGPT最近通過美國執(zhí)業(yè)醫(yī)師資格考試,它在考試三個(gè)部分得分在52.4%-75%之間。而與醫(yī)療機(jī)構(gòu)緊密合作的科大訊飛,其“智醫(yī)助理”系統(tǒng)2017年就通過國家執(zhí)業(yè)醫(yī)師資格考試綜合筆試測(cè)試,答對(duì)76%的題目(滿分600分,考了456分)。目前“智醫(yī)助理”作為全科醫(yī)生助手已可以診斷1200多種常見病,累計(jì)提供5.5億次AI輔診建議。

放眼整個(gè)行業(yè),長(zhǎng)期布局AI技術(shù)的同時(shí),又掌握醫(yī)療、教育等專業(yè)數(shù)據(jù)端口的公司是稀缺的,這是科大訊飛布局類ChatGPT項(xiàng)目的底氣之一。

【2】算法與成本曲線

大模型的訓(xùn)練是一件燒錢的事。ChatGPT的誕生與用戶廣泛應(yīng)用,離不開它對(duì)成本曲線改造:過去兩年半時(shí)間,GPT-3模型的訓(xùn)練成本下降了80%以上,目前僅需要140萬美元(首次訓(xùn)練約1200億美元)。而成本曲線的降低離不開算法進(jìn)步。道理很簡(jiǎn)單:同樣是訓(xùn)練一次大模型,算法能力提升意味著成本曲線的降低。

OpenAI的成功在于算法迭代,GPT3比之GPT2在算法層面有本質(zhì)提升(于是它不開源了)。所以創(chuàng)立8年燒錢不斷的它還能獲得資金支持,并終于等到ChatGPT橫空出世。

回頭看國內(nèi)玩家,雖然公司間橫向的算法直接對(duì)比沒法做,這是商業(yè)秘密,但從側(cè)面還是能看到一些端倪:

科大訊飛在GitHub上開源模型比較受追捧。具體而言,其開源了6個(gè)大類、超過40個(gè)通用領(lǐng)域的系列中文預(yù)訓(xùn)練語言模型,相關(guān)模型庫月均調(diào)用量超1000萬,在Github平臺(tái)獲得星標(biāo)數(shù)位列同類中文預(yù)訓(xùn)練語言模型第一。

與此同時(shí),科大訊飛承建了認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室。AI技術(shù)可簡(jiǎn)單分為識(shí)別(圖像識(shí)別、語音合成與識(shí)別等)和認(rèn)知(語義理解、常識(shí)推理、知識(shí)圖譜、閱讀理解等)兩大類,承建認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室是官方對(duì)科大訊飛算法技術(shù)實(shí)力的背書。

圖:科大訊飛AI里程碑,來源:國信證券

【3】算力戰(zhàn)爭(zhēng)

據(jù)最新的投資者關(guān)系交流會(huì)議顯示,科大訊飛2009年至今,已建成4城7中心深度學(xué)習(xí)計(jì)算平臺(tái),自建業(yè)界一流的AI數(shù)據(jù)中心奠定大模型訓(xùn)練的硬件基石。在技術(shù)層面實(shí)現(xiàn)百億參數(shù)大模型推理效率近千倍加速,為認(rèn)知智能大模型經(jīng)濟(jì)實(shí)惠的規(guī)模化提供可能性。目前來看,基本滿足類ChatGPT項(xiàng)目的布局。

但從長(zhǎng)期看,科大訊飛乃至整個(gè)中國布局類ChatGPT項(xiàng)目的玩家,還是得大力加強(qiáng)算力的提升。從產(chǎn)業(yè)的發(fā)展趨勢(shì)看,算力是企業(yè)乃至當(dāng)前世界最關(guān)鍵的競(jìng)爭(zhēng)資源。殘酷的事實(shí)是,超級(jí)算力中心建設(shè)資金門檻已經(jīng)在ChatGPT出現(xiàn)后,已經(jīng)推向百億之上(在微軟的支持下),而運(yùn)營與維護(hù)成本更是天文數(shù)字。

基于優(yōu)質(zhì)數(shù)據(jù)卡位,算法能力和商業(yè)化策略(下文詳述),科大訊飛在算力維度至少有一點(diǎn)可以抓緊做:推動(dòng)企業(yè)間的分布式計(jì)算協(xié)作。強(qiáng)如OpenAI亦綁定微軟這個(gè)算力巨頭,2月8日微軟更是宣布將ChatGPT整合進(jìn)其搜索引擎,未來隨著類ChatGPT玩家的布局行至中場(chǎng),合作的機(jī)會(huì)少不了。

03

AI界的一股清流

在真實(shí)的商業(yè)世界,技術(shù)的硬實(shí)力永遠(yuǎn)不是全部,它無法具現(xiàn)一個(gè)組織看不到的軟實(shí)力。事實(shí)上,對(duì)比絕大多數(shù)的AI公司,科大訊飛的軟實(shí)力更為突出。

過去很長(zhǎng)時(shí)間,科大訊飛一直是A股市場(chǎng)上的AI獨(dú)苗。圍繞其業(yè)績(jī)的質(zhì)疑聲音一直沒斷過。直到背負(fù)巨額虧損的AI新勢(shì)力們上市,外界方看到了其自力更生的難能可貴。

圖:科大訊飛的凈利潤(rùn),來源:choice

與后進(jìn)的AI新銳們不同,科大訊飛以語音識(shí)別起家,這條路線對(duì)于早期AI公司可能比較友好。眾所眾知,2006年Hinton利用預(yù)訓(xùn)練方法得出神經(jīng)網(wǎng)絡(luò)局部最優(yōu)解,將隱含層推到了7層,神經(jīng)網(wǎng)絡(luò)真正上有了“深度”,由此揭開深度學(xué)習(xí)熱潮。

所謂“深度”并沒有固定數(shù)值,在語音識(shí)別中4層網(wǎng)絡(luò)就能被認(rèn)為是較深的(例如谷歌產(chǎn)品voice search)。在效果一定的同時(shí),層數(shù)越小,難度越低,計(jì)算量越少,它有利于打通技術(shù)與商業(yè)化的雙輪驅(qū)動(dòng),這對(duì)于AI從實(shí)驗(yàn)室走向產(chǎn)業(yè)的起步階段非常重要。

AI的科技含量再高,它也是一門生意,先把商業(yè)的帳算清楚。任何商業(yè)的基本規(guī)律就是創(chuàng)造現(xiàn)金流、創(chuàng)造真金白銀的產(chǎn)業(yè)附加值才能持續(xù)發(fā)展。組織能自負(fù)盈虧,才能穩(wěn)健的進(jìn)入其它技術(shù)分支——科大訊飛先是擁有我國唯一的“語音及語言國家工程實(shí)驗(yàn)室”,后來國家唯一的“認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室”也設(shè)在科大訊飛——一步步擴(kuò)大公司的護(hù)城河。

之所以說科大訊飛更契合商業(yè)基本規(guī)律,因?yàn)檫@是一目了然的事情:你看所有布局類ChatGPT的玩家,只有它比較明確的開始講應(yīng)用講商業(yè),“1+N”架構(gòu)的行業(yè)應(yīng)用已經(jīng)規(guī)劃好了。

“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺(tái),“N”是應(yīng)用于教育、醫(yī)療、人機(jī)交互、辦公、翻譯、工業(yè)、汽車等多個(gè)行業(yè)領(lǐng)域的專用大模型版本。例如,通過學(xué)習(xí)海量醫(yī)學(xué)教材、論文和病例,實(shí)現(xiàn)專業(yè)的醫(yī)療領(lǐng)域?qū)υ捠紸I系統(tǒng),打造“每個(gè)醫(yī)生的AI診療助理,每個(gè)人的AI健康助手”。

運(yùn)營節(jié)奏之外,科大訊飛是少數(shù)能做到既懂B端又懂C端的科技公司。

在中國既能服務(wù)企業(yè)、又能服務(wù)用戶的科技公司屈指可數(shù)??拼笥嶏w服務(wù)C端,不僅指智能硬件銷售,還有教育領(lǐng)域?qū)W生以年費(fèi)形式訂閱個(gè)性化學(xué)習(xí)手冊(cè)和英語聽說業(yè)務(wù)等。目前“個(gè)冊(cè)”覆蓋1400多所學(xué)校,口語業(yè)務(wù)2022年新增12個(gè)地市的中考和2個(gè)地市的高考。

科大訊飛有可能在醫(yī)療等板塊打造C端應(yīng)用的標(biāo)桿,恰如ChatGPT的編程。當(dāng)然,這是比較樂觀的預(yù)期,C端能力的潛在可能性。關(guān)于可能性我們不再多談,因?yàn)槟壳斑€為時(shí)尚早,期待科大訊飛的產(chǎn)品上線。

以上,成立于1999年的科大訊飛,23年風(fēng)雨兼程之后,終于進(jìn)入了自己的黃金時(shí)代,正成為布局ChatGPT玩家里的中堅(jiān)力量。ChatGPT作為第四次工業(yè)革命開始的標(biāo)志,世界商業(yè)秩序正面臨劇變,沒有人可以置身事外——如果改變世界的那個(gè)人/組織不是你,至少要和科大訊飛們站在一起。

編者按:本文轉(zhuǎn)載自微信公眾號(hào):錦緞(ID:jinduan006),作者:革鼎 

本文來源錦緞,內(nèi)容僅代表作者本人觀點(diǎn),不代表前瞻網(wǎng)的立場(chǎng)。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問題,請(qǐng)聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請(qǐng)聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p49 q1 我要投稿

分享:
標(biāo)簽: 科大訊飛 ChatGPT

品牌、內(nèi)容合作請(qǐng)點(diǎn)這里:尋求合作 ››

前瞻經(jīng)濟(jì)學(xué)人

專注于中國各行業(yè)市場(chǎng)分析、未來發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫
企查貓
作者 錦緞
財(cái)經(jīng)自媒體
807871
關(guān)注
776
文章
前瞻經(jīng)濟(jì)學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟(jì)學(xué)家互動(dòng)交流讓您成為更懂趨勢(shì)的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟(jì)學(xué)人》APP提問

 
在線咨詢
×
在線咨詢

項(xiàng)目熱線 0755-33015070

AAPP
前瞻經(jīng)濟(jì)學(xué)人APP下載二維碼

下載前瞻經(jīng)濟(jì)學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號(hào)

掃一掃關(guān)注我們

我要投稿

×
J