報告服務熱線400-068-7188

誰該成為大模型成長的“養(yǎng)料”?

分享到:
20 道總有理 ? 2024-08-01 11:39:31  來源:道總有理 E1228G0

1

圖源:攝圖網(wǎng)

作者|道總 來源|道總有理(ID:daotmt)

有關(guān)“AI將要取代人工”的言論甚囂塵上,且不再局限于科技幻想,而是真實地走進了現(xiàn)實世界。

先是蘿卜快跑落地,導致大批網(wǎng)約車司機不滿,隨后,番茄小說上線“AI作者”一日同更三本書讓網(wǎng)文作者如臨大敵。

接著,與番茄小說同屬于字節(jié)跳動的“豆包”被爆出正全網(wǎng)搜索小說素材,以便“喂養(yǎng)”番茄的AI作者。更有意思的是,這出風波波及到了在線文檔領(lǐng)域。據(jù)悉,有網(wǎng)友在社交平臺表示,稱豆包的搜羅范圍不僅在網(wǎng)文界,手還伸向了在線文檔內(nèi)作者尚未發(fā)布的內(nèi)容。

其中,WPS首當其沖。

WPS官方為此不得不緊急辟謠。但除了WPS,幾乎所有在線文檔APP都遭受了一番審查,包括石墨、騰訊文檔、印象筆記、墨客、橙瓜……最終很多人發(fā)現(xiàn),當AI風口來襲,網(wǎng)絡世界哪里都不安全。

這也不算空穴來風。去年,WPS就被爆出在用戶協(xié)議里增添了AI訓練條例,盡管這兩年官方一直在據(jù)理力爭地辟謠,但很多用戶還是不肯給予信任,“羅生門”大戲就此上演。

用戶在擔心自己辛苦創(chuàng)作的內(nèi)容,成了他人的嫁衣,而AI背后的資本則一心想當“普羅米修斯”,為大模型到處搜集“火種”。

在線文檔,集體奔向AI

這些年,在線文檔面臨了太多壓力:諸如研發(fā)停滯、用戶流失、同行內(nèi)卷、廣告營收疲軟…

在線文檔遇到創(chuàng)新乏力已是不爭的事實,WPS作為行業(yè)代表,也難逃這一困境。在入局AI之前,WPS最高調(diào)的一次革新還在2018年,當年,騰訊文檔橫空出世,讓WPS一時倍感焦灼,在前者上線三個月后,后者宣布升級。

尤其增加了多人協(xié)作功能,WPS還一度把這部分單獨拿了出來。但時至今日,云協(xié)同早已遍地皆是,飛書、釘釘、企微這類企業(yè)APP、石墨這類在線文檔玩家,甚至各種云辦公文檔小程序都能做到。

值得一提的是,前幾年外部環(huán)境造就了一波線上辦公熱,也間接火了一大批在線文檔APP,其中,印象筆記、石墨文檔這類小眾玩家人氣激增。數(shù)據(jù)顯示,2020年線上辦公爆發(fā)初期,印象筆記的C端用戶使用量翻了四五倍,石墨文檔的新增用戶量和企業(yè)注冊數(shù)增長了約6倍。

同年,騰訊文檔宣布月活突破1.6億后,內(nèi)卷開始成為行業(yè)生態(tài),整個行業(yè)也開始陷入了漫長的瓶頸期。

直到大模型的爆發(fā),情況開始有所轉(zhuǎn)變。

2023年財報顯示,WPS Office國內(nèi)個人辦公服務訂閱營收到達了26.5億,同比增長近30%,月活設(shè)備數(shù)高達5.98億。

在線文檔發(fā)力AI已經(jīng)成為不可避免的一個趨勢。艾媒咨詢數(shù)據(jù)顯示,隨著大語言模型和AIGC的規(guī)?;涞貞?,AIGC+協(xié)同辦公場景將有效帶動行業(yè)增長,2023年協(xié)同辦公市場規(guī)模預計達330.1億元

AI成了在線文檔們穩(wěn)固市場地位,留住用戶的重要手段。而WPS入局AI的心情則更為急切。畢竟在ChatGPT的火爆出圈后,在線辦公市場算是最方便落地的場景之一,隔壁微軟在OpenAI的GPT-4剛發(fā)布之時,就結(jié)合大語言模型LLM上線了Microsoft 365。

一直以來,WPS Office都與微軟Office針鋒相對。公開資料顯示,微軟Office和WPS Office在國內(nèi)市場Windows平臺的平均市場覆蓋率分別為81.5%和68.7%。微軟Office在PC端領(lǐng)先一步,后者在移動端則更有優(yōu)勢。

不可否認,微軟對AI的布局強烈刺激了WPS,可需要注意的是,開始關(guān)注AI的絕不止WPS一家。從國內(nèi)企業(yè)來看,百度有智能辦公平臺如流,釘釘更是背靠通義千問,印象筆記發(fā)布“印象AI”,飛書發(fā)布“My AI”……

巨頭們想利用AI更上一層樓,那些資金不足以入局AI的小眾玩家,也開始在曲線救國,選擇與大廠合作,這也是本次“豆包盜文”引發(fā)在線文檔圈集體淪陷的由來。

總而言之,在線文檔正熱情奔向AI,不管誰先勝出,要承擔“喂養(yǎng)”任務的用戶都成了最無辜的人,當他們輪流奔走在不同的平臺上,試圖繞開這一步時,竟悲哀的發(fā)現(xiàn),自己似乎早已無路可逃。

大模型訓練背后的“原罪”

據(jù)悉,百度的文心一言已服務8.5萬家企業(yè)客戶,阿里的通義千問已服務了9萬家企業(yè)客戶,截至2024年5月15日,字節(jié)的豆包總下載量超過1億,雙端月活破2600萬……

當大模型炙手可熱,AI訓練自然被外界所關(guān)注。公開資料顯示,大模型訓練步驟一般分為五步:數(shù)據(jù)收集和處理、模型設(shè)計與測試、模型訓練、評估和優(yōu)化以及模型部署與維護。

這其中,第一步至關(guān)重要。也正是這一步,造就了如豆包、WPS AI此類的諸多爭議。

大模型訓練與進化的基礎(chǔ)是數(shù)據(jù),但在AI發(fā)展進程中,數(shù)據(jù)來源是否合規(guī)成了這個賽道未來有無持續(xù)性的前提,否則,版權(quán)、隱私等疑云便會紛至沓來。在AI觸怒網(wǎng)文作者之前,畫手圈就已經(jīng)有了先例。

去年年底,小紅書AI繪畫模型Trik被國內(nèi)幾位畫師聯(lián)手起訴,理由是Trik未經(jīng)授權(quán)使用了畫師的原創(chuàng)作品作為訓練數(shù)據(jù),生成了與原作高度相似的圖片,侵犯了創(chuàng)作者的合法權(quán)益。360創(chuàng)始人周鴻祎也因涉及“AI盜圖”被全網(wǎng)群嘲。

海外也是一樣,有報道顯示,有1.6萬名英國藝術(shù)家聯(lián)名,對OpenAI和其他人工智能公司發(fā)起集體訴訟;甚至就連NYT也向法院起訴OpenAI和微軟侵犯版權(quán)。

在科技進步的歷史征程里,我們享受技術(shù)成果之前,似乎總要付出一些“隱形”成本。但這個成本應該由誰來承擔則值得探討。

事實上,大模型訓練之所以將觸手伸向普通群體,歸根到底還是因為企業(yè)發(fā)展大模型的成本居高不下,投入實用后又遲遲無法達到可觀的收益。當前OpenAI、Midjourney、文心一言、訊飛星火大模型雖然均已開啟付費模式,然而,大模型企業(yè)想要進入盈利階段仍然還有一段距離要走。

以頭部的OpenAI為例,調(diào)查顯示,雖然其在今年前兩個季度的收入不錯,年度經(jīng)常收入增長到了34億美元,但由于構(gòu)建和運行模型的成本高昂,虧損狀態(tài)始終沒能改善;ChatGPT會員付費收入達到50%以上,但偏向企業(yè)和開發(fā)者端的API收入占比僅為15%左右。

國內(nèi)這邊,Kimi目前的獲客成本還在12元以上、WPS AI總結(jié)一個萬字文檔、輸出千字摘要,仍舊需要2.64元……可行業(yè)內(nèi)的價格戰(zhàn)卻突然開始了。此前,GPT-4o mini正式上線,每100萬Token的輸入/輸出分別是15美分/60美分。

在這樣的背景下,大模型界呈現(xiàn)精彩的“眾生相”:被侵權(quán)的用戶義憤填膺、成本與營收不對稱的企業(yè)騎虎難下,而資本則開始生出退場的心思。來覓PEVC數(shù)據(jù)顯示,2024年一季度,人工智能領(lǐng)域合計發(fā)生融資案例198起,同比減少20.80%。

在過往的歷史經(jīng)驗里,當技術(shù)進步與倫理道德產(chǎn)生沖突,科技發(fā)展總會被視為某一方面的“原罪”,但應該背負原罪真的是科技嗎?

創(chuàng)新與制約同存

關(guān)于AI能否取代人類,這個問題最早誕生于科幻片年代,隨著大模型掀起全球科技狂潮,在戲劇化之外,似乎也增添了幾分可能性。蘿卜快跑惹起一眾司機抗議、網(wǎng)文作者聯(lián)名上書抵制番茄,都成了現(xiàn)代科技文明史上的一次開端。

7月6日,2024世界人工智能大會在上海落下帷幕,金融、教育、醫(yī)療成為重點應用落地方向。實際上,在ChatGPT 發(fā)布的時候,海外就有人專門統(tǒng)計過“哪些工作更有可能被 AI 替代”。

一位博主在Upwork(全球最大的自由職業(yè)平臺)統(tǒng)計了從ChatGPT 發(fā)布前一個月到 2024 年 2 月 14 日的一些自由職業(yè)工作數(shù)據(jù)。調(diào)查發(fā)現(xiàn),受ChatGPT 的影響,Upwork 上波及最大的幾個圈子是寫作、翻譯、客服服務。其中,翻譯淪為被AI取代的重災區(qū),工作數(shù)量下降了19%,時薪也下降了20%。

但在這些支持人工智能搶人類“飯碗”的數(shù)據(jù)表象背后,卻也存在著相反的趨勢:從宏觀角度來看,不少工作因為ChatGPT 的出現(xiàn)反而更多了。

統(tǒng)計顯示,尤其是可以用大模型為基礎(chǔ)的創(chuàng)作型工作,吃到了AI的第一波“紅利”。在Upwork 上,ChatGPT 發(fā)布之后,視頻編輯/制作工作數(shù)量增加了 39%,平面設(shè)計工作增加了 8%,網(wǎng)頁設(shè)計工作增加了 10%。軟件開發(fā)工作也有所增加,后端開發(fā)工作增加了 6%,前端/網(wǎng)頁開發(fā)工作增加了 4%。

科技的雙面性就此凸顯,AI并不是人人喊打,起碼在保障用戶基本利益的前提下,落地到具體生活里的好處遠遠大于弊端。國內(nèi)也是如此。例如在2023年,閱文的起點國際出海的網(wǎng)文作品里,有20%是AI來翻譯的。

當然,AI應用導致的爭議性問題從來沒有消失。

在網(wǎng)文作者與畫手質(zhì)疑版權(quán)外,學術(shù)界的大模型論文熱也在擊穿該領(lǐng)域的落地意義。以“中華醫(yī)學雜志”為例,從去年七月,該刊發(fā)現(xiàn)AI生成的論文數(shù)據(jù)每月都在上升,一度超過了50%。

目前,《中華醫(yī)學雜志》已發(fā)布AIGC技術(shù)使用的有關(guān)規(guī)定,輕者退稿或撤稿;情節(jié)嚴重者,將列入作者學術(shù)失信名單。

從這些案例中,我們不難看出,已經(jīng)有行業(yè)意識到AI應用要基于一些必要的規(guī)則下施行。之所以我們面對各類在線文檔AI化而草木皆兵,本質(zhì)是因為當前的AI規(guī)范還沒到位。

為此,官方出臺的相關(guān)政策也越來越多,國內(nèi)有《生成式人工智能服務管理暫行辦法》、國際方面,歐洲議會在今年3月份通過了《人工智能法案》等等……而如何保證在不扼殺創(chuàng)新的同時,又合理的培養(yǎng)大模型、使用大模型,正成為整個行業(yè)的新節(jié)點。

種種跡象顯示,大模型的出現(xiàn),是人類科技文明豐碑上不可磨滅的一個符號,同時,也是一份沉重的責任,需要更多人去主動承擔。

至于誰該成為大模型成長的“養(yǎng)料”,肯定不能只讓普通用戶成為唯一的代價。

編者按:本文轉(zhuǎn)載自微信公眾號:道總有理(ID:daotmt),作者:道總 

本文來源道總有理,內(nèi)容僅代表作者本人觀點,不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應用建議。(若存在內(nèi)容、版權(quán)或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p18 q0 我要投稿

分享:

品牌、內(nèi)容合作請點這里:尋求合作 ››

前瞻經(jīng)濟學人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫
企查貓
作者 道總有理
科技自媒體
66129
關(guān)注
147
文章
0
前瞻經(jīng)濟學人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟學家互動交流讓您成為更懂趨勢的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟學人》APP提問

 
在線咨詢
×
在線咨詢

項目熱線 0755-33015070

AAPP
前瞻經(jīng)濟學人APP下載二維碼

下載前瞻經(jīng)濟學人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號

掃一掃關(guān)注我們

我要投稿

×
J