當(dāng)前位置：前瞻產(chǎn)業(yè)研究院 ? 經(jīng)濟(jì)學(xué)人 ? 觀察家專欄

誰該成為大模型成長的“養(yǎng)料”？

分享到：

道總有理 ? 2024-08-01 11:39:31 　來源：道總有理　E3348G0

圖源：攝圖網(wǎng)

作者|道總來源|道總有理(ID：daotmt)

有關(guān)“AI將要取代人工”的言論甚囂塵上，且不再局限于科技幻想，而是真實(shí)地走進(jìn)了現(xiàn)實(shí)世界。

先是蘿卜快跑落地，導(dǎo)致大批網(wǎng)約車司機(jī)不滿，隨后，番茄小說上線“AI作者”一日同更三本書讓網(wǎng)文作者如臨大敵。

接著，與番茄小說同屬于字節(jié)跳動(dòng)的“豆包”被爆出正全網(wǎng)搜索小說素材，以便“喂養(yǎng)”番茄的AI作者。更有意思的是，這出風(fēng)波波及到了在線文檔領(lǐng)域。據(jù)悉，有網(wǎng)友在社交平臺(tái)表示，稱豆包的搜羅范圍不僅在網(wǎng)文界，手還伸向了在線文檔內(nèi)作者尚未發(fā)布的內(nèi)容。

其中，WPS首當(dāng)其沖。

WPS官方為此不得不緊急辟謠。但除了WPS，幾乎所有在線文檔APP都遭受了一番審查，包括石墨、騰訊文檔、印象筆記、墨客、橙瓜……最終很多人發(fā)現(xiàn)，當(dāng)AI風(fēng)口來襲，網(wǎng)絡(luò)世界哪里都不安全。

這也不算空穴來風(fēng)。去年，WPS就被爆出在用戶協(xié)議里增添了AI訓(xùn)練條例，盡管這兩年官方一直在據(jù)理力爭地辟謠，但很多用戶還是不肯給予信任，“羅生門”大戲就此上演。

用戶在擔(dān)心自己辛苦創(chuàng)作的內(nèi)容，成了他人的嫁衣，而AI背后的資本則一心想當(dāng)“普羅米修斯”，為大模型到處搜集“火種”。

在線文檔，集體奔向AI

這些年，在線文檔面臨了太多壓力：諸如研發(fā)停滯、用戶流失、同行內(nèi)卷、廣告營收疲軟…

在線文檔遇到創(chuàng)新乏力已是不爭的事實(shí)，WPS作為行業(yè)代表，也難逃這一困境。在入局AI之前，WPS最高調(diào)的一次革新還在2018年，當(dāng)年，騰訊文檔橫空出世，讓W(xué)PS一時(shí)倍感焦灼，在前者上線三個(gè)月后，后者宣布升級。

尤其增加了多人協(xié)作功能，WPS還一度把這部分單獨(dú)拿了出來。但時(shí)至今日，云協(xié)同早已遍地皆是，飛書、釘釘、企微這類企業(yè)APP、石墨這類在線文檔玩家，甚至各種云辦公文檔小程序都能做到。

值得一提的是，前幾年外部環(huán)境造就了一波線上辦公熱，也間接火了一大批在線文檔APP，其中，印象筆記、石墨文檔這類小眾玩家人氣激增。數(shù)據(jù)顯示，2020年線上辦公爆發(fā)初期，印象筆記的C端用戶使用量翻了四五倍，石墨文檔的新增用戶量和企業(yè)注冊數(shù)增長了約6倍。

同年，騰訊文檔宣布月活突破1.6億后，內(nèi)卷開始成為行業(yè)生態(tài)，整個(gè)行業(yè)也開始陷入了漫長的瓶頸期。

直到大模型的爆發(fā)，情況開始有所轉(zhuǎn)變。

2023年財(cái)報(bào)顯示，WPS Office國內(nèi)個(gè)人辦公服務(wù)訂閱營收到達(dá)了26.5億，同比增長近30%，月活設(shè)備數(shù)高達(dá)5.98億。

在線文檔發(fā)力AI已經(jīng)成為不可避免的一個(gè)趨勢。艾媒咨詢數(shù)據(jù)顯示，隨著大語言模型和AIGC的規(guī)模化落地應(yīng)用，AIGC+協(xié)同辦公場景將有效帶動(dòng)行業(yè)增長，2023年協(xié)同辦公市場規(guī)模預(yù)計(jì)達(dá)330.1億元

AI成了在線文檔們穩(wěn)固市場地位，留住用戶的重要手段。而WPS入局AI的心情則更為急切。畢竟在ChatGPT的火爆出圈后，在線辦公市場算是最方便落地的場景之一，隔壁微軟在OpenAI的GPT-4剛發(fā)布之時(shí)，就結(jié)合大語言模型LLM上線了Microsoft 365。

一直以來，WPS Office都與微軟Office針鋒相對。公開資料顯示，微軟Office和WPS Office在國內(nèi)市場Windows平臺(tái)的平均市場覆蓋率分別為81.5%和68.7%。微軟Office在PC端領(lǐng)先一步，后者在移動(dòng)端則更有優(yōu)勢。

不可否認(rèn)，微軟對AI的布局強(qiáng)烈刺激了WPS，可需要注意的是，開始關(guān)注AI的絕不止WPS一家。從國內(nèi)企業(yè)來看，百度有智能辦公平臺(tái)如流，釘釘更是背靠通義千問，印象筆記發(fā)布“印象AI”，飛書發(fā)布“My AI”……

巨頭們想利用AI更上一層樓，那些資金不足以入局AI的小眾玩家，也開始在曲線救國，選擇與大廠合作，這也是本次“豆包盜文”引發(fā)在線文檔圈集體淪陷的由來。

總而言之，在線文檔正熱情奔向AI，不管誰先勝出，要承擔(dān)“喂養(yǎng)”任務(wù)的用戶都成了最無辜的人，當(dāng)他們輪流奔走在不同的平臺(tái)上，試圖繞開這一步時(shí)，竟悲哀的發(fā)現(xiàn)，自己似乎早已無路可逃。

大模型訓(xùn)練背后的“原罪”

據(jù)悉，百度的文心一言已服務(wù)8.5萬家企業(yè)客戶，阿里的通義千問已服務(wù)了9萬家企業(yè)客戶，截至2024年5月15日，字節(jié)的豆包總下載量超過1億，雙端月活破2600萬……

當(dāng)大模型炙手可熱，AI訓(xùn)練自然被外界所關(guān)注。公開資料顯示，大模型訓(xùn)練步驟一般分為五步：數(shù)據(jù)收集和處理、模型設(shè)計(jì)與測試、模型訓(xùn)練、評估和優(yōu)化以及模型部署與維護(hù)。

這其中，第一步至關(guān)重要。也正是這一步，造就了如豆包、WPS AI此類的諸多爭議。

大模型訓(xùn)練與進(jìn)化的基礎(chǔ)是數(shù)據(jù)，但在AI發(fā)展進(jìn)程中，數(shù)據(jù)來源是否合規(guī)成了這個(gè)賽道未來有無持續(xù)性的前提，否則，版權(quán)、隱私等疑云便會(huì)紛至沓來。在AI觸怒網(wǎng)文作者之前，畫手圈就已經(jīng)有了先例。

去年年底，小紅書AI繪畫模型Trik被國內(nèi)幾位畫師聯(lián)手起訴，理由是Trik未經(jīng)授權(quán)使用了畫師的原創(chuàng)作品作為訓(xùn)練數(shù)據(jù)，生成了與原作高度相似的圖片，侵犯了創(chuàng)作者的合法權(quán)益。360創(chuàng)始人周鴻祎也因涉及“AI盜圖”被全網(wǎng)群嘲。

海外也是一樣，有報(bào)道顯示，有1.6萬名英國藝術(shù)家聯(lián)名，對OpenAI和其他人工智能公司發(fā)起集體訴訟；甚至就連NYT也向法院起訴OpenAI和微軟侵犯版權(quán)。

在科技進(jìn)步的歷史征程里，我們享受技術(shù)成果之前，似乎總要付出一些“隱形”成本。但這個(gè)成本應(yīng)該由誰來承擔(dān)則值得探討。

事實(shí)上，大模型訓(xùn)練之所以將觸手伸向普通群體，歸根到底還是因?yàn)槠髽I(yè)發(fā)展大模型的成本居高不下，投入實(shí)用后又遲遲無法達(dá)到可觀的收益。當(dāng)前OpenAI、Midjourney、文心一言、訊飛星火大模型雖然均已開啟付費(fèi)模式，然而，大模型企業(yè)想要進(jìn)入盈利階段仍然還有一段距離要走。

以頭部的OpenAI為例，調(diào)查顯示，雖然其在今年前兩個(gè)季度的收入不錯(cuò)，年度經(jīng)常收入增長到了34億美元，但由于構(gòu)建和運(yùn)行模型的成本高昂，虧損狀態(tài)始終沒能改善；ChatGPT會(huì)員付費(fèi)收入達(dá)到50%以上，但偏向企業(yè)和開發(fā)者端的API收入占比僅為15%左右。

國內(nèi)這邊，Kimi目前的獲客成本還在12元以上、WPS AI總結(jié)一個(gè)萬字文檔、輸出千字摘要，仍舊需要2.64元……可行業(yè)內(nèi)的價(jià)格戰(zhàn)卻突然開始了。此前，GPT-4o mini正式上線，每100萬Token的輸入/輸出分別是15美分/60美分。

在這樣的背景下，大模型界呈現(xiàn)精彩的“眾生相”：被侵權(quán)的用戶義憤填膺、成本與營收不對稱的企業(yè)騎虎難下，而資本則開始生出退場的心思。來覓PEVC數(shù)據(jù)顯示，2024年一季度，人工智能領(lǐng)域合計(jì)發(fā)生融資案例198起，同比減少20.80%。

在過往的歷史經(jīng)驗(yàn)里，當(dāng)技術(shù)進(jìn)步與倫理道德產(chǎn)生沖突，科技發(fā)展總會(huì)被視為某一方面的“原罪”，但應(yīng)該背負(fù)原罪真的是科技嗎？

創(chuàng)新與制約同存

關(guān)于AI能否取代人類，這個(gè)問題最早誕生于科幻片年代，隨著大模型掀起全球科技狂潮，在戲劇化之外，似乎也增添了幾分可能性。蘿卜快跑惹起一眾司機(jī)抗議、網(wǎng)文作者聯(lián)名上書抵制番茄，都成了現(xiàn)代科技文明史上的一次開端。

7月6日，2024世界人工智能大會(huì)在上海落下帷幕，金融、教育、醫(yī)療成為重點(diǎn)應(yīng)用落地方向。實(shí)際上，在ChatGPT 發(fā)布的時(shí)候，海外就有人專門統(tǒng)計(jì)過“哪些工作更有可能被 AI 替代”。

一位博主在Upwork（全球最大的自由職業(yè)平臺(tái)）統(tǒng)計(jì)了從ChatGPT 發(fā)布前一個(gè)月到 2024 年 2 月 14 日的一些自由職業(yè)工作數(shù)據(jù)。調(diào)查發(fā)現(xiàn)，受ChatGPT 的影響，Upwork 上波及最大的幾個(gè)圈子是寫作、翻譯、客服服務(wù)。其中，翻譯淪為被AI取代的重災(zāi)區(qū)，工作數(shù)量下降了19%，時(shí)薪也下降了20%。

但在這些支持人工智能搶人類“飯碗”的數(shù)據(jù)表象背后，卻也存在著相反的趨勢：從宏觀角度來看，不少工作因?yàn)镃hatGPT 的出現(xiàn)反而更多了。

統(tǒng)計(jì)顯示，尤其是可以用大模型為基礎(chǔ)的創(chuàng)作型工作，吃到了AI的第一波“紅利”。在Upwork 上，ChatGPT 發(fā)布之后，視頻編輯/制作工作數(shù)量增加了 39%，平面設(shè)計(jì)工作增加了 8%，網(wǎng)頁設(shè)計(jì)工作增加了 10%。軟件開發(fā)工作也有所增加，后端開發(fā)工作增加了 6%，前端/網(wǎng)頁開發(fā)工作增加了 4%。

科技的雙面性就此凸顯，AI并不是人人喊打，起碼在保障用戶基本利益的前提下，落地到具體生活里的好處遠(yuǎn)遠(yuǎn)大于弊端。國內(nèi)也是如此。例如在2023年，閱文的起點(diǎn)國際出海的網(wǎng)文作品里，有20%是AI來翻譯的。

當(dāng)然，AI應(yīng)用導(dǎo)致的爭議性問題從來沒有消失。

在網(wǎng)文作者與畫手質(zhì)疑版權(quán)外，學(xué)術(shù)界的大模型論文熱也在擊穿該領(lǐng)域的落地意義。以“中華醫(yī)學(xué)雜志”為例，從去年七月，該刊發(fā)現(xiàn)AI生成的論文數(shù)據(jù)每月都在上升，一度超過了50%。

目前，《中華醫(yī)學(xué)雜志》已發(fā)布AIGC技術(shù)使用的有關(guān)規(guī)定，輕者退稿或撤稿；情節(jié)嚴(yán)重者，將列入作者學(xué)術(shù)失信名單。

從這些案例中，我們不難看出，已經(jīng)有行業(yè)意識到AI應(yīng)用要基于一些必要的規(guī)則下施行。之所以我們面對各類在線文檔AI化而草木皆兵，本質(zhì)是因?yàn)楫?dāng)前的AI規(guī)范還沒到位。

為此，官方出臺(tái)的相關(guān)政策也越來越多，國內(nèi)有《生成式人工智能服務(wù)管理暫行辦法》、國際方面，歐洲議會(huì)在今年3月份通過了《人工智能法案》等等……而如何保證在不扼殺創(chuàng)新的同時(shí)，又合理的培養(yǎng)大模型、使用大模型，正成為整個(gè)行業(yè)的新節(jié)點(diǎn)。

種種跡象顯示，大模型的出現(xiàn)，是人類科技文明豐碑上不可磨滅的一個(gè)符號，同時(shí)，也是一份沉重的責(zé)任，需要更多人去主動(dòng)承擔(dān)。

至于誰該成為大模型成長的“養(yǎng)料”，肯定不能只讓普通用戶成為唯一的代價(jià)。

編者按：本文轉(zhuǎn)載自微信公眾號：道總有理(ID：daotmt)，作者：道總

本文來源道總有理，內(nèi)容僅代表作者本人觀點(diǎn)，不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。（若存在內(nèi)容、版權(quán)或其它問題，請聯(lián)系：service@qianzhan.com）　品牌合作與廣告投放請聯(lián)系：0755-33015062 或 hezuo@qianzhan.com

p18 q0 我要投稿

標(biāo)簽：大模型技術(shù)

品牌、內(nèi)容合作請點(diǎn)這里：尋求合作 ››

產(chǎn)業(yè)規(guī)劃
園區(qū)規(guī)劃
產(chǎn)業(yè)招商
可行性研究
低空經(jīng)濟(jì)
高端裝備
生物醫(yī)藥

前瞻經(jīng)濟(jì)學(xué)人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者，專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案，掃一掃關(guān)注。