報(bào)告服務(wù)熱線400-068-7188

張一鳴的路,OpenAI走得通嗎?

分享到:
20 字母榜 ? 2024-01-11 15:02:48  來(lái)源:字母榜 E3879G0

作者|譚宵寒 來(lái)源|字母榜(ID:wujicaijing)

OpenAI和《紐約時(shí)報(bào)》的互掐,越來(lái)越有看頭了。

當(dāng)?shù)貢r(shí)間1月9日,OpenAI終于打破了近兩周的沉默,公開發(fā)表長(zhǎng)文回應(yīng)《紐約時(shí)報(bào)》的指控。去年12月27日,《紐約時(shí)報(bào)》在美國(guó)起訴ChatGPT制造商OpenAI及其合作伙伴微軟,指控后者未經(jīng)許可使用數(shù)百萬(wàn)篇文章訓(xùn)練AI。

這次OpenAI的回應(yīng)不是白開水般的公關(guān)措辭,而是犀利地指出,《紐約時(shí)報(bào)》沒有講述完整的經(jīng)過(guò),且有故意操縱ChatGPT回答結(jié)果之嫌,整個(gè)訴訟毫無(wú)根據(jù)。

一邊是代表著新科技的ChatGPT,一邊是代表著老牌新聞機(jī)構(gòu)的《紐約時(shí)報(bào)》,二者對(duì)簿公堂,原本就是注定寫進(jìn)科技史的事件。如今OpenAI頗為“頭鐵”的回應(yīng),更是為事件火上澆油。

回頭看,不管是廣播、電視、互聯(lián)網(wǎng),新的媒介產(chǎn)生,都會(huì)與內(nèi)容版權(quán)方產(chǎn)生利益拉扯,其中又尤以新聞業(yè)最為激烈。

整整10年前,在中國(guó),正在崛起的今日頭條也被《廣州日?qǐng)?bào)》告上法庭,其后多個(gè)新聞機(jī)構(gòu)、門戶網(wǎng)站跟進(jìn),大有群起而攻之的氣勢(shì)。事件雙方的矛盾與如今AI與新聞媒體之間的如出一轍。

那場(chǎng)紛爭(zhēng),最后以今日頭條大力購(gòu)買版權(quán)而逐漸平息,“合作”是張一鳴擺出的路徑。兩年后,今日頭條覆蓋的媒體已達(dá)3700余家,每年在版權(quán)采購(gòu)商的投入超過(guò)15億元。

無(wú)獨(dú)有偶,OpenAI如今高舉的依然是“合作”的旗。在對(duì)《紐約時(shí)報(bào)》毫不客氣地回懟之余,也強(qiáng)調(diào)了“可退出”原則,以及與新聞機(jī)構(gòu)合作的強(qiáng)烈意愿。

但這次,《紐約時(shí)報(bào)》們只會(huì)更加謹(jǐn)慎——直到現(xiàn)在,社交媒體如Facebook、搜索引擎如谷歌與新聞業(yè)仍舊沒有達(dá)成一致,新聞業(yè)想要從平臺(tái)獲得更多分成,而平臺(tái)則不愿輕易配合。

OpenAI拋出合作之“餅”,《紐約時(shí)報(bào)》們可能不會(huì)輕易吃下了。

OpenAI和《紐約時(shí)報(bào)》,都握緊了拳頭。

自ChatGPT在2022年底推出以來(lái),OpenAI沒少吃版權(quán)官司。去年9月,就有十余名作家對(duì)OpenAI提起訴訟,幾個(gè)月后的12月,又有11名美國(guó)作家在紐約曼哈頓聯(lián)邦法院起訴OpenAI和微軟。

但《紐約時(shí)報(bào)》的訴狀,分量畢竟不同。一來(lái)《紐約時(shí)報(bào)》本身是西方最主流、最大的老牌媒體之一,二來(lái)《紐約時(shí)報(bào)》的起訴來(lái)勢(shì)洶洶。

起訴OpenAI,《紐約時(shí)報(bào)》一口氣向法院提交了22000頁(yè)的附件和狀書,其中對(duì)ChatGPT侵權(quán)的關(guān)鍵證據(jù)多達(dá)100個(gè),顯示ChatGPT輸出的內(nèi)容和《紐約時(shí)報(bào)》高度相似。

在一個(gè)典型的證據(jù)片段中,左邊是GPT-4的輸出結(jié)果,右邊是《紐約時(shí)報(bào)》原文,重合的文字以紅色顯示,像極了中文互聯(lián)網(wǎng)上每次“錘”抄襲時(shí)會(huì)用的“調(diào)色盤”技能。

訴狀中表示,光是《紐約時(shí)報(bào)》的文章構(gòu)成了Common Crawl中用于訓(xùn)練GPT的最大單個(gè)專有數(shù)據(jù)集(Common Crawl 是一個(gè)基金會(huì),16年來(lái)已經(jīng)幾乎存檔了整個(gè)網(wǎng)絡(luò))。《紐約時(shí)報(bào)》要求OpenAI和微軟銷毀包含侵權(quán)材料的模型和訓(xùn)練數(shù)據(jù),沒有提出具體索賠金額,但表示被告應(yīng)該對(duì)非法復(fù)制和使用《紐約時(shí)報(bào)》獨(dú)有價(jià)值的作品相關(guān)的“數(shù)十億美元的法定和實(shí)際損失”負(fù)責(zé)。

除此之外,《紐約時(shí)報(bào)》還指出,由于AI“幻覺”,ChatGPT有時(shí)會(huì)將一些假新聞、謠言“張冠李戴”,說(shuō)成是出自《紐約時(shí)報(bào)》的,對(duì)其名譽(yù)造成損害。

《紐約時(shí)報(bào)》有備而來(lái),重拳出擊,提起上訴的當(dāng)天還自己出了高調(diào)的報(bào)道,打得OpenAI措手不及。OpenAI后來(lái)也說(shuō),本來(lái)在12月已經(jīng)和OpenAI就版權(quán)問題在溝通合作方案了,沒想到對(duì)方轉(zhuǎn)手就是一記耳光。

再表態(tài)時(shí),OpenAI也不客氣,發(fā)長(zhǎng)文,拋出四個(gè)關(guān)鍵點(diǎn):1、OpenAI愿意和新聞機(jī)構(gòu)合作并創(chuàng)造新機(jī)會(huì);2、使用公開的互聯(lián)網(wǎng)材料訓(xùn)練AI模型是合理的,但OpenAI還是提供了退出機(jī)制;3、反芻事實(shí)(regurgitate facts)確實(shí)是一種罕見的錯(cuò)誤,OpenAI正在努力將其減少到零;4、《紐約時(shí)報(bào)》沒有完整講述故事,其訴訟毫無(wú)根據(jù)。

其中提到的“反芻”,就是指AI將訓(xùn)練物料原封不動(dòng)地“吐出來(lái)”,就像《紐約時(shí)報(bào)》所列舉的那樣,AI的回答和《紐約時(shí)報(bào)》的文章幾乎一字不差。OpenAI的立場(chǎng)是,“反芻”現(xiàn)象的確存在,但OpenAI已經(jīng)將其程度降到很低,《紐約時(shí)報(bào)》一下拿出上百個(gè)“反芻”例子,是很可疑的。

因此,OpenAI懷疑:“有趣的是,《紐約時(shí)報(bào)》提到的反芻似乎來(lái)自多個(gè)第三方網(wǎng)站上大量傳播的多年前的文章。他們似乎故意操縱提示,通常包括冗長(zhǎng)的文章摘錄,以便讓我們的模型反芻。即使使用這樣的提示,我們的模型通常也不會(huì)像《紐約時(shí)報(bào)》暗示的那樣表現(xiàn),這表明他們要么指示模型反芻,要么從多次嘗試中精心挑選示例。”

總而言之就是:說(shuō)我家孩子偷東西?我看是你塞孩子手里、搞栽贓吧?

除此之外,OpenAI的回應(yīng)中還有兩點(diǎn)值得玩味。

首先,OpenAI強(qiáng)調(diào)了“退出”機(jī)制,并指出《紐約時(shí)報(bào)》早在去年8月就已經(jīng)采用推出流程。實(shí)際上,《紐約時(shí)報(bào)》、路透社、CNN等在內(nèi)的多家主流新聞媒體都已在去年起屏蔽OpenAI的GPTBot網(wǎng)絡(luò)爬蟲,以限制其繼續(xù)獲取這些媒體的內(nèi)容。

其次,OpenAI“殺人誅心”,否定了《紐約時(shí)報(bào)》一家媒體在ChatGPT訓(xùn)練中的重要性:“由于模型是從人類知識(shí)的巨大集合中學(xué)習(xí)的,因此任何一個(gè)部門(包括新聞)都只是整體訓(xùn)練數(shù)據(jù)的一小部分,而任何單一數(shù)據(jù)源(包括《紐約時(shí)報(bào)》)對(duì)于模型的預(yù)期學(xué)習(xí)并不重要。”

“我不是、我沒有、你別瞎說(shuō)啊”的否認(rèn)三連,放在OpenAI身上正合適。

既然AI已經(jīng)是未來(lái)趨勢(shì),OpenAI也有意愿合作,《紐約時(shí)報(bào)》為何還要大動(dòng)干戈?

“人工智能30%都來(lái)源于新聞業(yè)。讓我們不要再犯同樣的錯(cuò)誤、再一次免費(fèi)地付出一切。”“我們的內(nèi)容正在被盜竊,我們必須說(shuō):這次不行。”《媒體創(chuàng)新2023年世界報(bào)告》中寫道。

“不要犯同樣的錯(cuò)誤”,類似的措辭,當(dāng)OpenAI的CEO山姆·阿爾特曼坐在美國(guó)國(guó)會(huì)聽證席上時(shí)也聽到過(guò)。彼時(shí)國(guó)會(huì)議員數(shù)次表達(dá)后悔,稱不能重蹈社交媒體時(shí)代的覆轍。社交媒體時(shí)代,監(jiān)管被遠(yuǎn)遠(yuǎn)落在科技發(fā)展之后,扎克伯格2018年首次因“劍橋丑聞”坐上國(guó)會(huì)聽證席時(shí),F(xiàn)acebook已經(jīng)推出14年。

從某種角度來(lái)說(shuō),OpenAI的確是站在了巨人的肩膀上——有了前車之鑒,ChatGPT一朝出名,立刻引來(lái)四方警惕。

《紐約時(shí)報(bào)》們也不想重蹈覆轍。在搜索引擎和社交媒體成為流量入口的時(shí)代,傳統(tǒng)媒體艱難轉(zhuǎn)型,也曾和大型科技平臺(tái)達(dá)成“合作”,但后來(lái)卻覺得這不“值”。

Facebook很早就和傳統(tǒng)媒體展開合作,《紐約時(shí)報(bào)》也是首批入駐的媒體,那時(shí)的合作模式是利潤(rùn)分成,分發(fā)在Facebook的平臺(tái)完成。但隨著2018年Facebook和谷歌母公司獲得美國(guó)數(shù)字廣告收入的60%,媒體機(jī)構(gòu)開始覺得自己被奪走得太多、得到的卻太少。

2019年,《紐約時(shí)報(bào)》曾發(fā)布報(bào)道:美國(guó)新聞業(yè)數(shù)字廣告年收入51億美元,而谷歌提供聚合新聞服務(wù)所獲得的數(shù)字廣告收入47億美元。

新聞出版商在多個(gè)國(guó)家和地區(qū)爭(zhēng)取更多利益。2020年,澳大利亞政府成為第一個(gè)要求Facebook和谷歌為新聞內(nèi)容付費(fèi)的國(guó)家。2023年,加拿大也通過(guò)了《在線新聞法》,隨后谷歌與當(dāng)局達(dá)成協(xié)議,同意向加拿大新聞出版商支付7400萬(wàn)美元。而Facebook的制造商Meta卻拒絕妥協(xié),干脆不在加拿大當(dāng)?shù)仄帘涡侣剝?nèi)容。美國(guó)《新聞競(jìng)爭(zhēng)與保護(hù)法案》也曾在國(guó)會(huì)推進(jìn),但未獲得全體投票機(jī)會(huì)。

撰寫《媒體創(chuàng)新2023年世界報(bào)告》的創(chuàng)新媒體咨詢集團(tuán)創(chuàng)始人胡安·賽諾在演講中直言:“我們不能在別人的平臺(tái)上建立自己的業(yè)務(wù),無(wú)論是Facebook還是谷歌,大型科技公司并不關(guān)心我們的利益。”“他們有自己的利益,為什么要指望他們照顧我們的利益呢?形式主義盛行,收入?yún)s太少。”

要知道,《紐約時(shí)報(bào)》本身是在紙媒衰落之時(shí)浴火重生的榜樣,2008年次貸危機(jī)后,其一度抵押總部大樓借款,甚至多方出手想要將其收購(gòu)。隨著大舉進(jìn)行數(shù)字化轉(zhuǎn)型,推出付費(fèi)訂閱模式,《紐約時(shí)報(bào)》最終扭虧為盈。在2022年,《紐約時(shí)報(bào)》超過(guò)六成收入都來(lái)自付費(fèi)訂閱。

由此,也就不難理解《紐約時(shí)報(bào)》要和OpenAI“魚死網(wǎng)破”的架勢(shì)從何而來(lái):“合作”說(shuō)起來(lái)簡(jiǎn)單,但怎么合作才能保證《紐約時(shí)報(bào)》們?cè)械睦娌皇芮趾Α⑿碌纳虣C(jī)不被奪走?問號(hào)很多,答案寥寥。

“利用《紐約時(shí)報(bào)》在報(bào)道中的巨大投入,在搭新聞行業(yè)的便車。”《紐約時(shí)報(bào)》的怨氣,不僅來(lái)自“初出茅廬”的ChatGPT。

對(duì)于OpenAI來(lái)說(shuō),這注定是一場(chǎng)硬仗。

除了多點(diǎn)爆發(fā)的版權(quán)之爭(zhēng),歐洲已經(jīng)于去年6月表決通過(guò)《AI法案》草案。根據(jù)該法案,OpenAI等廠商需要公開在訓(xùn)練模型過(guò)程中使用的受版權(quán)保護(hù)的版權(quán)數(shù)據(jù)清單。

雖然在此次的聲明中強(qiáng)調(diào)《紐約時(shí)報(bào)》“不重要”,但版權(quán)內(nèi)容對(duì)于OpenAI的大模型訓(xùn)練還是很重要的。

在前不久提交給英國(guó)上議院通信和數(shù)字事務(wù)特別委員會(huì)關(guān)于大語(yǔ)言模型調(diào)查的文件中,OpenAI承認(rèn),像ChatGPT這樣的AI工具的開發(fā)離不開受版權(quán)保護(hù)的素材,并稱如果沒有這些素材,GPT根本無(wú)法誕生:“由于當(dāng)前版權(quán)涵蓋了幾乎所有形式的人類表達(dá)方式,包括博客文章、照片、論壇帖子、軟件代碼片段和政府文件,如果不使用受版權(quán)保護(hù)的內(nèi)容,就不可能訓(xùn)練當(dāng)今領(lǐng)先的人工智能模型。”

在和《紐約時(shí)報(bào)》隔空互懟的同時(shí),OpenAI也在積極推進(jìn)與新聞業(yè)的“合作”,已經(jīng)取得部分成果。

去年12月,《紐約時(shí)報(bào)》起訴OpenAI前不久,OpenAI與德國(guó)新聞出版巨頭阿克塞爾·施普林格(Axel Springer)達(dá)成合作。施普林格是歐洲最大的數(shù)字出版公司,旗下包括Business Insider、《世界報(bào)》等在內(nèi)的知名新聞品牌。

雙方簽訂為期多年的協(xié)議,ChatGPT可以在回復(fù)中給用戶提供施普林格新聞媒體的報(bào)道摘要,包含原始出處和鏈接,保證新聞網(wǎng)站獲得流量。同時(shí),施普林格的內(nèi)容將被OpenAI用于訓(xùn)練模型。Information援引知情人士稱,該交易在上千億美元規(guī)模。

這已經(jīng)是OpenAI與新聞機(jī)構(gòu)達(dá)成的第二個(gè)大型合作,同年7月其曾與美聯(lián)社達(dá)成類似協(xié)議,金額未公開。

競(jìng)爭(zhēng)也會(huì)進(jìn)一步推高新聞采集的成本。去年12月,媒體報(bào)道蘋果已經(jīng)和多家主要出版商達(dá)成協(xié)議,采集其新聞內(nèi)容訓(xùn)練AI模型。報(bào)道稱,蘋果已經(jīng)和NBC新聞、IAC等多家機(jī)構(gòu)接洽,擬議交易金額至少5000萬(wàn)美元。

僅僅勾一勾“廣告分成”的手指頭,就引來(lái)主流媒體爭(zhēng)相入駐,那種“好時(shí)代”屬于社交媒體和搜索引擎。如今的OpenAI們,不得不畫更大、更香的餅。

參考資料:

1、36氪:《 紐約時(shí)報(bào):從危機(jī)中崛起重返全球媒體之巔》

2、iweekly周末畫報(bào):《挽救新聞業(yè),谷歌同意向加拿大新聞出版商付費(fèi)》

3、騰訊科技:《Facebook將推新聞標(biāo)簽 擬斥資數(shù)百萬(wàn)美元從媒體購(gòu)買版權(quán)》

4、界面新聞:《OpenAI與出版界巨頭達(dá)成合作,這項(xiàng)交易能否為新聞業(yè)帶來(lái)進(jìn)化嗎?》

北京日?qǐng)?bào):《手機(jī)APP“今日頭條”肆意抓取新聞陷侵權(quán)漩渦》

編者按:本文轉(zhuǎn)載自微信公眾號(hào):字母榜(ID:wujicaijing),作者:譚宵寒  編者按:本文轉(zhuǎn)載自微信公眾號(hào):字母榜(ID:wujicaijing),作者:譚宵寒 

本文來(lái)源字母榜,內(nèi)容僅代表作者本人觀點(diǎn),不代表前瞻網(wǎng)的立場(chǎng)。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問題,請(qǐng)聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請(qǐng)聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p32 q0 我要投稿

分享:
標(biāo)簽: 張一鳴 OpenAI

品牌、內(nèi)容合作請(qǐng)點(diǎn)這里:尋求合作 ››

前瞻經(jīng)濟(jì)學(xué)人

專注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國(guó)產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫(kù)
企查貓
作者 字母榜
科技自媒體
510264
關(guān)注
1051
文章
前瞻經(jīng)濟(jì)學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟(jì)學(xué)家互動(dòng)交流讓您成為更懂趨勢(shì)的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟(jì)學(xué)人》APP提問

 
在線咨詢
×
在線咨詢

項(xiàng)目熱線 0755-33015070

AAPP
前瞻經(jīng)濟(jì)學(xué)人APP下載二維碼

下載前瞻經(jīng)濟(jì)學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號(hào)

掃一掃關(guān)注我們

我要投稿

×
J