報(bào)告服務(wù)熱線400-068-7188

OpenAI CTO:普通人數(shù)月后就能用Sora了

分享到:
20 字母榜 ? 2024-03-14 13:56:39  來源:字母榜 E2661G0

作者|畢安娣 來源|字母榜(ID:wujicaijing)

OpenAI似乎已經(jīng)在為Sora降世預(yù)熱了。

當(dāng)?shù)貢r(shí)間3月13日周三,OpenAI首席技術(shù)官米拉·穆拉蒂(Mira Murati)接受了《華盛頓郵報(bào)》的視頻專訪。

視頻不長(zhǎng),只有不到11分鐘,但全部圍繞OpenAI的文字到視頻工具Sora,穆拉蒂透露了一個(gè)重要的消息。當(dāng)被問及Sora何時(shí)面向公眾推出時(shí),穆拉蒂回答:“我想肯定是在今年,但可能是幾個(gè)月后。”

除此之外,穆拉蒂還回答了Sora的特別之處、如何修正瑕疵、是否會(huì)包含音頻、訓(xùn)練數(shù)據(jù)來自哪里等若干問題。給出的答案有的籠統(tǒng),有的不乏誠意。

距離OpenAI突然展示Sora,已經(jīng)過去一個(gè)月了。Sora演示視頻的時(shí)長(zhǎng)和效果驚艷世人,迅速成為輿論寵兒。但Sora也帶來太多問號(hào):沒有明確的發(fā)布時(shí)間、只對(duì)少數(shù)人開放測(cè)試、對(duì)訓(xùn)練數(shù)據(jù)來源三緘其口。

但現(xiàn)在,OpenAI似乎在一點(diǎn)點(diǎn)釋放更多信息。

作為OpenAI最重要的高管之一,穆拉蒂的話自有其分量。而就在前幾天,Sora的三位核心團(tuán)隊(duì)成員也出現(xiàn)在科技播客WVFRM中,接受了專訪。

此外,另一檔頭部播客主理人Lex Fridman也已經(jīng)官宣將很快邀請(qǐng)OpenAI的CEO山姆·奧特曼(Sam Altman)上節(jié)目,正在征集粉絲關(guān)心的問題。上次奧特曼出現(xiàn)在這檔播客中是一年前,GPT-4發(fā)布后不久。

1

也許Sora降世,真的已經(jīng)進(jìn)入最后的倒計(jì)時(shí)。

有些問題,穆拉蒂樂于回答。

在這次的專訪中,主持人拿出了幾個(gè)Sora生成的視頻,并對(duì)穆拉蒂進(jìn)行了提問。

一個(gè)不可忽略的問題是,Sora為什么效果那么好?對(duì)于一則“兩個(gè)職業(yè)女性,30多歲,坐在一個(gè)燈光明亮的工作室中接受新聞采訪”的指令,主持人嘗試了Sora和Runway兩個(gè)產(chǎn)品。Sora生成的視頻幾乎可以以假亂真,但Runway的視頻則不僅有奇怪且數(shù)量過多的手指,且在動(dòng)作時(shí)有明顯的嘴部扭曲,看起來頗為詭異。

穆拉蒂解釋,Sora基于擴(kuò)散模型,通過分析大量視頻學(xué)習(xí)識(shí)別物體和動(dòng)作。當(dāng)給定文本提示時(shí),Sora能通過定義時(shí)間線和逐幀添加細(xì)節(jié)來創(chuàng)建場(chǎng)景,生成的視頻在平滑度和現(xiàn)實(shí)感方面很出色。

但主持人也把一些有明顯瑕疵的視頻擺在穆拉蒂面前,比如行進(jìn)中的汽車突然從黃色變成了銀色,或者Sora沒有按照指令生成“機(jī)器人奪過攝像機(jī)”的畫面,而是讓機(jī)器人把那攝影機(jī)的女人直接融合了。

穆拉蒂表示,OpenAI目前正在探索如何使Sora成為可以用戶可以用來編輯或創(chuàng)作內(nèi)容的工具。翻譯一下就是:Sora不完美,在想辦法了。

對(duì)于另一個(gè)外界關(guān)心的問題,即Sora會(huì)不會(huì)包含音頻(Sora目前的視頻都是無聲的),穆拉蒂也透露了一些信息——目前還沒有整合音頻,但這是OpenAI會(huì)考慮的方向。

與此同時(shí),針對(duì)外界對(duì)安全的擔(dān)憂,穆拉蒂也沒有回避。

穆拉蒂表示,OpenAI目前還沒有明確決定Sora可以生成的視頻范疇,但是會(huì)借鑒其文生圖模型DALL-E的做法,比如不會(huì)生成政治人物的形象。當(dāng)主持人問及裸體畫面時(shí),穆拉蒂表示不確定,藝術(shù)家可能會(huì)希望有一些可以調(diào)控的創(chuàng)作選項(xiàng),目前OpenAI正在與不同領(lǐng)域的藝術(shù)家和創(chuàng)作者合作,試圖搞清楚Sora應(yīng)該提供什么水平的靈活度。

至于對(duì)于“現(xiàn)實(shí)不存在”的恐懼,即人們將難以區(qū)分真實(shí)與AI內(nèi)容,穆拉蒂回答這正是OpenAI還未部署Sora的原因。目前,Sora生成的視頻都會(huì)打上水印,但這似乎還不夠好。穆拉蒂透露,Sora的視頻將包含元數(shù)據(jù)來表明來源。OpenAI也用安全人員測(cè)試Sora,試圖引出漏洞、偏見及其他有害結(jié)果。

作為OpenAI的CTO,穆拉蒂強(qiáng)調(diào)對(duì)于安全問題的重視。她表示“金錢”和“安全”并不是一道難做的選擇題,如何解決安全和社會(huì)問題才是讓她睡不著覺的難題。

不過,也有穆拉蒂不太想觸碰的話題。

在外界都關(guān)心的訓(xùn)練數(shù)據(jù)來源問題上,不僅Sora團(tuán)隊(duì)接受專訪時(shí)表示不方便說得太細(xì),穆拉蒂也再一次打了太極。

主持人在測(cè)試Sora時(shí)發(fā)現(xiàn)了有趣的細(xì)節(jié)。比如在“海底珊瑚礁中,一只美人魚和一只螃蟹助手在一起評(píng)論一部智能手機(jī)”的視頻里,在沒有相關(guān)提示詞的情況下,螃蟹有長(zhǎng)條狀的雙眼和兩撮胡子,酷似動(dòng)畫片《海綿寶寶》里的蟹老板;另一則公牛在瓷器商店里的視頻,公牛的形象則也酷似《公牛歷險(xiǎn)記》里的。

1

問:有沒有用YouTube上的視頻?

穆拉蒂答:我其實(shí)不確定。

問:好吧。那Instagram和Facebook上的視頻呢?

穆拉蒂答:如果這些視頻是公開可用的,那可能在訓(xùn)練數(shù)據(jù)里。但我不確定。

總之,別問,問就是不知道、不明白、不清楚、不確定,問就是也許吧、可能是、看情況。

穆拉蒂倒是確認(rèn)了Sora的訓(xùn)練數(shù)據(jù)包含圖片網(wǎng)站Shutterstock的內(nèi)容。這沒什么意外的,去年7月,Shutterstock就宣布把和OpenAI的合作延長(zhǎng)六年,允許后者使用其平臺(tái)內(nèi)的圖片、視頻、音樂來訓(xùn)練AI模型。

這樣的回答難以令人滿意,網(wǎng)友截圖穆拉蒂在聽到問題時(shí)的表情,嘲諷她的“不確定”。

對(duì)于訓(xùn)練數(shù)據(jù)的來源問題,OpenAI保持謹(jǐn)慎在意料之中。

自ChatGPT面世,OpenAI已經(jīng)多次因訓(xùn)練數(shù)據(jù)版權(quán)問題惹上麻煩。最近的是今年《紐約時(shí)報(bào)》以侵犯版權(quán)為由起訴OpenAI及其合作伙伴微軟,隨后多家數(shù)字新聞媒體加入起訴OpenAI侵權(quán)的隊(duì)伍。此外,還有數(shù)名演員、記者、作家以及美國作家協(xié)會(huì)對(duì)OpenAI提出訴訟,稱該公司的大型語言模型參與了“大規(guī)模的系統(tǒng)盜竊”。

更糟糕的是,Sora還沒有面向公眾推出,就已經(jīng)被監(jiān)管機(jī)構(gòu)盯上。近日,意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)Garante發(fā)布公告,稱已對(duì)Sora展開調(diào)查,內(nèi)容包括Sora的算法訓(xùn)練方式、訓(xùn)練過程中手機(jī)和使用了哪些數(shù)據(jù)等。意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)是歐洲各國中最活躍的監(jiān)管機(jī)構(gòu)之一。

訓(xùn)練數(shù)據(jù)來源、安全問題都備受矚目,再加上2024年是美國大選之年,重重阻礙擺在Sora面前,OpenAI也著急。

一方面,OpenAI急于重申其在AIGC領(lǐng)域的領(lǐng)先地位。

就在3月初,硅谷AIGC獨(dú)角獸、OpenAI的勁敵Anthropic推出新一代大語言模型Claude 3系列。其中最智能的Opus已經(jīng)在多項(xiàng)基準(zhǔn)測(cè)試中打敗GPT-4。甚至在發(fā)布后不久,Claude 3已經(jīng)具備意識(shí)的傳聞就在網(wǎng)絡(luò)上蔓延。

也許是感覺到了壓力,OpenAI的GPT-4.5 Turbo產(chǎn)品頁面一度悄然出現(xiàn)在多個(gè)搜索引擎中,疑似要提前發(fā)布(原定今年6月)。雖然鏈接已經(jīng)在消息被傳出后下架,但奧特曼也在X社交平臺(tái)上回復(fù)一條催促OpenAI盡快發(fā)布新產(chǎn)品的消息下回復(fù):“耐心點(diǎn),這值得等待。”讓外界更加期待。

此外,微軟在3月13日宣布,將免費(fèi)版Copilot升級(jí)到GPT-4 Turbo模型。去年11月OpenAI宣布推出GPT-4 Turbo,微軟彼時(shí)將其接入Copilot,但僅供訂閱用戶使用,每月20美元。

若GPT-4.5 Turbo提前發(fā)布,Sora又在不久的將來與公眾見面,將成為OpenAI的完美組合拳。

另一方面,OpenAI也需要公眾注意力重新聚焦在其產(chǎn)品上。

過去的幾周,馬斯克起訴OpenAI,稱其違背了創(chuàng)始協(xié)議,并請(qǐng)求法院令其開源。一不做二不休,馬斯克甚至開源自家xAI公司的大模型產(chǎn)品Grok,再次將OpenAI推向不仁不義不Open的尷尬處境當(dāng)中。

OpenAI已經(jīng)對(duì)此事做了公開回應(yīng),并且提交了法律文件。此外,OpenAI還恰逢其時(shí)地公布了對(duì)于去年年底OpenAI“高層事變”的調(diào)查結(jié)果。

在那場(chǎng)高層震蕩中,奧特曼被踢出董事會(huì)并卸任CEO,又在三日內(nèi)歸來,幾乎重新組建了董事會(huì)。馬斯克在起訴書中將該事件描繪成了一場(chǎng)陰謀,稱奧特曼的新董事會(huì)缺乏專業(yè)背景,為了和微軟的合作關(guān)系永遠(yuǎn)不會(huì)宣布AGI(通用人工智能)的到來。

OpenAI給出的調(diào)查結(jié)果認(rèn)為事件只是出于舊董事會(huì)和奧特曼的信任問題,與此同時(shí)公司宣布四名新董事會(huì)成員。其中奧特曼再次進(jìn)入董事會(huì),其他新成員也不乏技術(shù)背景,間接駁斥了馬斯克在訴狀中的“陰謀論”。

OpenAI想要給去年的鬧劇蓋棺定論,但“OpenAI變CloseAI”的梗依然在網(wǎng)絡(luò)流傳,人們對(duì)該事件的關(guān)注猶在。

在Lex Fridman宣布將再度邀請(qǐng)奧特曼參加其播客節(jié)目的消息評(píng)論區(qū),粉絲最關(guān)心的問題依然是:曾被媒體報(bào)道為出于對(duì)AGI的恐懼而推動(dòng)“事變”的伊利亞·蘇茨克維(Ilya Sutskever)去哪兒了?他到底知道什么秘密?

1

也許當(dāng)用戶可以用Sora制作一部關(guān)于“事變”的“內(nèi)幕電影”時(shí),OpenAI就不用回答這個(gè)問題了。

編者按:本文轉(zhuǎn)載自微信公眾號(hào):字母榜(ID:wujicaijing),作者:畢安娣 

本文來源字母榜,內(nèi)容僅代表作者本人觀點(diǎn),不代表前瞻網(wǎng)的立場(chǎng)。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問題,請(qǐng)聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請(qǐng)聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p40 q0 我要投稿

分享:
標(biāo)簽: OpenAI Sora了

品牌、內(nèi)容合作請(qǐng)點(diǎn)這里:尋求合作 ››

前瞻經(jīng)濟(jì)學(xué)人

專注于中國各行業(yè)市場(chǎng)分析、未來發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫
企查貓
作者 字母榜
科技自媒體
506068
關(guān)注
1049
文章
前瞻經(jīng)濟(jì)學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟(jì)學(xué)家互動(dòng)交流讓您成為更懂趨勢(shì)的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟(jì)學(xué)人》APP提問

 
在線咨詢
×
在線咨詢

項(xiàng)目熱線 0755-33015070

AAPP
前瞻經(jīng)濟(jì)學(xué)人APP下載二維碼

下載前瞻經(jīng)濟(jì)學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號(hào)

掃一掃關(guān)注我們

我要投稿

×
J