報(bào)告服務(wù)熱線400-068-7188

說自己“?!痢?,GPT-4真不是王婆賣瓜

分享到:
20 字母榜 ? 2023-03-16 15:45:29  來源:字母榜 E2393G0

作者|畢安娣 來源|字母榜(ID:wujicaijing)

扔給聊天機(jī)器人一張圖表,它不但能看懂,還能給你如此這般做一番運(yùn)算,發(fā)來一段對圖表的解讀。

你不服氣,又扔過去一張無厘頭的梗圖,它不但能看懂這張圖里有車有人,還能告訴你之所以好笑是因?yàn)?ldquo;這個(gè)男人在出租車上面熨衣服”。

1

這不是暢想,而是OpenAI最新發(fā)布的大型多模態(tài)GPT-4已經(jīng)具備的能力。北京時(shí)間3月15日凌晨,OpenAI正式發(fā)布了該模型。

簡單來說,GPT-4與前代相比可以接受的文本輸入上限更高,回答的準(zhǔn)確性提高,能夠生成歌詞、創(chuàng)意文本等多樣化風(fēng)格的內(nèi)容。最最最令人振奮的是,GPT-4有強(qiáng)大的識圖能力,可以解讀圖片。

過去ChatGPT能做到的,新模型做得更好了;ChatGPT做不到的,新模型也可以做到了。

開通了ChatGPT Plus的付費(fèi)用戶已經(jīng)可以選擇GPT-4模型,其他用戶則可以加入候補(bǔ)名單等待。但目前Plus用戶只能使用文本輸入,讀圖的功能尚未全面開放。

外界用極大的熱情迎接了GPT-4。在消息公布之后,OpenAI官網(wǎng)一度發(fā)生擁堵,很多用戶在社交媒體表示這下秒開了Plus服務(wù)。“GPT-4”登上推特美國、日本等地區(qū)熱榜,也登上了國內(nèi)的微博熱搜榜、抖音熱榜社會榜等。

顛覆ChatGPT的,果然還是OpenAI自己。

GPT-4究竟有多厲害?

在官方演示視頻中,OpenAI總裁兼聯(lián)合創(chuàng)始人格雷格·布羅克曼(Greg Brockman)用筆和紙畫了個(gè)網(wǎng)站展示給GPT-4,后者僅用1到2秒的時(shí)間,就生成了網(wǎng)頁代碼、制作出了幾乎與圖中一模一樣的網(wǎng)站。

1

GPT-4可接受的文字輸入長度提升到了2.5萬個(gè)單詞,允許長內(nèi)容創(chuàng)建、擴(kuò)展對話以及文檔搜索和分析等。在高級推理能力上,GPT-4也有提升。它可以更準(zhǔn)確地解決難題,具有更廣泛的常識和解決問題的能力。

OpenAI表示,GPT-4在專業(yè)和學(xué)術(shù)方面表現(xiàn)出接近于人類的水平。其給出的例子稱,在模擬律師考試中,GPT-4的得分能排進(jìn)前10%左右,而GPT-3.5的得分只能排在倒數(shù)10%左右。

而且GPT-4不僅是能對文本或圖片進(jìn)行單獨(dú)的識別,而是可以接受圖文混排的內(nèi)容。

“請記住,GPT-4不僅僅是一個(gè)語言模型,它還是視覺模型。實(shí)際上,它可以靈活地接受如文檔中那樣任意散布的圖像和文本。”演示視頻中出現(xiàn)包含各種圖片和文字的電腦屏幕截圖時(shí),格雷格如是強(qiáng)調(diào)。

在OpenAI官方介紹顯示,GPT-4可以對插入了多個(gè)圖表的論文進(jìn)行解讀,并用精煉的語言總結(jié)論文的內(nèi)容。

OpenAI表示,公司花了6個(gè)月的時(shí)間,利用ChatGPT的經(jīng)驗(yàn)教訓(xùn)以及對抗性測試調(diào)整GPT-4,使其在真實(shí)性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來最好的結(jié)果。

“至少對我們來說,GPT-4訓(xùn)練運(yùn)行前所未有的穩(wěn)定,成為首個(gè)能夠提前準(zhǔn)確預(yù)測其訓(xùn)練性能的大型模型。”

但OpenAI也表示,GPT-4并非完美,仍然不能完全摒除人工智能的“幻覺”,而且訓(xùn)練數(shù)據(jù)的時(shí)間依舊停留在2021年9月,可能會出現(xiàn)推理錯誤:“有時(shí)會出現(xiàn)簡單的推理錯誤,會輕信用戶的虛假陳述,會像人類一樣解答不了難題。”

值得一提的是,GPT-4在不同語種上的能力表現(xiàn)也大幅提升。

過去使用基于GPT-3.5的ChatGPT時(shí),要特別注意中文的表達(dá)規(guī)范、流暢,即便如此它依然會時(shí)不時(shí)地突然用英文作答,好像一著急就要“蹦母語”。

根據(jù)OpenAI的技術(shù)報(bào)告,GPT-4的中文準(zhǔn)確度已經(jīng)達(dá)到了80.1%,這個(gè)數(shù)字比GPT-3.5的英文表現(xiàn)還要好,后者只有70.1%。

為了看看GPT-4的中文能力究竟如何,字母榜(ID:wujicaijing)也簡單地問了幾個(gè)問題。

我們先將一段報(bào)道GPT-4推出的英文發(fā)給ChatGPT,要其翻譯。這部分GPT-3.5和GPT-4的整體區(qū)別存在但是不明顯。如GPT-4翻譯為“人工智能驅(qū)動的法語或西班牙語的對話”,GPT-3.5翻譯成了“法語或西班牙語的AI驅(qū)動對話”。

當(dāng)我們進(jìn)一步提出要求時(shí),新模型的表現(xiàn)開始明顯好于前代。比如“給年輕的朋友轉(zhuǎn)述這個(gè)消息”,GPT-4的回答很本土化:“嘿,哥們”“得告訴你個(gè)牛X的事兒”“這貨還能識別圖片”。

再讓它針對老年朋友編輯個(gè)信息,它的回答則有那種正經(jīng)的味道,如“親愛的朋友”“告訴你個(gè)好消息”“感嘆時(shí)光荏苒啊”。

反觀GPT-3.5,回答得就略顯生硬了,雖然也努力地加入了語氣詞等,但是整體文本還是欠缺重新梳理,依舊是對原文本的簡單復(fù)制。

當(dāng)我們讓GPT-4模仿莎士比亞轉(zhuǎn)達(dá)這個(gè)消息時(shí),其回答頗為驚艷:“哉!眾生皆驚,乃OpenAI新奇之作——GPT-4誕生矣!其智慧之光,如同破曉之陽,識圖問答皆無往不利……”但GPT-3.5則顯示發(fā)來一大段英文,當(dāng)我們要求用中文時(shí),文本不能說和莎翁有什么關(guān)系,最多是有點(diǎn)譯制片腔調(diào):“哦!快來聽聽這個(gè)消息……”

接下來,是社交媒體文案比拼。我們讓ChatGPT將之前的消息壓縮為100字左右的小紅書文案,GPT-4直接給出了完整的標(biāo)題、文案甚至是話題標(biāo)簽。而且文本中插入了很多小紅書常見的emoji表情,達(dá)到了可以直接拿來用的程度。

GPT-3.5雖然也知道小紅書的風(fēng)格是更親和的,但是文本簡潔度明顯差很多,也不懂得emoji的奧妙。

我們還讓CgatGPT為一款游戲手機(jī)的新顏色起名字,GPT-3.5給出的10個(gè)名字中,只有1個(gè)不帶“綠”字,如翡翠光芒綠、草原之綠、碧海琉璃綠,和游戲的聯(lián)系也不緊密。GPT-4給出的名字則可以直接取用:極速碧輝、虛擬翠穹、綠焰戰(zhàn)魂、綠光戰(zhàn)神。

為結(jié)束這段小小的測試,我們假設(shè)李白穿越到現(xiàn)代,并和ChatGPT進(jìn)行了一場對話,讓它以李白的角色作一首詩:

仙人撫我頂,托我躍千年。一覺醒來世事變,靈犀探盡塵間塵。玉宇瓊樓矗立地,鐵馬火車踏空間。時(shí)光如夢,逐浪逝,李白驚嘆人間情。

這“仙人撫我頂,托我躍千年”可比GPT-3.5開頭給出的“深閨無物我獨(dú)來,相見ChatGPT意外來”頂多了。

去年11月30日,ChatGPT上線得靜悄悄,OpenAI的官方推特賬號發(fā)布了一篇文章,宣布產(chǎn)品發(fā)布的好消息。

1

短短不到三個(gè)月之后,當(dāng)OpenAI發(fā)布新一代大型多模態(tài)模型GPT-4時(shí),情況大有不同:

OpenAI在推特、YouTube等平臺發(fā)布了宣傳短視頻、產(chǎn)品介紹短視頻,還由公司總裁兼聯(lián)合創(chuàng)始人格雷格親自進(jìn)行了長達(dá)近半小時(shí)的直播。

除此之外,OpenAI還在官網(wǎng)發(fā)布了長達(dá)98頁的技術(shù)報(bào)告,并同步開放了GPT-4的API(應(yīng)用程序編程接口)以幫助開發(fā)人員構(gòu)建應(yīng)用和服務(wù)。

GPT-4讓OpenAI的商業(yè)前景廣闊了起來。在針對C端每月20美元的訂閱使用以外,外部合作也有更多可能性。

已經(jīng)有多個(gè)合作伙伴接入了GPT-4。微軟確認(rèn)了必應(yīng)的聊天機(jī)器人使用的正是GPT-4:“如果您在過去五周內(nèi)的任何時(shí)間使用過新版必應(yīng),那么您已經(jīng)體驗(yàn)過GPT-4的早期版本。”

語言學(xué)習(xí)軟件多鄰國(Duolinguo)宣布將在其付費(fèi)訂閱MAX版本中,為學(xué)習(xí)者提供AI驅(qū)動的新功能。比如學(xué)習(xí)者可以和軟件中的“世界人物”進(jìn)行角色扮演,練習(xí)對話技巧。AI會在對話后給出反饋,告訴學(xué)習(xí)者其回答的準(zhǔn)確性和復(fù)雜性如何,還會對未來的對話予以提示。

另一款產(chǎn)品BeMyEyes也將搭載GPT-4,而且側(cè)重的是其圖像識別和解讀的能力。BeMyEyes不是一款新應(yīng)用,它推出于2015年,為視障人士服務(wù):沒有視力障礙的人可以申請成為平臺志愿者,接聽視障人士的視頻通話,通過攝像頭遠(yuǎn)程幫助視障人士識別物品、閱讀文本等。這款應(yīng)用在中國也有使用者,小紅書、豆瓣等平臺都有相關(guān)討論。

可以想見,有了GPT-4的讀圖能力,視障人士有望在平臺獲得更及時(shí)、私密的幫助。

對于其他想要合作的開發(fā)者,需要進(jìn)入GPT-4的API接口申請頁面,填寫姓名、郵件、公司組織編號以及使用計(jì)劃等問題。

已經(jīng)有公司迫不及待。

人工智能公司DoNotPay的CEO喬舒亞(Joshua Browder)在推特上表示,正在致力于用GPT-4打擊騷擾電話,將其稱為“一鍵訴訟”。針對騷擾電話和自動撥號軟件起草起訴書,要求對方賠償1500美元:“想象一下,你接了個(gè)電話,按了一個(gè)鍵,然后1000詞的起訴書就寫好了。”

1

此前,這家公司基于包括ChatGPT和Davinci在內(nèi)的文本生成器,訓(xùn)練和開發(fā)了“全球第一個(gè)AI律師”。本來有計(jì)劃今年2月在美國出庭辯護(hù),卻因爭議不得不擱置。

有人興奮,有人發(fā)愁。谷歌此前以聊天機(jī)器人巴德(Bard)迎戰(zhàn)與ChatGPT深度合作的微軟,但還沒對外公開發(fā)布產(chǎn)品,就因?yàn)檠菔卷撁嬷械腻e誤一夜蒸發(fā)千億市值。

而就在GPT-4發(fā)布之前,谷歌才宣布了一個(gè)新消息,稱將推出一系列AIGC(人工智能生成內(nèi)容)的功能,將AI應(yīng)用到包括谷歌文檔(Docs)、郵箱(Gmail)等的生產(chǎn)力工具當(dāng)中,并于月底提供給“可信賴的開發(fā)人員”。然而這個(gè)消息還沒掀起多大波浪,就被GPT-4的出世沖淡了。

另一邊,在國內(nèi),百度也將于3月16日舉行文心一言發(fā)布會。這是百度備受矚目的大語言模型產(chǎn)品。轉(zhuǎn)眼間,扳手腕的對象從GPT-3.5升級成了GPT-4,實(shí)在不算是個(gè)好消息。

對于ChatGPT和微軟的競爭對手來說,GPT-4再一次搶了先機(jī)。對于你我來說,究竟是應(yīng)當(dāng)興奮于科技的發(fā)展,還是恐懼于被替代,不妨先讓子彈飛一會兒。

編者按:本文轉(zhuǎn)載自微信公眾號:字母榜(ID:wujicaijing),作者:畢安娣 

本文來源字母榜,內(nèi)容僅代表作者本人觀點(diǎn),不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p31 q0 我要投稿

分享:
標(biāo)簽: GPT-4 人工智能

品牌、內(nèi)容合作請點(diǎn)這里:尋求合作 ››

前瞻經(jīng)濟(jì)學(xué)人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫
企查貓
作者 字母榜
科技自媒體
432793
關(guān)注
986
文章
前瞻經(jīng)濟(jì)學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟(jì)學(xué)家互動交流讓您成為更懂趨勢的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟(jì)學(xué)人》APP提問

 
在線咨詢
×
在線咨詢

項(xiàng)目熱線 0755-33015070

AAPP
前瞻經(jīng)濟(jì)學(xué)人APP下載二維碼

下載前瞻經(jīng)濟(jì)學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號

掃一掃關(guān)注我們

我要投稿

×
J