報告服務熱線400-068-7188

說自己“?!痢保珿PT-4真不是王婆賣瓜

分享到:
20 字母榜 ? 2023-03-16 15:45:29  來源:字母榜 E2425G0

作者|畢安娣 來源|字母榜(ID:wujicaijing)

扔給聊天機器人一張圖表,它不但能看懂,還能給你如此這般做一番運算,發(fā)來一段對圖表的解讀。

你不服氣,又扔過去一張無厘頭的梗圖,它不但能看懂這張圖里有車有人,還能告訴你之所以好笑是因為“這個男人在出租車上面熨衣服”。

1

這不是暢想,而是OpenAI最新發(fā)布的大型多模態(tài)GPT-4已經(jīng)具備的能力。北京時間3月15日凌晨,OpenAI正式發(fā)布了該模型。

簡單來說,GPT-4與前代相比可以接受的文本輸入上限更高,回答的準確性提高,能夠生成歌詞、創(chuàng)意文本等多樣化風格的內容。最最最令人振奮的是,GPT-4有強大的識圖能力,可以解讀圖片。

過去ChatGPT能做到的,新模型做得更好了;ChatGPT做不到的,新模型也可以做到了。

開通了ChatGPT Plus的付費用戶已經(jīng)可以選擇GPT-4模型,其他用戶則可以加入候補名單等待。但目前Plus用戶只能使用文本輸入,讀圖的功能尚未全面開放。

外界用極大的熱情迎接了GPT-4。在消息公布之后,OpenAI官網(wǎng)一度發(fā)生擁堵,很多用戶在社交媒體表示這下秒開了Plus服務。“GPT-4”登上推特美國、日本等地區(qū)熱榜,也登上了國內的微博熱搜榜、抖音熱榜社會榜等。

顛覆ChatGPT的,果然還是OpenAI自己。

GPT-4究竟有多厲害?

在官方演示視頻中,OpenAI總裁兼聯(lián)合創(chuàng)始人格雷格·布羅克曼(Greg Brockman)用筆和紙畫了個網(wǎng)站展示給GPT-4,后者僅用1到2秒的時間,就生成了網(wǎng)頁代碼、制作出了幾乎與圖中一模一樣的網(wǎng)站。

1

GPT-4可接受的文字輸入長度提升到了2.5萬個單詞,允許長內容創(chuàng)建、擴展對話以及文檔搜索和分析等。在高級推理能力上,GPT-4也有提升。它可以更準確地解決難題,具有更廣泛的常識和解決問題的能力。

OpenAI表示,GPT-4在專業(yè)和學術方面表現(xiàn)出接近于人類的水平。其給出的例子稱,在模擬律師考試中,GPT-4的得分能排進前10%左右,而GPT-3.5的得分只能排在倒數(shù)10%左右。

而且GPT-4不僅是能對文本或圖片進行單獨的識別,而是可以接受圖文混排的內容。

“請記住,GPT-4不僅僅是一個語言模型,它還是視覺模型。實際上,它可以靈活地接受如文檔中那樣任意散布的圖像和文本。”演示視頻中出現(xiàn)包含各種圖片和文字的電腦屏幕截圖時,格雷格如是強調。

在OpenAI官方介紹顯示,GPT-4可以對插入了多個圖表的論文進行解讀,并用精煉的語言總結論文的內容。

OpenAI表示,公司花了6個月的時間,利用ChatGPT的經(jīng)驗教訓以及對抗性測試調整GPT-4,使其在真實性、可操縱性和拒絕超出設定范圍方面取得了有史以來最好的結果。

“至少對我們來說,GPT-4訓練運行前所未有的穩(wěn)定,成為首個能夠提前準確預測其訓練性能的大型模型。”

但OpenAI也表示,GPT-4并非完美,仍然不能完全摒除人工智能的“幻覺”,而且訓練數(shù)據(jù)的時間依舊停留在2021年9月,可能會出現(xiàn)推理錯誤:“有時會出現(xiàn)簡單的推理錯誤,會輕信用戶的虛假陳述,會像人類一樣解答不了難題。”

值得一提的是,GPT-4在不同語種上的能力表現(xiàn)也大幅提升。

過去使用基于GPT-3.5的ChatGPT時,要特別注意中文的表達規(guī)范、流暢,即便如此它依然會時不時地突然用英文作答,好像一著急就要“蹦母語”。

根據(jù)OpenAI的技術報告,GPT-4的中文準確度已經(jīng)達到了80.1%,這個數(shù)字比GPT-3.5的英文表現(xiàn)還要好,后者只有70.1%。

為了看看GPT-4的中文能力究竟如何,字母榜(ID:wujicaijing)也簡單地問了幾個問題。

我們先將一段報道GPT-4推出的英文發(fā)給ChatGPT,要其翻譯。這部分GPT-3.5和GPT-4的整體區(qū)別存在但是不明顯。如GPT-4翻譯為“人工智能驅動的法語或西班牙語的對話”,GPT-3.5翻譯成了“法語或西班牙語的AI驅動對話”。

當我們進一步提出要求時,新模型的表現(xiàn)開始明顯好于前代。比如“給年輕的朋友轉述這個消息”,GPT-4的回答很本土化:“嘿,哥們”“得告訴你個牛X的事兒”“這貨還能識別圖片”。

再讓它針對老年朋友編輯個信息,它的回答則有那種正經(jīng)的味道,如“親愛的朋友”“告訴你個好消息”“感嘆時光荏苒啊”。

反觀GPT-3.5,回答得就略顯生硬了,雖然也努力地加入了語氣詞等,但是整體文本還是欠缺重新梳理,依舊是對原文本的簡單復制。

當我們讓GPT-4模仿莎士比亞轉達這個消息時,其回答頗為驚艷:“哉!眾生皆驚,乃OpenAI新奇之作——GPT-4誕生矣!其智慧之光,如同破曉之陽,識圖問答皆無往不利……”但GPT-3.5則顯示發(fā)來一大段英文,當我們要求用中文時,文本不能說和莎翁有什么關系,最多是有點譯制片腔調:“哦!快來聽聽這個消息……”

接下來,是社交媒體文案比拼。我們讓ChatGPT將之前的消息壓縮為100字左右的小紅書文案,GPT-4直接給出了完整的標題、文案甚至是話題標簽。而且文本中插入了很多小紅書常見的emoji表情,達到了可以直接拿來用的程度。

GPT-3.5雖然也知道小紅書的風格是更親和的,但是文本簡潔度明顯差很多,也不懂得emoji的奧妙。

我們還讓CgatGPT為一款游戲手機的新顏色起名字,GPT-3.5給出的10個名字中,只有1個不帶“綠”字,如翡翠光芒綠、草原之綠、碧海琉璃綠,和游戲的聯(lián)系也不緊密。GPT-4給出的名字則可以直接取用:極速碧輝、虛擬翠穹、綠焰戰(zhàn)魂、綠光戰(zhàn)神。

為結束這段小小的測試,我們假設李白穿越到現(xiàn)代,并和ChatGPT進行了一場對話,讓它以李白的角色作一首詩:

仙人撫我頂,托我躍千年。一覺醒來世事變,靈犀探盡塵間塵。玉宇瓊樓矗立地,鐵馬火車踏空間。時光如夢,逐浪逝,李白驚嘆人間情。

這“仙人撫我頂,托我躍千年”可比GPT-3.5開頭給出的“深閨無物我獨來,相見ChatGPT意外來”頂多了。

去年11月30日,ChatGPT上線得靜悄悄,OpenAI的官方推特賬號發(fā)布了一篇文章,宣布產(chǎn)品發(fā)布的好消息。

1

短短不到三個月之后,當OpenAI發(fā)布新一代大型多模態(tài)模型GPT-4時,情況大有不同:

OpenAI在推特、YouTube等平臺發(fā)布了宣傳短視頻、產(chǎn)品介紹短視頻,還由公司總裁兼聯(lián)合創(chuàng)始人格雷格親自進行了長達近半小時的直播。

除此之外,OpenAI還在官網(wǎng)發(fā)布了長達98頁的技術報告,并同步開放了GPT-4的API(應用程序編程接口)以幫助開發(fā)人員構建應用和服務。

GPT-4讓OpenAI的商業(yè)前景廣闊了起來。在針對C端每月20美元的訂閱使用以外,外部合作也有更多可能性。

已經(jīng)有多個合作伙伴接入了GPT-4。微軟確認了必應的聊天機器人使用的正是GPT-4:“如果您在過去五周內的任何時間使用過新版必應,那么您已經(jīng)體驗過GPT-4的早期版本。”

語言學習軟件多鄰國(Duolinguo)宣布將在其付費訂閱MAX版本中,為學習者提供AI驅動的新功能。比如學習者可以和軟件中的“世界人物”進行角色扮演,練習對話技巧。AI會在對話后給出反饋,告訴學習者其回答的準確性和復雜性如何,還會對未來的對話予以提示。

另一款產(chǎn)品BeMyEyes也將搭載GPT-4,而且側重的是其圖像識別和解讀的能力。BeMyEyes不是一款新應用,它推出于2015年,為視障人士服務:沒有視力障礙的人可以申請成為平臺志愿者,接聽視障人士的視頻通話,通過攝像頭遠程幫助視障人士識別物品、閱讀文本等。這款應用在中國也有使用者,小紅書、豆瓣等平臺都有相關討論。

可以想見,有了GPT-4的讀圖能力,視障人士有望在平臺獲得更及時、私密的幫助。

對于其他想要合作的開發(fā)者,需要進入GPT-4的API接口申請頁面,填寫姓名、郵件、公司組織編號以及使用計劃等問題。

已經(jīng)有公司迫不及待。

人工智能公司DoNotPay的CEO喬舒亞(Joshua Browder)在推特上表示,正在致力于用GPT-4打擊騷擾電話,將其稱為“一鍵訴訟”。針對騷擾電話和自動撥號軟件起草起訴書,要求對方賠償1500美元:“想象一下,你接了個電話,按了一個鍵,然后1000詞的起訴書就寫好了。”

1

此前,這家公司基于包括ChatGPT和Davinci在內的文本生成器,訓練和開發(fā)了“全球第一個AI律師”。本來有計劃今年2月在美國出庭辯護,卻因爭議不得不擱置。

有人興奮,有人發(fā)愁。谷歌此前以聊天機器人巴德(Bard)迎戰(zhàn)與ChatGPT深度合作的微軟,但還沒對外公開發(fā)布產(chǎn)品,就因為演示頁面中的錯誤一夜蒸發(fā)千億市值。

而就在GPT-4發(fā)布之前,谷歌才宣布了一個新消息,稱將推出一系列AIGC(人工智能生成內容)的功能,將AI應用到包括谷歌文檔(Docs)、郵箱(Gmail)等的生產(chǎn)力工具當中,并于月底提供給“可信賴的開發(fā)人員”。然而這個消息還沒掀起多大波浪,就被GPT-4的出世沖淡了。

另一邊,在國內,百度也將于3月16日舉行文心一言發(fā)布會。這是百度備受矚目的大語言模型產(chǎn)品。轉眼間,扳手腕的對象從GPT-3.5升級成了GPT-4,實在不算是個好消息。

對于ChatGPT和微軟的競爭對手來說,GPT-4再一次搶了先機。對于你我來說,究竟是應當興奮于科技的發(fā)展,還是恐懼于被替代,不妨先讓子彈飛一會兒。

編者按:本文轉載自微信公眾號:字母榜(ID:wujicaijing),作者:畢安娣 

本文來源字母榜,內容僅代表作者本人觀點,不代表前瞻網(wǎng)的立場。本站只提供參考并不構成任何投資及應用建議。(若存在內容、版權或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p31 q0 我要投稿

分享:

品牌、內容合作請點這里:尋求合作 ››

前瞻經(jīng)濟學人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領導者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領域解決方案,掃一掃關注。

前瞻數(shù)據(jù)庫
企查貓
作者 字母榜
科技自媒體
480962
關注
1028
文章
12
前瞻經(jīng)濟學人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟學家互動交流讓您成為更懂趨勢的人

研究員周關注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟學人》APP提問

 
在線咨詢
×
在線咨詢

項目熱線 0755-33015070

AAPP
前瞻經(jīng)濟學人APP下載二維碼

下載前瞻經(jīng)濟學人APP

關注我們
前瞻產(chǎn)業(yè)研究院微信號

掃一掃關注我們

我要投稿

×
J