當(dāng)前位置：前瞻產(chǎn)業(yè)研究院 ? 經(jīng)濟(jì)學(xué)人 ? 觀察家專欄

說自己“牛×”，GPT-4真不是王婆賣瓜

分享到：

字母榜 ? 2023-03-16 15:45:29 　來源：字母榜　E2436G0

作者|畢安娣來源|字母榜(ID：wujicaijing)

扔給聊天機器人一張圖表，它不但能看懂，還能給你如此這般做一番運算，發(fā)來一段對圖表的解讀。

你不服氣，又扔過去一張無厘頭的梗圖，它不但能看懂這張圖里有車有人，還能告訴你之所以好笑是因為“這個男人在出租車上面熨衣服”。

這不是暢想，而是OpenAI最新發(fā)布的大型多模態(tài)GPT-4已經(jīng)具備的能力。北京時間3月15日凌晨，OpenAI正式發(fā)布了該模型。

簡單來說，GPT-4與前代相比可以接受的文本輸入上限更高，回答的準(zhǔn)確性提高，能夠生成歌詞、創(chuàng)意文本等多樣化風(fēng)格的內(nèi)容。最最最令人振奮的是，GPT-4有強大的識圖能力，可以解讀圖片。

過去ChatGPT能做到的，新模型做得更好了；ChatGPT做不到的，新模型也可以做到了。

開通了ChatGPT Plus的付費用戶已經(jīng)可以選擇GPT-4模型，其他用戶則可以加入候補名單等待。但目前Plus用戶只能使用文本輸入，讀圖的功能尚未全面開放。

外界用極大的熱情迎接了GPT-4。在消息公布之后，OpenAI官網(wǎng)一度發(fā)生擁堵，很多用戶在社交媒體表示這下秒開了Plus服務(wù)。“GPT-4”登上推特美國、日本等地區(qū)熱榜，也登上了國內(nèi)的微博熱搜榜、抖音熱榜社會榜等。

顛覆ChatGPT的，果然還是OpenAI自己。

一

GPT-4究竟有多厲害？

在官方演示視頻中，OpenAI總裁兼聯(lián)合創(chuàng)始人格雷格·布羅克曼（Greg Brockman）用筆和紙畫了個網(wǎng)站展示給GPT-4，后者僅用1到2秒的時間，就生成了網(wǎng)頁代碼、制作出了幾乎與圖中一模一樣的網(wǎng)站。

GPT-4可接受的文字輸入長度提升到了2.5萬個單詞，允許長內(nèi)容創(chuàng)建、擴(kuò)展對話以及文檔搜索和分析等。在高級推理能力上，GPT-4也有提升。它可以更準(zhǔn)確地解決難題，具有更廣泛的常識和解決問題的能力。

OpenAI表示，GPT-4在專業(yè)和學(xué)術(shù)方面表現(xiàn)出接近于人類的水平。其給出的例子稱，在模擬律師考試中，GPT-4的得分能排進(jìn)前10%左右，而GPT-3.5的得分只能排在倒數(shù)10%左右。

而且GPT-4不僅是能對文本或圖片進(jìn)行單獨的識別，而是可以接受圖文混排的內(nèi)容。

“請記住，GPT-4不僅僅是一個語言模型，它還是視覺模型。實際上，它可以靈活地接受如文檔中那樣任意散布的圖像和文本。”演示視頻中出現(xiàn)包含各種圖片和文字的電腦屏幕截圖時，格雷格如是強調(diào)。

在OpenAI官方介紹顯示，GPT-4可以對插入了多個圖表的論文進(jìn)行解讀，并用精煉的語言總結(jié)論文的內(nèi)容。

OpenAI表示，公司花了6個月的時間，利用ChatGPT的經(jīng)驗教訓(xùn)以及對抗性測試調(diào)整GPT-4，使其在真實性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來最好的結(jié)果。

“至少對我們來說，GPT-4訓(xùn)練運行前所未有的穩(wěn)定，成為首個能夠提前準(zhǔn)確預(yù)測其訓(xùn)練性能的大型模型。”

但OpenAI也表示，GPT-4并非完美，仍然不能完全摒除人工智能的“幻覺”，而且訓(xùn)練數(shù)據(jù)的時間依舊停留在2021年9月，可能會出現(xiàn)推理錯誤：“有時會出現(xiàn)簡單的推理錯誤，會輕信用戶的虛假陳述，會像人類一樣解答不了難題。”

二

值得一提的是，GPT-4在不同語種上的能力表現(xiàn)也大幅提升。

過去使用基于GPT-3.5的ChatGPT時，要特別注意中文的表達(dá)規(guī)范、流暢，即便如此它依然會時不時地突然用英文作答，好像一著急就要“蹦母語”。

根據(jù)OpenAI的技術(shù)報告，GPT-4的中文準(zhǔn)確度已經(jīng)達(dá)到了80.1%，這個數(shù)字比GPT-3.5的英文表現(xiàn)還要好，后者只有70.1%。

為了看看GPT-4的中文能力究竟如何，字母榜(ID:wujicaijing)也簡單地問了幾個問題。

我們先將一段報道GPT-4推出的英文發(fā)給ChatGPT，要其翻譯。這部分GPT-3.5和GPT-4的整體區(qū)別存在但是不明顯。如GPT-4翻譯為“人工智能驅(qū)動的法語或西班牙語的對話”，GPT-3.5翻譯成了“法語或西班牙語的AI驅(qū)動對話”。

當(dāng)我們進(jìn)一步提出要求時，新模型的表現(xiàn)開始明顯好于前代。比如“給年輕的朋友轉(zhuǎn)述這個消息”，GPT-4的回答很本土化：“嘿，哥們”“得告訴你個牛X的事兒”“這貨還能識別圖片”。

再讓它針對老年朋友編輯個信息，它的回答則有那種正經(jīng)的味道，如“親愛的朋友”“告訴你個好消息”“感嘆時光荏苒啊”。

反觀GPT-3.5，回答得就略顯生硬了，雖然也努力地加入了語氣詞等，但是整體文本還是欠缺重新梳理，依舊是對原文本的簡單復(fù)制。

當(dāng)我們讓GPT-4模仿莎士比亞轉(zhuǎn)達(dá)這個消息時，其回答頗為驚艷：“哉！眾生皆驚，乃OpenAI新奇之作——GPT-4誕生矣！其智慧之光，如同破曉之陽，識圖問答皆無往不利……”但GPT-3.5則顯示發(fā)來一大段英文，當(dāng)我們要求用中文時，文本不能說和莎翁有什么關(guān)系，最多是有點譯制片腔調(diào)：“哦！快來聽聽這個消息……”

接下來，是社交媒體文案比拼。我們讓ChatGPT將之前的消息壓縮為100字左右的小紅書文案，GPT-4直接給出了完整的標(biāo)題、文案甚至是話題標(biāo)簽。而且文本中插入了很多小紅書常見的emoji表情，達(dá)到了可以直接拿來用的程度。

GPT-3.5雖然也知道小紅書的風(fēng)格是更親和的，但是文本簡潔度明顯差很多，也不懂得emoji的奧妙。

我們還讓CgatGPT為一款游戲手機的新顏色起名字，GPT-3.5給出的10個名字中，只有1個不帶“綠”字，如翡翠光芒綠、草原之綠、碧海琉璃綠，和游戲的聯(lián)系也不緊密。GPT-4給出的名字則可以直接取用：極速碧輝、虛擬翠穹、綠焰戰(zhàn)魂、綠光戰(zhàn)神。

為結(jié)束這段小小的測試，我們假設(shè)李白穿越到現(xiàn)代，并和ChatGPT進(jìn)行了一場對話，讓它以李白的角色作一首詩：

仙人撫我頂，托我躍千年。一覺醒來世事變，靈犀探盡塵間塵。玉宇瓊樓矗立地，鐵馬火車踏空間。時光如夢，逐浪逝，李白驚嘆人間情。

這“仙人撫我頂，托我躍千年”可比GPT-3.5開頭給出的“深閨無物我獨來，相見ChatGPT意外來”頂多了。

三

去年11月30日，ChatGPT上線得靜悄悄，OpenAI的官方推特賬號發(fā)布了一篇文章，宣布產(chǎn)品發(fā)布的好消息。

短短不到三個月之后，當(dāng)OpenAI發(fā)布新一代大型多模態(tài)模型GPT-4時，情況大有不同：

OpenAI在推特、YouTube等平臺發(fā)布了宣傳短視頻、產(chǎn)品介紹短視頻，還由公司總裁兼聯(lián)合創(chuàng)始人格雷格親自進(jìn)行了長達(dá)近半小時的直播。

除此之外，OpenAI還在官網(wǎng)發(fā)布了長達(dá)98頁的技術(shù)報告，并同步開放了GPT-4的API（應(yīng)用程序編程接口）以幫助開發(fā)人員構(gòu)建應(yīng)用和服務(wù)。

GPT-4讓OpenAI的商業(yè)前景廣闊了起來。在針對C端每月20美元的訂閱使用以外，外部合作也有更多可能性。

已經(jīng)有多個合作伙伴接入了GPT-4。微軟確認(rèn)了必應(yīng)的聊天機器人使用的正是GPT-4：“如果您在過去五周內(nèi)的任何時間使用過新版必應(yīng)，那么您已經(jīng)體驗過GPT-4的早期版本。”

語言學(xué)習(xí)軟件多鄰國（Duolinguo）宣布將在其付費訂閱MAX版本中，為學(xué)習(xí)者提供AI驅(qū)動的新功能。比如學(xué)習(xí)者可以和軟件中的“世界人物”進(jìn)行角色扮演，練習(xí)對話技巧。AI會在對話后給出反饋，告訴學(xué)習(xí)者其回答的準(zhǔn)確性和復(fù)雜性如何，還會對未來的對話予以提示。

另一款產(chǎn)品BeMyEyes也將搭載GPT-4，而且側(cè)重的是其圖像識別和解讀的能力。BeMyEyes不是一款新應(yīng)用，它推出于2015年，為視障人士服務(wù)：沒有視力障礙的人可以申請成為平臺志愿者，接聽視障人士的視頻通話，通過攝像頭遠(yuǎn)程幫助視障人士識別物品、閱讀文本等。這款應(yīng)用在中國也有使用者，小紅書、豆瓣等平臺都有相關(guān)討論。

可以想見，有了GPT-4的讀圖能力，視障人士有望在平臺獲得更及時、私密的幫助。

對于其他想要合作的開發(fā)者，需要進(jìn)入GPT-4的API接口申請頁面，填寫姓名、郵件、公司組織編號以及使用計劃等問題。

已經(jīng)有公司迫不及待。

人工智能公司DoNotPay的CEO喬舒亞（Joshua Browder）在推特上表示，正在致力于用GPT-4打擊騷擾電話，將其稱為“一鍵訴訟”。針對騷擾電話和自動撥號軟件起草起訴書，要求對方賠償1500美元：“想象一下，你接了個電話，按了一個鍵，然后1000詞的起訴書就寫好了。”

此前，這家公司基于包括ChatGPT和Davinci在內(nèi)的文本生成器，訓(xùn)練和開發(fā)了“全球第一個AI律師”。本來有計劃今年2月在美國出庭辯護(hù)，卻因爭議不得不擱置。

有人興奮，有人發(fā)愁。谷歌此前以聊天機器人巴德（Bard）迎戰(zhàn)與ChatGPT深度合作的微軟，但還沒對外公開發(fā)布產(chǎn)品，就因為演示頁面中的錯誤一夜蒸發(fā)千億市值。

而就在GPT-4發(fā)布之前，谷歌才宣布了一個新消息，稱將推出一系列AIGC（人工智能生成內(nèi)容）的功能，將AI應(yīng)用到包括谷歌文檔（Docs）、郵箱（Gmail）等的生產(chǎn)力工具當(dāng)中，并于月底提供給“可信賴的開發(fā)人員”。然而這個消息還沒掀起多大波浪，就被GPT-4的出世沖淡了。

另一邊，在國內(nèi)，百度也將于3月16日舉行文心一言發(fā)布會。這是百度備受矚目的大語言模型產(chǎn)品。轉(zhuǎn)眼間，扳手腕的對象從GPT-3.5升級成了GPT-4，實在不算是個好消息。

對于ChatGPT和微軟的競爭對手來說，GPT-4再一次搶了先機。對于你我來說，究竟是應(yīng)當(dāng)興奮于科技的發(fā)展，還是恐懼于被替代，不妨先讓子彈飛一會兒。

編者按：本文轉(zhuǎn)載自微信公眾號：字母榜(ID：wujicaijing)，作者：畢安娣

本文來源字母榜，內(nèi)容僅代表作者本人觀點，不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。（若存在內(nèi)容、版權(quán)或其它問題，請聯(lián)系：service@qianzhan.com）　品牌合作與廣告投放請聯(lián)系：0755-33015062 或 hezuo@qianzhan.com

p31 q0 我要投稿

標(biāo)簽： GPT-4 人工智能

品牌、內(nèi)容合作請點這里：尋求合作 ››

產(chǎn)業(yè)規(guī)劃
園區(qū)規(guī)劃
產(chǎn)業(yè)招商
可行性研究
低空經(jīng)濟(jì)
高端裝備
生物醫(yī)藥

前瞻經(jīng)濟(jì)學(xué)人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者，專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領(lǐng)域解決方案，掃一掃關(guān)注。