Manus的三個啟示
(圖片來源:攝圖網(wǎng))
作者|貝貝俠 來源|錦緞
Manus成為AI頂流,似乎只用了一個晚上,另加一場不那么正式的發(fā)布會。一個邀請碼在某魚已經(jīng)炒到了5萬。不用想,現(xiàn)在最慌的有兩批人——投資人,以及大廠。
Manus神奇在何處,是虛火炒作,還是貨真價實(shí)?
01
它可以做什么?
它可以全自主完成一個針對特斯拉的財報分析報告,也可以幫你生成一個完全可以正常交互的網(wǎng)站,甚至可以做一款可以直接上手玩的RPG游戲——它可以搭建開發(fā)環(huán)境,自行寫代碼,自己debug,自行編譯。
如果你想做一個地區(qū)人口調(diào)研報告,Manus還可以自己訪問數(shù)據(jù)庫和自己搜索決定該用什么數(shù)據(jù)來完成。
Manus幾乎可以通過一個prompt來完成一個復(fù)雜的分析項(xiàng)目。官網(wǎng)顯示,在AI agent的評測標(biāo)準(zhǔn)GAIA benchmark基準(zhǔn)下,其表現(xiàn)更是高于OpenAI的 DeepSearch。
筆者分析了用戶在推特和國內(nèi)社媒上發(fā)布的使用案例,從執(zhí)行過程來看,完全比肩DeepSearch,每個流程的執(zhí)行代碼、產(chǎn)出文件都完全可見,分門別類整理好等待用戶檢閱。就特斯拉和英偉達(dá)的財報分析和估值結(jié)果來看,不遜色于雪球各種大V。
筆者覺得其中最為驚艷之處是,Manus通過自己搭建的虛擬電腦來執(zhí)行數(shù)據(jù)獲取、計算、開發(fā)環(huán)境搭建和測試等一系列硬核環(huán)節(jié),這幾乎將用戶從復(fù)雜的基礎(chǔ)工作中解放出來,一個新人完全可以零幀起手進(jìn)入工作。
02
背后的團(tuán)隊
Manus引發(fā)如此大的聲量,除了其超高質(zhì)量的產(chǎn)出,作為土生土長的國內(nèi)團(tuán)隊作品也是引燃社媒聲量的一個引線。AI領(lǐng)域,國內(nèi)團(tuán)隊的步伐和美國集結(jié)了全球人才的夢之隊相比,似乎并沒有落后。
我們了解到,Manus是國內(nèi)AI創(chuàng)業(yè)團(tuán)隊Monica AI的另一產(chǎn)品。Monica AI是一款A(yù)I chatbot產(chǎn)品,不同于國外處于原生狀態(tài)的chatbot,Monica AI 并非僅僅提供一個模型使用入口,而是通過提供大量垂直向可以直接使用的API接口,用戶不需要擔(dān)心prompt調(diào)優(yōu),上手即可使用。
創(chuàng)始人肖宏在這樣一款模式簡單的chatbot產(chǎn)品上,已經(jīng)意識到了大模型和用戶之間交互方式的局限性。即,模型是優(yōu)秀的和具備一定“超能力”,可以在一系列調(diào)教下,完成一個復(fù)雜的項(xiàng)目。
但由于chatbot直接將用戶和大模型對接上,使得要完成某個任務(wù)的用戶,只能分批次將任務(wù)通過1v1對話讓模型分步驟產(chǎn)出。甚至,用戶可能都無法確認(rèn)輸入給模型的token是否是這個任務(wù)最優(yōu)的方案。
Manus讓人們繼續(xù)在對話框中,一步到位解決更復(fù)雜需要更高智能的任務(wù)了。站在這個角度考慮,Manus似乎更像是一個多個經(jīng)過規(guī)劃后的AI 任務(wù)集合。
團(tuán)隊刻意忽略顯示大模型神奇之處,轉(zhuǎn)而站在用戶角度,思考如何通過發(fā)揮模型的優(yōu)勢來完成日常任務(wù)。這是務(wù)實(shí)又珍貴的探索。
Manus的故事。讓人們看到了連續(xù)創(chuàng)業(yè)者對用戶需求的精準(zhǔn)把握能力和團(tuán)隊的超強(qiáng)執(zhí)行力。至于AI所需要的團(tuán)隊技術(shù)實(shí)力如何,我們稍后再講。
03
產(chǎn)品的亮點(diǎn)
通過接近Manus團(tuán)隊的自媒體《賽博禪心》的文章透露,單條任務(wù)的成本在2美金左右是Deep Search的1/10。基于Claude 3.7 Sonet和國內(nèi)的Qwen模型基礎(chǔ)上,增加了自己的訓(xùn)練過程,這點(diǎn)是毋庸置疑的,創(chuàng)始人在播客訪談中透露,即使在做Monica的時候,他們也并不是僅僅作為prompt中轉(zhuǎn)站,直接將用戶的需求扔給模型,而是增加了產(chǎn)品調(diào)優(yōu)過程的。
就像一個天賦異稟骨骼清奇的練武奇才,需要經(jīng)過后天的努力才能成為笑傲江湖。
Manus任務(wù)自主規(guī)劃、思考和完成能力來自其混合模型的架構(gòu)?;赾laude 和Qwen,并非任務(wù)的某一個環(huán)節(jié)基于claude,另一個環(huán)節(jié)基于Qwen,manus打破了模型的“結(jié)界”,讓每個模型完成自己擅長的任務(wù)環(huán)節(jié)。
多個大模型混合+manus虛擬云端執(zhí)行環(huán)境,實(shí)現(xiàn)了讓用戶只需要一次性敲鍵盤就可以完成往常chatbot多輪對話都未必能完成的復(fù)雜需求。
關(guān)于Mmanus執(zhí)行過程的猜測:
《賽博禪心》在其文章中提到的“工程驅(qū)動創(chuàng)新”一詞,猜測Manus的任務(wù)執(zhí)行過程中,運(yùn)用了大量工程手段加模型能力來完成任務(wù)。結(jié)合多個社媒的案例分享,我們對manus的運(yùn)行機(jī)制做了簡單猜測。
通過大模型(這一步猜測是Qwen)對于輸入進(jìn)行分析后,首先確定任務(wù)類型,manus內(nèi)部對于輸入應(yīng)該有一個類目劃分,如編程任務(wù)、多模態(tài)內(nèi)容生成、任務(wù)規(guī)劃類、建議咨詢類等等。其次,如輸入語言是英文,猜測可能任務(wù)執(zhí)行也以Claude為主。
具體到任務(wù)執(zhí)行層面,猜測過程如下:
1.接收到一個輸入后,大模型會首先進(jìn)行任務(wù)分類,決定后續(xù)任務(wù)執(zhí)行的模型選擇;
2.之后大模型將輸入拆解成多個帶有層級關(guān)系、優(yōu)先級和執(zhí)行順序的子任務(wù);
3.按序執(zhí)行以后,上級任務(wù)的輸出,成為下個任務(wù)的輸入;
4.多個任務(wù)產(chǎn)出合并成一個最終分析結(jié)果。
對于每個子節(jié)點(diǎn)選擇什么模型來執(zhí)行,我們猜測,如果是編程任務(wù)后面執(zhí)行以Claude為主,如果是中文決策建議類就以Qwen為主;根據(jù)子節(jié)點(diǎn)的任務(wù)復(fù)雜度,執(zhí)行過程中單一任務(wù)甚至可能是Qwen和Claude混合,然后再用模型進(jìn)行效果對比,最終選擇保留效果最佳的一個。
從上述的分析可見,初始需求的輸入質(zhì)量決定了后續(xù)的任務(wù)類型判斷,以及子節(jié)點(diǎn)規(guī)劃和執(zhí)行效率,所以manus對于輸入的質(zhì)量要求很高,通常需要用戶詳細(xì)和完整的描述需求內(nèi)容(越詳細(xì)越好)。
這可能會成為Manus被詬病的一點(diǎn),畢竟一個輸入的執(zhí)行是漫長的,如果僅僅因?yàn)槊枋霾粔蚯逦敿?xì)而導(dǎo)致時間和算力的浪費(fèi),會嚴(yán)重影響產(chǎn)品體驗(yàn),屬于產(chǎn)品的不成熟,相信未來團(tuán)隊會改善這一點(diǎn),畢竟一次任務(wù)執(zhí)行就要花費(fèi)一杯奶茶錢呢。
04
當(dāng)前的問題
從2022年到2025年,經(jīng)歷了三年多的大模型風(fēng)口一輪輪的認(rèn)知沖擊。人們對于大模型產(chǎn)品的使用體驗(yàn),已經(jīng)基本走過了“AHA Moment”決定產(chǎn)品去留的階段。一個大模型產(chǎn)品,在效果驚人的基礎(chǔ)上,還必須要穩(wěn)定、要快,才能長久抓住用戶。
效果穩(wěn)定性
回頭看manus,鑒于我們的Manus賬號尚在wishlist,從推特和國內(nèi)社媒的使用者反饋來看,略不同于DeepSeek的眾人交口稱贊,用戶對Mansu的產(chǎn)出穩(wěn)定性很不樂觀,甚至有不少弄錯事實(shí),讓人啼笑皆非的環(huán)節(jié)。
如果執(zhí)行中一個任務(wù)的數(shù)據(jù)或者事實(shí)用錯了,就會導(dǎo)致最終產(chǎn)出變得不可信,從而浪費(fèi)這2美元的成本。
算力
除了效果不穩(wěn)定,單任務(wù)執(zhí)行時間過長也是被詬病了另一個點(diǎn),盡管Manus已經(jīng)展示出了其任務(wù)執(zhí)行邏輯和過程,但留給用戶的仍然有漫長的等待,一個用戶發(fā)推說,自己的任務(wù)執(zhí)行了4-5個小時。
這背后是團(tuán)隊對使用量的低谷,以及Manus本身架構(gòu)無法產(chǎn)生的大量算力需求。除以意外,用戶已經(jīng)被各大模型養(yǎng)刁了口味,習(xí)慣了分分鐘出結(jié)果的體驗(yàn),對于長達(dá)數(shù)小時的等待自然無法容忍。
其實(shí),Manus如果能給用戶一個可預(yù)見的完成時間,也許可以減少等待的焦慮。畢竟對于一個復(fù)雜的分析任務(wù),即使執(zhí)行時間長達(dá)2-3個小時甚至半天的時間,恐怕也比現(xiàn)實(shí)中初級員工要快的多。
技術(shù)能力
如果說,算力可以通過加卡來完成,那么團(tuán)隊技術(shù)能力可能短時間很難補(bǔ)齊。且不去對比DeepSeek那樣的夢之隊,Manus的技術(shù)儲備可能更適合做一款日活百萬級左右的用戶端產(chǎn)品。連續(xù)創(chuàng)業(yè)者出身的團(tuán)隊可能優(yōu)勢更在于需求發(fā)現(xiàn),并在短時間內(nèi)手搓出一個可以上線使用的產(chǎn)品,但用戶量大了怎么辦?需要技術(shù)升級是怎么辦,這些都是需要長時間解決的問題。當(dāng)前Mansu的用戶吐槽套殼和運(yùn)行速度太慢,任務(wù)卡頓就是這個問題的外在體現(xiàn)(團(tuán)隊的道歉信中我們也看到他們沒想到這款產(chǎn)品這么出圈)。
Manus有了一個優(yōu)秀的起步基礎(chǔ),有善于發(fā)現(xiàn)和抓住用戶需求的創(chuàng)始團(tuán)隊來把我研發(fā)方向,但還需要更多AI人才來讓manus成長的更快更穩(wěn)定。畢竟目前的產(chǎn)品現(xiàn)狀,內(nèi)行人使用幾次之后就能大概了解產(chǎn)品架構(gòu),被大廠拷貝一個出來是沒什么難度的。
05
Manus初步證明AI Agent的另一條路
市面上的Agent產(chǎn)品有2個方向,通用型和垂直應(yīng)用型。前者中知名度最高的2個產(chǎn)品,是來自2個大模型廠商OpenAI的"Operator"和Anthropic 推出的 “Computer Use”。這個方向可以說是通用型Agent的代表。
Anthropic的Agent軟件是通過一個特殊的API,開發(fā)者可以知道Claude 模型來完成各種計算機(jī)基本的輸入、打開文件等基本操作任務(wù);OpenAI則是在此技術(shù)上擴(kuò)大硬件調(diào)用范圍允許通過API接口,在個人電腦上完成編程、預(yù)定旅行和購物等操作。國內(nèi)智譜的AutoGLM在運(yùn)行模式上類似OpenAI的"Operator"。
垂直Agent,典型代表為cursor和devin。這兩款agent產(chǎn)品在程序員中口碑很好,但遺憾的是應(yīng)用領(lǐng)域窄很難推開來。Manus創(chuàng)始人肖宏在一則訪談中也表達(dá)了垂直和通用相比,顯然后者更具有普世價值,但前者更快走入了應(yīng)用。從實(shí)際情況看,我們周圍不少程序員朋友在用cursor編寫基礎(chǔ)代碼了。
Manus定位為一款通用型AI agent。通過工程手段實(shí)現(xiàn)Agent架構(gòu)創(chuàng)新,將復(fù)雜的工作流程封裝在一個云環(huán)境上,融合多個大模型,通過任務(wù)規(guī)劃來自動完成子節(jié)點(diǎn)需求處理,產(chǎn)出的是一個往常需要經(jīng)過多輪人機(jī)對話才能完成的復(fù)雜任務(wù)。
Manus達(dá)到了在部分任務(wù)上超越OpenAI DeepSearch的效果,代表了Agent的另一條可以選擇的路。
通用型agent產(chǎn)品,不可能依靠單一大模型實(shí)現(xiàn),并且天然就是第三方開發(fā)者的使命。
畢竟OpenAI和Anthropic的agent,幾乎不太可能通過競對的模型來實(shí)現(xiàn),這就決定了他們的產(chǎn)品研發(fā)進(jìn)度和工程手段無法和第三方相比。
同時Manus的應(yīng)用范圍相比通用型產(chǎn)品更加落地,相比垂直型有更廣闊的應(yīng)用領(lǐng)域。通用型agent所宣傳的幫助用戶購票、規(guī)劃形成以及電商購物的一系列操作,用戶自己操作也毫無門檻。但完成一個特斯拉財報分析報告,就需要很高的門檻了。通常有門檻的產(chǎn)品,其商業(yè)價值就更高。
互聯(lián)網(wǎng)界一直將AI Agent和通用型AGI鎖定起來,但Manus的出現(xiàn)告訴人們,即使尚未達(dá)到AGI,但 who cares,對普通用戶來說能完成任務(wù)的同志才是好同志。
05
三重啟示
一,有了AI助力,更需要獨(dú)立決策能力
即使今天和不遠(yuǎn)的明天Manus仍不能變成廣泛使用的agent產(chǎn)品,我們也能從不斷涌現(xiàn)的類似產(chǎn)品中明白看到一個核心問題,即獨(dú)立思考和創(chuàng)新能力未來會是一個人的核心能力。
AI的確能幫人們做很多事,幫你分析實(shí)驗(yàn)結(jié)果、做實(shí)驗(yàn)報告,幫你完成案頭材料撰寫等等,但AI不會幫你做實(shí)驗(yàn),AI不會幫你想一個分析該從哪個點(diǎn)切入才能讓結(jié)果看起來更有亮點(diǎn)。我們毫不懷疑在AI的介入下,人和人的差距會越來越大。
二、第一手消息更換了來源
上個互聯(lián)網(wǎng)風(fēng)口2010年前后,扮演攪動風(fēng)云角色的是各大科技媒體,除了四大傳統(tǒng)互聯(lián)網(wǎng)門戶網(wǎng)站外,垂直領(lǐng)域科技媒體也起了舉足輕重的作用。AI風(fēng)口前,創(chuàng)業(yè)企業(yè)新的動向往往來自自媒體、而后經(jīng)過社媒發(fā)酵,再被全民皆知。
“古典”時代,只要和記者保持溝通就不會錯過重要行業(yè)動態(tài),但來到AI時代,投資人經(jīng)常陷于被動,對突然冒出來的科技新秀一無所知。不少風(fēng)投機(jī)構(gòu)通過設(shè)立孵化器來自己培養(yǎng)創(chuàng)業(yè)企業(yè),但概率不理想,也很少有爆品產(chǎn)生。如何在一個社媒發(fā)酵模式下,抓住潛在甚至冒尖的機(jī)會,是機(jī)構(gòu)面臨的新課題。
三、大廠怎么辦
DeepSeek一枝獨(dú)秀的模型效果加開源殺手锏,將字節(jié)、騰訊、百度等大廠從技術(shù)潮頭絀落。Manus又邁出了通用型agent走進(jìn)現(xiàn)實(shí)的第一步,又領(lǐng)先了大廠。這里我們都不敢將Manus的研發(fā)成本和大廠成本作對比,恐怕屆時將是對大廠的羞辱。Agent,跟還是不跟?
參考資料
張小珺Jùn|商業(yè)訪談錄:https://www.xiaoyuzhoufm.com/episode/67c3d80fb0167b8db9e3ec0fhttps://pan.baidu.com/s/1KkGRdYdkf84vJygkFk2J5Q?pwd=n15q#list/path=%2F
賽博禪心:實(shí)測 Manus:首個真干活 AI,中國造(附50個用例 + 拆解)https://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==&mid=2247498251&idx=1&sn=f3a81f0f2a0f54c89ed51b2951b07da2&scene=142
賽博禪心:關(guān)于 Manus 的一些獨(dú)家信息manus使用分享https://manus.im/share/hRGARE7EBqtDhLHBGISLP7?replay=1
轉(zhuǎn)載開白 | 商務(wù)合作 | 內(nèi)容交流請?zhí)砑游⑿牛簀induan008添加微信請備注姓名公司與來意 推 薦 閱 讀
編者按:本文轉(zhuǎn)載自微信公眾號:錦緞,作者:貝貝俠
前瞻經(jīng)濟(jì)學(xué)人
專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。