報(bào)告服務(wù)熱線(xiàn)400-068-7188

AI苦工卷向高學(xué)歷,美國(guó)博士正在搶走印度人工作

分享到:
20 字母榜 ? 2024-07-01 10:05:29  來(lái)源:字母榜 E6288G0

2

(圖片來(lái)源:攝圖網(wǎng))

作者|畢安娣 來(lái)源|字母榜(ID:wujicaijing)

美國(guó)人馬特?fù)碛型ㄐ挪┦繉W(xué)位,他最近喜提一份自由職業(yè):成為Scale AI公司的一員,在家訓(xùn)練AI模型。

“通信博士”“訓(xùn)練AI模型”,馬特是不是成了一名光榮的AI程序員?事實(shí)并非如此。馬特的工作很無(wú)聊:他在Scale AI的系統(tǒng)中“接活”,以用戶(hù)的角度瀏覽AI模型給用戶(hù)的各種回復(fù),判斷AI有沒(méi)有說(shuō)錯(cuò),然后提供反饋。比如為谷歌的AI訓(xùn)練預(yù)訂航班,審核哪些ChatGPT的答案會(huì)得到用戶(hù)的差評(píng)。

Scale AI自己不生產(chǎn)大模型,它和谷歌母公司Alphabet、OpenAI、Meta等眾多AI生產(chǎn)商達(dá)成合作,為它們提供“人類(lèi)”。

只不過(guò),來(lái)自非洲、印度、菲律賓等地的廉價(jià)勞動(dòng)力,已經(jīng)不足以滿(mǎn)足客戶(hù)的需求。Scale AI已經(jīng)開(kāi)始收縮其海外業(yè)務(wù),在美國(guó)本土雇傭數(shù)十萬(wàn)勞動(dòng)力,其中不乏像馬特一樣的高知人士。

這家成立了8年的大模型數(shù)據(jù)標(biāo)注公司,在今年5月剛剛完成了10億美元F輪融資,由Accel領(lǐng)投,亞馬遜、英特爾、AMD、思科、Meta、老虎全球基金等全球知名公司跟投。公司預(yù)計(jì)今年銷(xiāo)售額將超過(guò)10億美元,使其成為生成式AI公司中銷(xiāo)售額排名靠前的公司之一。

而它的最新估值,已經(jīng)達(dá)到了138億美元。這放在所有AI初創(chuàng)公司中,都是一份不俗的成績(jī),遠(yuǎn)遠(yuǎn)超過(guò)硅谷明星公司Hugging Face去年8月融資后的45億美元估值,更接近埃隆·馬斯克(Elon Musk)的xAI,其最新一輪融資后估值180美元。

讓人類(lèi)給AI打苦工的Scale AI,已經(jīng)是當(dāng)下AI競(jìng)賽中很關(guān)鍵的彈藥庫(kù)。

當(dāng)我們提到“大模型訓(xùn)練”時(shí),會(huì)想到的是用數(shù)千個(gè)先進(jìn)芯片驅(qū)動(dòng)大模型,讓其分析數(shù)百億字節(jié)的文本,其實(shí)這只是第一步——預(yù)訓(xùn)練。

但僅靠這些,不足以確保像Anthropic的Claude、OpenAI的ChatGPT、Meta的Llama和谷歌的Bard這樣的系統(tǒng)提供以人類(lèi)風(fēng)格編寫(xiě)的正確答案。

為了實(shí)現(xiàn)這一點(diǎn),需要進(jìn)行第二步:微調(diào)。這就涉及大量的人力,有可能是AI生產(chǎn)商在公司內(nèi)部雇傭,也有可能是來(lái)自Scale、Surge AI、Labelbox、Telus International等公司。這些公司提供大量的人,為客戶(hù)的聊天機(jī)器人寫(xiě)下理想的回應(yīng),手把手教機(jī)器人提供更“完美”的答案。

為AI模型提供數(shù)據(jù)標(biāo)注服務(wù)的公司并非全新的存在,上一次讓這類(lèi)公司起飛的風(fēng)是自動(dòng)駕駛。

Scale AI就成立于2016年。事實(shí)上,Scale AI從一開(kāi)始就和OpenAI頗有淵源,其孵化于Y Combinator(下稱(chēng)YC)的初創(chuàng)企業(yè)賽馬項(xiàng)目,項(xiàng)目還未結(jié)束就已經(jīng)獲得了YC的支持。而YC彼時(shí)的總裁,正是后來(lái)聯(lián)合創(chuàng)辦了OpenAI的山姆·奧特曼(Sam Altman)。

不過(guò),彼時(shí)“千模大戰(zhàn)”還未開(kāi)始,Scale AI首先趕上的是席卷硅谷的自動(dòng)駕駛技術(shù)熱潮。實(shí)現(xiàn)自動(dòng)駕駛,需要訓(xùn)練AI算法,而當(dāng)時(shí)沒(méi)有其他外包公司擁有對(duì)自動(dòng)駕駛汽車(chē)的雷達(dá)和傳感器生成的三維圖像進(jìn)行數(shù)據(jù)標(biāo)注的能力。

Scale AI的工程師最初花了幾個(gè)月,為自動(dòng)配送初創(chuàng)公司Nuro建立了3D標(biāo)注產(chǎn)品。很快,Alphabet的Waymo和通用汽車(chē)的Cruise,甚至是蘋(píng)果,都成了Scale AI的客戶(hù)。

在2017年底,Scale AI雇傭了1000多名標(biāo)注員,主要在菲律賓。平均來(lái)說(shuō),這些合同工的時(shí)薪是1.5美元,每周工作10個(gè)小時(shí)。

到了2019年,OpenAI也已經(jīng)成立幾年,并且將方向主要專(zhuān)注在了開(kāi)發(fā)AI大模型上,隨后成為Scale AI的客戶(hù)。只不過(guò)彼時(shí)AI大模型客戶(hù)對(duì)于Scale AI來(lái)說(shuō)并不是關(guān)鍵收入來(lái)源。

隨著自動(dòng)駕駛技術(shù)的熱潮漸漸回落,市場(chǎng)回歸理智,Scale AI也遭遇了危機(jī)。在2022年,Scale AI的收入增長(zhǎng)已經(jīng)下降了50%,讓投資人頗為失望。

然而,2022年年底,OpenAI發(fā)布了ChatGPT,Scale AI的“第二春”瞬間綻放。

除了OpenAI之外,Scale AI也與Meta和谷歌母公司Alphabet達(dá)成了圍繞大模型的合作。公司的收入從2022年的2.27億美元,飆升到2023年的6.8億美元。

站在風(fēng)口之上,Scale AI喊出2024年收入增長(zhǎng)206%的目標(biāo),并希望實(shí)現(xiàn)盈利。

在這個(gè)節(jié)點(diǎn),Scale AI也開(kāi)始做出一些改變,來(lái)自海外的廉價(jià)勞動(dòng)力只能負(fù)擔(dān)很基礎(chǔ)的任務(wù),但大模型驅(qū)動(dòng)的產(chǎn)品在寫(xiě)作、編程、專(zhuān)業(yè)知識(shí)等方面都開(kāi)始“卷”,Scale AI需要升級(jí)手里的“雇傭兵”。

在一份投資者演示文稿中,Scale說(shuō)它正在建設(shè)的是至關(guān)重要的AI基礎(chǔ)設(shè)施。該公司開(kāi)始將自己打造成一個(gè)“AI的數(shù)據(jù)鑄造廠(chǎng)”,讓人聯(lián)想到半導(dǎo)體公司。

Scale AI的創(chuàng)始人也開(kāi)始公開(kāi)談?wù)摮钟胁┦繉W(xué)位的人,或者醫(yī)生、律師等在訓(xùn)練AI系統(tǒng)上的貢獻(xiàn):“我們需要最優(yōu)秀和最聰明的頭腦來(lái)貢獻(xiàn)數(shù)據(jù)。”

根據(jù)Rest of World的報(bào)道,Scale AI最近關(guān)閉了肯尼亞、尼日利亞和巴基斯坦的承包商站點(diǎn)。公司的焦點(diǎn)轉(zhuǎn)向美國(guó)本土,招募高知人士,來(lái)幫助訓(xùn)練大模型的專(zhuān)業(yè)知識(shí)。

大約有30萬(wàn)人通過(guò)Scale AI子公司Outlier運(yùn)行的工作群等著“派活兒”。

美國(guó)本土的Scale AI“雇傭兵”并不廉價(jià),平均時(shí)薪可以達(dá)到40美元。不過(guò)這份工作仍然擺脫不了“苦工”的體驗(yàn)感。

在美國(guó)馬薩諸塞州的梅麗莎·夸西(Melissa Quashie)就以每個(gè)小時(shí)40美元的薪酬在Scale AI接活,她是一位自由職業(yè)者和編輯。她的任務(wù)包括評(píng)估由大模型生成的不同響應(yīng),根據(jù)模型回答問(wèn)題的方式以及回答的內(nèi)容質(zhì)量來(lái)給出評(píng)分。

對(duì)夸西來(lái)說(shuō),在Scale AI的工作就像是“我玩過(guò)的最呆的電子游戲”。她曾經(jīng)花了兩個(gè)小時(shí)編寫(xiě)一個(gè)“三天餐譜”,只是為了給聊天機(jī)器人改進(jìn)答案。

此外,隨著Scale AI積累大量的勞動(dòng)力,供求關(guān)系已經(jīng)開(kāi)始不平衡。很多時(shí)候,Scale AI派發(fā)的客戶(hù)任務(wù)已經(jīng)難以滿(mǎn)足“雇傭兵”的需求。很多人發(fā)現(xiàn),這份工作雖然時(shí)間靈活且薪水誘人,但許多時(shí)候都會(huì)無(wú)事可做。The Information采訪(fǎng)的10位Scale AI“雇傭兵”中,大部分人都有相同的抱怨。

也許是在AI浪潮下公司業(yè)務(wù)擴(kuò)展的速度太快,也許是比起勞力們的工作體驗(yàn),Scale AI更專(zhuān)注于服務(wù)好客戶(hù)??傊琒cale AI也開(kāi)始暴露其他的問(wèn)題,除了吐槽派的活不夠做之外,人們也抱怨其培訓(xùn)不足以及系統(tǒng)經(jīng)常崩潰。

更惱人的還要數(shù)薪酬結(jié)算,即便是在美國(guó)本土為Scale AI提供勞力的“高知人士”,也沒(méi)有什么話(huà)語(yǔ)權(quán)。開(kāi)頭提到的博士馬特就表示,他被Scale AI無(wú)故踢出平臺(tái)。

薪酬的結(jié)算不看工作量,而是要考核質(zhì)量,而最終解釋權(quán)自然歸Scale AI所有。而且即便理應(yīng)收到報(bào)酬,也可能因?yàn)榭蛻?hù)遲遲不確認(rèn)而沒(méi)有著落。

根據(jù)工作質(zhì)量而不是工作量為苦力們結(jié)算,這有助于Scale AI控制成本,而這對(duì)于Scale AI來(lái)說(shuō)是現(xiàn)階段的關(guān)鍵卡點(diǎn)。

隨著公司將焦點(diǎn)從提供廉價(jià)勞動(dòng)力的海外市場(chǎng)轉(zhuǎn)移到美國(guó),Scale AI的成本也更難控制。根據(jù)The Information獲取的財(cái)務(wù)數(shù)據(jù),Scale AI的毛利率(包括支付給人類(lèi)苦工的成本),從2022年的59%下降到了2023年的49%。

與此同時(shí),Scale AI告訴投資者,它正在努力降低成本。該公司預(yù)測(cè),今年將提高毛利潤(rùn)率5個(gè)百分點(diǎn),然后到2025年提高到60%。

公司告訴投資者,它正在通過(guò)使用內(nèi)部工具自動(dòng)識(shí)別“高效專(zhuān)家”來(lái)降低人工訓(xùn)練模型的成本,以及依靠計(jì)算機(jī)生成的數(shù)據(jù)來(lái)增加人類(lèi)工作的效率。

另一個(gè)壓縮成本的方式是減少內(nèi)部員工(和“雇傭兵”不同,此處指的是在Scale AI工作的正式員工),2023年2月,Scale AI一方面已經(jīng)看到了AI浪潮的來(lái)臨,另一方面也看到了宏觀經(jīng)濟(jì)的影響以及硅谷的裁員潮,它抓住機(jī)會(huì),也大刀闊斧裁員20%。

除了盡力壓縮成本之外,Scale AI也在想方設(shè)法拓展業(yè)務(wù)。

雖然很多員工反對(duì),但Scale AI早已把不與政府合作的承諾拋之腦后。最近幾個(gè)月,Scale AI的聯(lián)合創(chuàng)始人亞歷山大·王(Alexandr Wang)與美國(guó)陸軍將領(lǐng)在華盛頓共同登臺(tái),公司每年從政府合同中獲得超過(guò)1億美元的收入。此外,他還前往卡塔爾,與政府官員進(jìn)行閉門(mén)會(huì)議,卡塔爾也熱衷于開(kāi)發(fā)自己的大語(yǔ)言模型。

在為AI生產(chǎn)商提供大量人力之外,Scale AI也提供AI生成的合成數(shù)據(jù)集——用AI生成的數(shù)據(jù),訓(xùn)練AI,以滿(mǎn)足AI大模型訓(xùn)練中不斷膨脹的胃口。

現(xiàn)階段“高質(zhì)量的人類(lèi)”依舊是Scale AI最賴(lài)以生存的“資源”,因此公司也在采取措施維護(hù)“高質(zhì)量人類(lèi)”中的那些佼佼者。

在美國(guó)德克薩斯州奧斯汀和佛羅里達(dá)州的杰克遜維爾,Scale AI曾舉辦為期數(shù)天的研討會(huì),邀請(qǐng)幾十名“頂級(jí)苦力”前往參加。

一位參加奧斯汀研討會(huì)的人說(shuō),大約有50名訓(xùn)練師參與了一個(gè)據(jù)悉Alphabet的Bard聊天機(jī)器人相關(guān)的項(xiàng)目。他們討論了每個(gè)人為不同提示寫(xiě)下的回應(yīng),并在晚上一起唱卡拉OK。

在杰克遜維爾,夸西遇到了大學(xué)教授、博士生、編劇和播客主持人。“我們連續(xù)工作六個(gè)小時(shí),然后喝杯葡萄酒。”

“每個(gè)人都非常興奮地改善大語(yǔ)言模型。但沒(méi)有人談?wù)摰氖牵驗(yàn)槲覀冊(cè)谧鲞@份工作,誰(shuí)會(huì)失去他們的工作?”

諷刺的是,數(shù)以十萬(wàn)計(jì)的人類(lèi)在為AI打工,就是為了讓AI的表現(xiàn)越來(lái)越好。而當(dāng)AI足夠好的時(shí)候,這些苦力也許也是會(huì)被首先拋棄的那批人。畢竟如果AI能自產(chǎn)自銷(xiāo),何必依靠每小時(shí)需要40美元的“高知苦力”?

也許更進(jìn)一步的問(wèn)題是,為AI販賣(mài)人類(lèi)勞動(dòng)力的日子還能持續(xù)多久,而這也是懸在Scale AI頭上的一把劍。

編者按:本文轉(zhuǎn)載自微信公眾號(hào):字母榜(ID:wujicaijing),作者:畢安娣 

本文來(lái)源字母榜,內(nèi)容僅代表作者本人觀點(diǎn),不代表前瞻網(wǎng)的立場(chǎng)。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問(wèn)題,請(qǐng)聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請(qǐng)聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p48 q0 我要投稿

分享:
標(biāo)簽: 人工智能 工作

品牌、內(nèi)容合作請(qǐng)點(diǎn)這里:尋求合作 ››

前瞻經(jīng)濟(jì)學(xué)人

專(zhuān)注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國(guó)產(chǎn)業(yè)咨詢(xún)領(lǐng)導(dǎo)者,專(zhuān)業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫(kù)
企查貓
作者 字母榜
科技自媒體
510267
關(guān)注
1051
文章
前瞻經(jīng)濟(jì)學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟(jì)學(xué)家互動(dòng)交流讓您成為更懂趨勢(shì)的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢(xún)寶)App
×

掃一掃
下載《前瞻經(jīng)濟(jì)學(xué)人》APP提問(wèn)

 
在線(xiàn)咨詢(xún)
×
在線(xiàn)咨詢(xún)

項(xiàng)目熱線(xiàn) 0755-33015070

AAPP
前瞻經(jīng)濟(jì)學(xué)人APP下載二維碼

下載前瞻經(jīng)濟(jì)學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號(hào)

掃一掃關(guān)注我們

我要投稿

×
J