首頁(yè) > 科技要聞 > 科技> 正文

AI訓(xùn)練師的困局:喂飽AI,餓死自己

趙甜怡 編輯:林炯佳 發(fā)布于:2024-07-14 00:04 PConline原創(chuàng)

“工作越積極,我被淘汰得越快!”

這聽(tīng)起來(lái)荒誕的現(xiàn)象卻在AI行業(yè)如火如荼地上演。

當(dāng)一種新技術(shù)誕生時(shí),往往會(huì)帶來(lái)新的工作類(lèi)型。數(shù)據(jù)標(biāo)注就是大火AI下的其中一種新職業(yè)。

在判定式AI的時(shí)代,人工智能中的「人工」主要是數(shù)據(jù)標(biāo)注,幫助AI處理數(shù)據(jù),進(jìn)行分類(lèi)。

到了生成式AI的時(shí)代,機(jī)器代替了原來(lái)的數(shù)據(jù)標(biāo)注,但對(duì)人工的需求卻沒(méi)有減少,反而變成了更高的工作需求——AI訓(xùn)練師。

數(shù)據(jù)標(biāo)注員還是AI訓(xùn)練師?

很多時(shí)候,市場(chǎng)常常將「數(shù)據(jù)標(biāo)注員」和「AI訓(xùn)練師」混為一談,兩者都是伴隨人工智能技術(shù)發(fā)展起來(lái)的一種工作類(lèi)型。但實(shí)際上,負(fù)責(zé)的卻是AI大模型訓(xùn)練中不同的階段,且價(jià)值相差甚遠(yuǎn)。

回到在AI大模型的訓(xùn)練過(guò)程,主要有五個(gè)步驟:數(shù)據(jù)準(zhǔn)備、模型設(shè)計(jì)、預(yù)訓(xùn)練、微調(diào)和模型部署。

數(shù)據(jù)準(zhǔn)備便是數(shù)據(jù)標(biāo)注員主要負(fù)責(zé)的環(huán)節(jié)。而AI訓(xùn)練師的職責(zé)范圍覆蓋更多環(huán)節(jié),包含了預(yù)訓(xùn)練、微調(diào)和模型部署。除了具體工作內(nèi)容不同,職位也有所不同。

在數(shù)據(jù)準(zhǔn)備的環(huán)節(jié)中,數(shù)據(jù)標(biāo)注員要完成對(duì)數(shù)據(jù)的處理。例如,在一張圖片中,框出不同的物體并打上機(jī)器可以理解的標(biāo)簽,相當(dāng)于教機(jī)器認(rèn)識(shí)世界。這個(gè)過(guò)程不僅有圖片,還有語(yǔ)音、文本、視頻等數(shù)據(jù)。

而AI訓(xùn)練師則需要結(jié)合業(yè)務(wù)需要來(lái)訓(xùn)練數(shù)據(jù)、進(jìn)行算法測(cè)試,推進(jìn)模型的實(shí)際落地。另一方面,AI訓(xùn)練師還需要根據(jù)測(cè)試結(jié)果,反推數(shù)據(jù)準(zhǔn)備環(huán)節(jié)的標(biāo)注體系,提出對(duì)標(biāo)注工具的功能建議、協(xié)作流程優(yōu)化等。

總的來(lái)說(shuō),就是一手調(diào)參數(shù),一手抓數(shù)據(jù),讓AI生成的內(nèi)容更準(zhǔn)確。于是常常招聘要求AI訓(xùn)練師需要有一定的IT技術(shù)背景。

在一些特定的行業(yè),例如游戲、電商等,還會(huì)將AI訓(xùn)練師的工作稱(chēng)為“煉丹”——AI訓(xùn)練師需要不斷地對(duì)模型進(jìn)行調(diào)優(yōu)、測(cè)試,大量嘗試的經(jīng)歷就像煉丹一樣需要精細(xì)的操作。

這兩種職業(yè)難度的不同,最直觀的還是市場(chǎng)薪資的差距。

AI訓(xùn)練師的薪資一般起薪在10k以上,而這個(gè)數(shù)值對(duì)于數(shù)據(jù)標(biāo)注員來(lái)說(shuō),降到了4k。在一些非一線城市,數(shù)據(jù)標(biāo)注員的起薪甚至降到了2~3k。

值得一提的是,更多的數(shù)據(jù)標(biāo)注崗位是以兼職的形式出現(xiàn),不需要坐班,有電腦就行。

一位招聘人員告訴PConline,兼職的薪資按勞動(dòng)量來(lái)計(jì)算。招聘人員給出了一個(gè)公式:

薪資計(jì)算方式:完成2000框=8 +* 元,完成4000框=16 + *元, 完成5000框=20 +*元。

這種被稱(chēng)為“計(jì)件模式”,基礎(chǔ)工資加階梯式獎(jiǎng)勵(lì)。當(dāng)處理的數(shù)據(jù)超過(guò)某個(gè)數(shù)額時(shí),會(huì)賺取更多獎(jiǎng)勵(lì)。市場(chǎng)上也有不少直接明碼標(biāo)價(jià)的,“拉一個(gè)框2毛錢(qián)”,多勞多得。

在招聘信息上常見(jiàn)的話(huà)術(shù)是“項(xiàng)目多,結(jié)算快,寶媽、學(xué)生黨速來(lái)!”“賺錢(qián)上不封頂”。PConline嘗試發(fā)現(xiàn),剛上手的工作人員拉一個(gè)框需要1分鐘,一天8小時(shí)工作,算一天拉500個(gè)框,一個(gè)月工作25天,才能賺到2500元。

高薪下的出路迷茫

AI的發(fā)展影響著政策的變化,此時(shí)整個(gè)數(shù)據(jù)服務(wù)市場(chǎng)也進(jìn)入了高速發(fā)展期。在2020年,由人社部、工信部等單位共同參與制定的《人工智能訓(xùn)練師國(guó)家職業(yè)技能標(biāo)準(zhǔn)(2021年版)》(下文簡(jiǎn)稱(chēng)為《標(biāo)準(zhǔn)》)中,AI訓(xùn)練師作為一門(mén)新興職業(yè)被納入了標(biāo)準(zhǔn)職業(yè)的范圍。

AI訓(xùn)練師的職業(yè)技能劃分為五個(gè)等級(jí)。值得注意的是,《標(biāo)準(zhǔn)》將數(shù)據(jù)標(biāo)注納入AI訓(xùn)練師初級(jí)工(五級(jí))的職業(yè)功能之一。數(shù)據(jù)標(biāo)注的工作正式成為AI訓(xùn)練的“子集”。

截圖來(lái)自《人工智能訓(xùn)練師國(guó)家職業(yè)技能標(biāo)準(zhǔn)(2021年版)》

根據(jù)德勤發(fā)布的數(shù)據(jù),中國(guó)人工智能基礎(chǔ)數(shù)據(jù)服務(wù)的市場(chǎng)規(guī)模在2027年有望達(dá)到130-160億元。

除了占據(jù)先發(fā)優(yōu)勢(shì)的互聯(lián)網(wǎng)巨頭——阿里眾包、百度智能云數(shù)據(jù)眾包等,還有不少在這個(gè)風(fēng)口冒出來(lái)或是獲得了迅猛增長(zhǎng)的明星企業(yè)。

例如科創(chuàng)企業(yè)海天瑞聲。受到AI浪潮的影響,去年該公司股價(jià)漲幅超過(guò)70%。還有“AI五小龍”之一的老牌AI公司商湯科技,在2023年財(cái)報(bào)中表示,“生成式AI收入由2022年的人民幣394.7百萬(wàn)元增長(zhǎng)至2023年的人民幣1,183.7百萬(wàn)元,增幅達(dá)到199.9%”。

據(jù)天眼查數(shù)據(jù)顯示,僅“數(shù)據(jù)標(biāo)注”領(lǐng)域,目前我國(guó)就有2500余家公司。但與快速擴(kuò)張的市場(chǎng)規(guī)模相比,行業(yè)人力資源卻面臨嚴(yán)重緊缺。

根據(jù)2020年人力資源和社會(huì)保障部官網(wǎng)發(fā)布的《新職業(yè)——人工智能工程技術(shù)人員就業(yè)景氣現(xiàn)狀分析報(bào)告》,我國(guó)人工智能人才目前缺口超過(guò)500萬(wàn),國(guó)內(nèi)的供求比例為1:10,供需比例嚴(yán)重失衡。

猛然一看,這個(gè)行業(yè)缺口大,薪資高,是一片藍(lán)海,只要進(jìn)去就能成為“第一批吃螃蟹的人”。事實(shí)上卻勸退了觀望的人,因?yàn)槁殬I(yè)路徑卻不夠清晰。

不少網(wǎng)友分享AI訓(xùn)練師的職業(yè)發(fā)展,無(wú)外乎兩種方向:

一是繼續(xù)考級(jí),成為技術(shù)專(zhuān)家或顧問(wèn)后,考慮團(tuán)隊(duì)管理;

二是開(kāi)數(shù)據(jù)標(biāo)注公司。有過(guò)訓(xùn)練師的經(jīng)驗(yàn),更了解上游的要求和玩法。如果老家是非一線城市,可以直接回家開(kāi)個(gè)數(shù)據(jù)標(biāo)注公司。“用三四線城市的低人力成本,賺全國(guó)的錢(qián),降維打擊。”

許多網(wǎng)友詼諧地將數(shù)據(jù)標(biāo)注員稱(chēng)為“拉框的”,而AI訓(xùn)練師則是“調(diào)參俠”。這樣的調(diào)侃背后,其實(shí)也是對(duì)職業(yè)未來(lái)規(guī)劃的擔(dān)憂(yōu),對(duì)未來(lái)沒(méi)有安全感。

被取代的未來(lái)

回到學(xué)術(shù)界,AI訓(xùn)練師的工作其實(shí)是生成式AI發(fā)展中的一種范式,叫做RLHF,Reinforcement Learning from Human Feedback,人類(lèi)反饋強(qiáng)化學(xué)習(xí)。

就像是小孩子剛開(kāi)始咿呀學(xué)語(yǔ)的時(shí)候,大人不斷指著街道上的車(chē)輛告訴小孩,這是“汽車(chē)”。隨著大人的教學(xué),小孩子才能逐漸將“汽車(chē)”和看到的事物聯(lián)系起來(lái)。

這種范式就是需要AI訓(xùn)練師不斷地“鼓勵(lì)”AI生成的正確答案,“修正”AI的錯(cuò)誤答案,從而讓AI生成的內(nèi)容更加準(zhǔn)確。

其實(shí),這就是人工智能中「人工」兩個(gè)字的來(lái)源。但是從去年9月開(kāi)始,情況發(fā)生了改變。

去年九月,谷歌發(fā)布了一篇主題為RLAIF的論文, Reinforcement Learning from AI Feedback AI反饋強(qiáng)化學(xué)習(xí)。谷歌提出,RLAIF用AI來(lái)代替RLHF當(dāng)中的人類(lèi),完成生成反饋的工作,讓大模型不再受制于人類(lèi)的局限。

在對(duì)比分析后,谷歌研究員發(fā)現(xiàn),RLHF和RLAIF訓(xùn)練后的模型生成的答案傾向性幾乎沒(méi)有差別。甚至一些細(xì)節(jié)上,RLAIF還更勝一籌。

技術(shù)的發(fā)展速度超過(guò)了所有人的想象。OpenAI最新公布關(guān)于CriticGPT的論文引起了不少轟動(dòng)。“Critic”是批評(píng)家的意思,這個(gè)AI模型的主要功能就是在RLHF訓(xùn)練中挑錯(cuò)。名副其實(shí)的“用魔法打敗魔法”。

截圖來(lái)自O(shè)penAI官網(wǎng)

根據(jù)OpenAI內(nèi)部訓(xùn)練師的分享,在找bug方面,人類(lèi)訓(xùn)練師的成功率是25%,而CriticGPT則達(dá)到了驚人的75%!這簡(jiǎn)直就是妥妥的斷人財(cái)路。

雖然, AI模型“抄近道”、幻覺(jué)等問(wèn)題還是困擾著這些AI巨頭,但網(wǎng)友們看到這些技術(shù)之后的第一反應(yīng)是:下一個(gè)被干掉的會(huì)不會(huì)就是AI訓(xùn)練師?

“prompt之類(lèi)的調(diào)試,肯定會(huì)往標(biāo)準(zhǔn)化的方向走。那么一旦標(biāo)準(zhǔn)化,訓(xùn)練師自然就沒(méi)啥價(jià)值了!贝髲S資深運(yùn)營(yíng)牛同學(xué)對(duì)PConline說(shuō)道。

“AI教父”吳恩達(dá)也曾表示過(guò),真正的AI不應(yīng)該是用prompt來(lái)調(diào)動(dòng),而是自然語(yǔ)言。這也就意味著,AI和實(shí)際使用的用戶(hù)之間應(yīng)該做到直接溝通,而不需要其它“橋梁”。

牛同學(xué)對(duì)PConline分享道,在身邊有很多朋友準(zhǔn)備考人工智能訓(xùn)練師的證書(shū),想要轉(zhuǎn)向AI賽道。但他給出的建議是不要“一股腦兒投入”,按照現(xiàn)在的技術(shù)發(fā)展速度來(lái)看,極有可能“還沒(méi)就業(yè),就先失業(yè)了”。

這便帶來(lái)新的迷思,身處AI領(lǐng)域的從業(yè)者,其實(shí)安全感并沒(méi)有保障,特別是重復(fù)類(lèi)的工作,只有能夠適應(yīng)市場(chǎng)需求的工作才更有發(fā)展?jié)摿,因(yàn)椤癆I訓(xùn)練可以標(biāo)準(zhǔn)化,但需求是一直在變的!

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
二維碼 回到頂部