<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      時薪800、學歷碩士起:大廠熱搶的AI數(shù)據“煉金師”到底在做什么?

      0
      分享至


      智東西
      作者 陳駿達
      編輯 心緣

      在公眾的傳統(tǒng)認知里,AI數(shù)據標注始終帶著某種“數(shù)字流水線”的色彩。

      它通常意味著坐在電腦前,重復處理著圖片、語音或文本,比如給自動駕駛圖像逐一框出行人與車輛,為語音系統(tǒng)一句句校對字幕,或者按照既定規(guī)則為數(shù)據打上標簽。其低門檻、低薪資、機械性的特質,堪比AI時代的“電子廠”。

      但當大模型浪潮席卷AI行業(yè)之后,數(shù)據標注行業(yè)開始出現(xiàn)一種出人意料的變化。雖然傳統(tǒng)數(shù)據標注工作仍有龐大需求,但越來越多AI企業(yè),尤其是頭部大模型廠商,正在尋找一種更有技術含量的新型標注員。

      如今,阿里、字節(jié)、DeepSeek、MiniMax等企業(yè)的一些相關崗位,不再冠以“數(shù)據標注”的名稱,而是改名為“數(shù)據百曉生”、“AI出題專家”、“數(shù)據煉金師”等等。

      能力要求也隨之變化。不少崗位的學歷要求提高到碩士及以上,擁有法律、金融、醫(yī)學、編程、語言學等專業(yè)背景,或是具備豐富從業(yè)經驗和競賽經歷的人才更為吃香。


      要求提升后,這些崗位的薪資待遇也有可觀的上浮。在Boss直聘等招聘平臺上,金融、法律、醫(yī)學等垂類任務已經出現(xiàn)每小時500-800元的報價。即便是在大廠做外包崗,這類崗位的月薪也從傳統(tǒng)數(shù)據標注三四千元的水平,提高到8000-10000元左右的水平。

      大模型時代的數(shù)據標注,正在成為一種復雜得多的職業(yè)。而這一變化背后,其實對應著AI產業(yè)自身的一次轉向。

      一、AI數(shù)據標注,為什么突然需要專家?

      大模型行業(yè)的數(shù)據供給模式,正在發(fā)生變化。

      早期大模型的訓練高度依賴海量公開數(shù)據,廠商抓取互聯(lián)網文本、圖片和視頻,讓模型學習語言規(guī)律與世界知識。在這一階段,算力、參數(shù)和數(shù)據規(guī)模很大程度上決定了模型能力上限,這也構成了預訓練階段的Scaling Law。

      然而,互聯(lián)網上的數(shù)據終歸是有限的。2024年,OpenAI前首席科學家Ilya Sutskever就曾提出一個觀點,互聯(lián)網上用于訓練模型的數(shù)據即將枯竭,這可能會終結我們過去所熟知的預訓練范式。

      具體到中文上,這一數(shù)據短缺的問題可能會更嚴重。阿里研究院發(fā)布的《大模型訓練數(shù)據白皮書》顯示,互聯(lián)網上中文語料和英文語料占比存在顯著差異,英文語料占比高達59.8%,而中文語料僅占1.3%。

      同時,互聯(lián)網數(shù)據并非天然的高質量資源,其中大量內容存在重復、噪聲、錯誤甚至相互矛盾的語料。模型可以靠互聯(lián)網數(shù)據學習語言模式,卻未必能夠形成可靠判斷。


      ▲某大廠的數(shù)據標注崗位要求中,提到了高質量中文數(shù)據的短缺

      合成數(shù)據雖被視為緩解這一問題的路徑,但難以根本解決問題。模型生成的數(shù)據受限于自身能力邊界,可以擴展已有知識,卻難以創(chuàng)造超出自身認知的判斷標準。

      因此,后訓練階段的Scaling逐漸成為行業(yè)重點。這一階段,模型能力的提升越來越依賴人工反饋,包括模型評測、偏好數(shù)據構建以及RLHF等工作。模型需要人類告訴它,什么答案更優(yōu),什么邏輯更符合現(xiàn)實,什么表達更符合專業(yè)標準。

      而在金融、法律、醫(yī)療等專業(yè)領域,以及推理、創(chuàng)意寫作等復雜任務中,只有具備深厚專業(yè)知識和判斷能力的人,才能產出真正高質量的數(shù)據,反哺模型的能力提升。

      二、時薪可達500元,但學歷并非通關密碼

      隨著后訓練重要性的持續(xù)提升,從2025年下半年開始,字節(jié)、阿里等國內大廠和DeepSeek、MiniMax、智譜等AI頭部廠商,陸續(xù)在招聘平臺、高校社群和社交媒體上宣傳自家的專家數(shù)據平臺或是高級數(shù)據標注崗位,吸引更多專業(yè)人才加入。

      為了理解這類新型數(shù)據標注工作的具體內容,智東西采訪了兩位參與者。他們進入行業(yè)的路徑不同,所處職業(yè)階段也不相同,對工作的感受更存在明顯差異,但都在參與同一件事:幫助模型學習如何判斷、理解與表達。

      去年,擁有十多年金融和互聯(lián)網從業(yè)經歷的Molly,在社交平臺上看到字節(jié)專家數(shù)據平臺Xpert的招募信息后,隨即投遞了簡歷。

      ▲字節(jié)專家數(shù)據標注平臺Xpert

      真正進入平臺之前,她首先需要通過測試。候選人不僅要證明自身專業(yè)背景,還需要設計能夠“難倒模型”的問題。平臺會同時調用多個模型進行驗證,只有當至少兩個模型回答失敗時,題目才有機會被認定為有效。

      Molly并不覺得測試困難,但她也觀察到,不少參與測試的候選人會卡在這一環(huán)節(jié)。在她看來,原因并不只是學歷高低,而是真實行業(yè)經驗的差異。“很多碩博學生沒有真正的從業(yè)經歷,所以很難設計出有行業(yè)深度的問題?!彼f。

      最終,Molly進入了商科與金融方向的專家任務組。她提到,這類任務往往對應真實業(yè)務場景。以投資盡調場景為例,多種模型會模擬機構對項目開展評估,圍繞風險、運營與商業(yè)可行性生成數(shù)份上萬字分析報告。

      而她的工作,則是以金融從業(yè)者的視角,對這些結果進行比較與判斷:哪份分析更符合真實業(yè)務邏輯,風險識別是否充分,評估框架是否貼近實際決策流程。完成選擇之后,工作并未結束。她還需要進一步拆解判斷過程,從多個維度解釋依據,并指出其他答案存在的問題。

      這類任務采用時薪制,根據測試結果和專業(yè)能力進行分級。Molly觀察到,在金融方向,300元至500元時薪并不罕見。

      需要補充的是,這份工作的時薪并不能直接換算為月薪,其薪酬完全與工作量掛鉤,專家每天接多少任務、平臺每天放多少任務,都會影響專家在一段時間內的總收入。

      在Xpert上,大多數(shù)任務都可以在線完成,但需要全程錄屏以防作弊,確保判斷來自真實專家,而非其他AI工具。

      在Molly看來,這份工作的核心能力要求并不是學歷,而是長期積累的行業(yè)經驗,真正做過投資、做過評估,才知道模型的問題在哪。

      除了金融相關任務,Molly有時也會主動選擇一些時薪較低的邏輯題。在她眼里,這些任務更像桌游,因此做起來頗有趣味。

      談起這些經歷時,Molly始終帶著一種明顯的興奮感。我們問她是否享受這份工作,她幾乎沒有猶豫地說道:“很快樂。”

      三、創(chuàng)意外殼之下,數(shù)據標注仍是流水線?

      不是所有人都像Molly那樣,將這份工作視為享受。

      畢業(yè)于中國礦業(yè)大學的淵星在2025年5月以外包身份進入一家互聯(lián)網大廠,從事AI小說方向的標注工作,半年后離職。這是他人生中的第一份工作。他說:“在入職之前,我沒有任何工作經驗,也沒有做過數(shù)據標注?!?/p>

      他所在的AI小說項目組剛成立不久,正處于缺人階段。相比成熟團隊優(yōu)先招募有標注經驗的從業(yè)者,這個組更看重寫作背景。

      淵星恰好符合這一點。他有出版經歷,也拿過一些寫作獎項,因此即使缺乏標注經驗,仍順利通過面試進入團隊。

      但真正入職后,他發(fā)現(xiàn),這份工作的實際內容與外界對“AI小說”的想象并不完全一致:拋去創(chuàng)意工作的外殼,其本質上是一套高度細分的數(shù)據生產流程。

      淵星所在的團隊需要同時處理多個模型生成結果:同一個小說指令會被交給該大廠的模型以及其他競品模型作答,標注員則負責逐條閱讀、比較,并依據規(guī)則判斷問題所在。

      這份工作對專業(yè)能力有著不低的要求。團隊里有大概一半人干過編劇,其他人則有網文創(chuàng)作、媒體投稿的經歷,標注員需要判斷人物行為是否符合設定、劇情推進是否合理、沖突是否成立,一切都被拆解成細致的評分標準。

      完成問題識別后,標注員還要給模型輸出打分,并在部分項目中對文本進行人工改寫,刪除冗余描寫、修補邏輯漏洞,或重新調整結構。其中一項工作是為長篇小說“抽細綱”。一部十幾章、上萬字的小說,需要被逐章提煉成結構化大綱,再作為模型擴寫和訓練的數(shù)據輸入。

      從本質上來看,這更像一種需要文學判斷力的流水線工作,任務高度重復、標準化。淵星認為,標注員在生態(tài)鏈中的位置很低。

      淵星稱,他的工作時間是每天上午9:30到晚上6:30,中午有90分鐘休息時間,上下班時間彈性,基本不會加班。

      盡管對文學審美和寫作能力有一定要求,但淵星的薪資水平并不高。他在北京工作,每月到手收入約為8000元,五險一金按當?shù)刈畹蜆藴世U納。

      四、同一份數(shù)據標注,不同的職業(yè)現(xiàn)實

      同樣從事數(shù)據標注,Molly與淵星卻身處兩個截然不同的世界:一邊是高度專業(yè)、能獲得價值感的崗位,另一邊雖也有專業(yè)性要求,卻更像是枯燥壓抑的流水線。

      這種分化,也塑造了他們對AI行業(yè)完全不同的理解。

      Molly對這份工作抱有明顯認同。在她看來,制造數(shù)據、訓練AI本質上是一種知識共享過程。金融專家、法律專家、心理咨詢師都在向模型輸入經驗,而模型再以更低成本回流給社會。

      在過去一年里,她明顯感受到模型迭代越來越快。金融領域里,監(jiān)管規(guī)則和行業(yè)變化頻繁,而早期模型經常無法識別這些變化,如今類似問題已經減少。

      除了標注工作外,Molly還將AI應用到了她的另一個身份上。她經營著一家心理咨詢工作室,過去,咨詢師需要花費大量成本尋求專業(yè)督導(由經驗豐富的咨詢師對其他咨詢師的工作進行評估和支持),而現(xiàn)在,她開始借助模型完成部分督導的需求。

      她相信,這會讓專業(yè)服務變得更加普惠。

      淵星的感受則更克制。他承認模型在進步,但這種進步并不總是直觀,尤其在小說領域,半年時間里,他并未看到令人驚艷的變化。

      更重要的是,他始終難以確認自己的勞動究竟產生了多大作用。模型吸收的是海量數(shù)據,而他處理的只是極小部分。即便模型提升,他也無法清楚判斷,哪些改變真正來自自己的工作。

      這種感覺,他形容為“黑箱”。勞動存在,但成果距離自己很遠。

      淵星還在他的敘述中提到一個體驗——“被挑刺”。在日常工作中,數(shù)據必須經過質檢員修改才能提交。質檢員每改完一篇,都會在群里@標注員并指出問題,群里幾乎全是問題反饋,從不說哪里寫得好。

      然而,在小說標注這種高度主觀的任務中,所謂“錯誤”并不總是絕對的,而更像是不同理解之間的差異。但在流程中,它仍然會被呈現(xiàn)為需要修正的問題。

      淵星觀察到,很多標注員在工作中開始懷疑自己的價值,他們所處的工作氛圍也比較壓抑。在他工作的半年時間里,有兩位同事因此離職。

      結語:誰在教會AI理解世界

      如何高效地組織人類經驗,正成為大模型下一階段競爭的關鍵因素。在這一過程中,像Molly和淵星這樣的參與者,構成了連接模型與真實行業(yè)經驗的關鍵節(jié)點:他們將自身的專業(yè)知識與判斷能力,按照易于模型理解與吸收的形式重新組織,再注入訓練與反饋流程之中。

      在大模型時代,這項工作不再以相對單一、固定的形態(tài)存在,而是被進一步細化、拆解。從通用標注走向領域分工,從簡單判斷走向復雜推理,從結果打分走向過程解釋,數(shù)據生產正在形成更精細的任務鏈條。

      與此同時,也需要看到這種新型知識工作給人帶來的差異體驗。有人在其中獲得價值感,也有人在重復與標準化流程中被消耗。如何讓人的經驗被更有尊嚴地對待、讓專業(yè)判斷的價值被更清晰地看見,正在成為這個新生產體系中無法回避的問題。

      注:Molly、淵星均為化名

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      伊朗最新和平方案曝光 濃縮鈾只能運往俄羅斯

      伊朗最新和平方案曝光 濃縮鈾只能運往俄羅斯

      看看新聞Knews
      2026-05-19 23:30:31
      正常人都看出不對勁了,他們還在“裝瞎”

      正常人都看出不對勁了,他們還在“裝瞎”

      走讀新生
      2026-05-18 20:34:55
      史上最割裂牛市!十幾年股齡,從未見過這般行情

      史上最割裂牛市!十幾年股齡,從未見過這般行情

      財經智多星
      2026-05-16 12:32:25
      上海申花2-2武漢三鎮(zhèn),賽后評分出爐:武漢三鎮(zhèn)7號排第一

      上海申花2-2武漢三鎮(zhèn),賽后評分出爐:武漢三鎮(zhèn)7號排第一

      側身凌空斬
      2026-05-20 21:43:56
      北京協(xié)和專家:2塊錢的維生素B12,是失眠的頂尖藥,便宜又管用!

      北京協(xié)和專家:2塊錢的維生素B12,是失眠的頂尖藥,便宜又管用!

      健康科普365
      2026-05-19 09:25:22
      中國人最尊敬的清華校長攜巨款逃去美國,如今驚人秘密浮出水面

      中國人最尊敬的清華校長攜巨款逃去美國,如今驚人秘密浮出水面

      隨夢而飛起
      2026-05-20 07:05:31
      “訂單排到2027年”!除了芯片,它也爆火!全球資本涌入

      “訂單排到2027年”!除了芯片,它也爆火!全球資本涌入

      環(huán)球網資訊
      2026-05-19 19:45:56
      川普發(fā)15圖諷刺,解放軍75厘米裝備強勢回應

      川普發(fā)15圖諷刺,解放軍75厘米裝備強勢回應

      淚滿過眼
      2026-05-19 15:57:33
      云南一醫(yī)院發(fā)生一級甲等醫(yī)療事故

      云南一醫(yī)院發(fā)生一級甲等醫(yī)療事故

      護士網
      2026-05-20 23:15:40
      俄羅斯油庫被炸后保險不賠,法院一句“沒打仗”讓保險不用賠

      俄羅斯油庫被炸后保險不賠,法院一句“沒打仗”讓保險不用賠

      桂系007
      2026-05-20 23:56:43
      澳大利亞球探:這支中國U17是我見過最強的中國青年隊

      澳大利亞球探:這支中國U17是我見過最強的中國青年隊

      狗哥是一名內拉
      2026-05-20 15:19:47
      陳盈駿5犯怒拍廣告牌,趙睿5犯卻開心大笑,郭士強還敢要趙睿嗎?

      陳盈駿5犯怒拍廣告牌,趙睿5犯卻開心大笑,郭士強還敢要趙睿嗎?

      劉哥談體育
      2026-05-21 00:10:41
      于娜節(jié)目公開胖到230斤的原因,和媽媽同住,不吃主食一頓吃5個菜

      于娜節(jié)目公開胖到230斤的原因,和媽媽同住,不吃主食一頓吃5個菜

      做一個合格的吃瓜群眾
      2026-05-20 17:40:58
      20年青春堅守!C羅加冕歷史首位六戰(zhàn)世界杯球員,鑄就不朽傳奇!

      20年青春堅守!C羅加冕歷史首位六戰(zhàn)世界杯球員,鑄就不朽傳奇!

      田先生籃球
      2026-05-19 22:48:12
      我敢保證99%的男人會選白衣服女孩做老婆,看她氣質面相旺夫相

      我敢保證99%的男人會選白衣服女孩做老婆,看她氣質面相旺夫相

      匹夫來搞笑
      2026-05-01 11:34:58
      “養(yǎng)肥了再殺”?一場持續(xù)70年的獵殺,可口可樂在印度到底有多慘

      “養(yǎng)肥了再殺”?一場持續(xù)70年的獵殺,可口可樂在印度到底有多慘

      老謝談史
      2026-05-20 17:29:57
      美國將嚴查非美籍人員在美銀行業(yè)務

      美國將嚴查非美籍人員在美銀行業(yè)務

      新京報
      2026-05-20 16:30:29
      汪小菲成功逆襲!資產飆到 25-30 億,開勞斯萊斯,馬筱梅是幕后功臣

      汪小菲成功逆襲!資產飆到 25-30 億,開勞斯萊斯,馬筱梅是幕后功臣

      八卦王者
      2026-05-19 15:45:14
      溫情論調下暗藏性別歧視禍根

      溫情論調下暗藏性別歧視禍根

      烽火瞭望者
      2026-05-20 06:23:57
      內蒙古女籃被重罰:剝奪亞軍罰款100萬 兩人終生禁賽+1人禁賽3年

      內蒙古女籃被重罰:剝奪亞軍罰款100萬 兩人終生禁賽+1人禁賽3年

      醉臥浮生
      2026-05-20 12:27:02
      2026-05-21 01:24:49
      智東西 incentive-icons
      智東西
      智東西,AI產業(yè)新媒體,專注報道人工智能的前沿技術發(fā)展,和技術應用帶來的千行百業(yè)產業(yè)變革。
      11861文章數(shù) 117078關注度
      往期回顧 全部

      科技要聞

      一文看懂谷歌I/O2026:谷歌打響智能體大戰(zhàn)

      頭條要聞

      楊梅被"一刀切"禁入 福建楊梅協(xié)會會長懇求給果農生路

      頭條要聞

      楊梅被"一刀切"禁入 福建楊梅協(xié)會會長懇求給果農生路

      體育要聞

      尼克斯贏下最窒息的一場翻盤,場場都是逆天局

      娛樂要聞

      王菲“沒事兒”,成年人學不來的松弛

      財經要聞

      白酒榜|汾酒營收凈利雙增 口子窖"造富"

      汽車要聞

      26.98萬起步 看小鵬GX如何詮釋一車多能以及滿配的科技與豪華

      態(tài)度原創(chuàng)

      藝術
      家居
      游戲
      親子
      軍事航空

      藝術要聞

      刪掉色彩后,她的身體只剩靈魂在呼吸——貝納姆黑白人像,看完失眠!

      家居要聞

      日常印記 靜謐溫馨

      活了30年,我才知道自己居然有深??謶职Y?

      親子要聞

      以愛為誓、以檢護航:婚孕檢,最實在的健康保障!

      軍事要聞

      俄媒盛贊中國軍人:身姿挺拔 站如松柏

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美不卡无线在线一二三区观| 中文成人无码精品久久久| 一本色道综合久久欧美日韩精品| 一区二区三区四区精品国产| 无码人妻网站| 成人免费视频一区二区三区| 自拍视频啪| 中文字幕乱码日本道在线观看 | 国产一区二区三区精品综合| 婷婷激情综合| 亚洲xxxxx| 中出极品日本女| 国产精品猎奇系列在线观看| 少妇人妻偷人一区二区| 少妇高潮水多太爽了动态图| 亚洲国产午夜精品福利| 亚洲成av人片天堂网站| 国产精品福利一区二区在线播放| 福利一区二区视频在线| 制服丝袜先锋影音| 久久大香伊蕉在人线免费AV| 日本亚洲一区二区精品| 免费av网站| 无码人妻精品区二区蜜桃91| 国产999精品成人网站| 国精产品一品二品国精在线观看| 一区二区三区久久精品国产 | gv天堂gv无码男同在线| 久久精品免视看国产成人| 亚洲一区二区精品极品| 色天使色偷偷色噜噜| 互助| 日韩精品亚洲精品第一页| 狼友视频网站| 日韩有码中文字幕av| 天堂va蜜桃一区二区三区| 精品亚洲欧美无人区乱码| 人妻另类综合| 欧美老肥妇性疯狂视频| 99精品视频手机在线观看| A男人的天堂久久A毛片|