No.0294
Science Partner
Bring you to the side of science
![]()
導(dǎo) 讀
旻宏跟你說(shuō)一個(gè)真實(shí)的荒唐事。
中部?jī)?nèi)陸一所職校,這兩年嗅到AI風(fēng)口,在能源轉(zhuǎn)型綠電豐富的一個(gè)城市火速開(kāi)了個(gè)幾個(gè)新專業(yè),名字起得很氣派“人工智能技術(shù)應(yīng)用“”數(shù)據(jù)科技服務(wù)”。招生老師跑進(jìn)每一個(gè)可以跑進(jìn)去的班級(jí),站在講臺(tái)上說(shuō):
“同學(xué)們,AI是未來(lái)。數(shù)據(jù)是AI的糧食。現(xiàn)在全國(guó)缺口超過(guò)百萬(wàn),你們只要學(xué)會(huì)打標(biāo)注,月薪四五千起步,穩(wěn)的。”
臺(tái)下坐著一批十六七歲的孩子還有他們的父母,聽(tīng)完覺(jué)得這事靠譜。反正聽(tīng)起來(lái)比那些明日黃花的老專業(yè)好聽(tīng)多了,名字里帶著AI,聽(tīng)上去就像站在了時(shí)代正中央。
于是第一屆招滿了。
兩年后,這批孩子畢業(yè)了。
有人發(fā)現(xiàn)工作沒(méi)著落,托關(guān)系問(wèn)了一圈,得到的答案大同小異:要么崗位縮編了,要么干脆說(shuō)“現(xiàn)在這塊大部分交給模型自動(dòng)跑了,你們來(lái)干嘛呢。”
整件事加在一起,從招生到失業(yè),不超過(guò)三年。
一個(gè)專業(yè)的壽命,比一些網(wǎng)紅餐廳還短。
這個(gè)世界、當(dāng)下的教育設(shè)置,到底怎么了...
走,跟伙伴君來(lái)!
今日主筆 | 旻宏
學(xué)校新開(kāi)了個(gè)AI專業(yè),第一屆學(xué)生剛畢業(yè),崗位已經(jīng)沒(méi)了
我知道您看到這里可能想說(shuō):這不就是個(gè)例嗎,哪個(gè)行業(yè)沒(méi)有這種情況?
但問(wèn)題是,這還真不是個(gè)例。
這兩年,全國(guó)陸續(xù)開(kāi)了幾百個(gè)類似的專業(yè)方向,名字各有變體:AI技術(shù)應(yīng)用、大數(shù)據(jù)標(biāo)注與處理、智能信息服務(wù)……核心內(nèi)容大同小異,都在教一件事:如何給AI打工。
學(xué)生學(xué)的是框圖標(biāo)注,是文本分類,是語(yǔ)音轉(zhuǎn)寫,是內(nèi)容審核。
然后他們走出校門,信心百倍。然后,他們發(fā)現(xiàn),這些工作,AI自己已經(jīng)能做了。
不是做得和他們一樣好,而是做得比他們更快、更便宜、更不需要交社保。
這就是今天職業(yè)教育里,最真實(shí)、最少人愿意正面講的那個(gè)問(wèn)題。
01. 你可能聽(tīng)過(guò)一個(gè)詞,叫“知識(shí)蒸餾”。
如果沒(méi)聽(tīng)過(guò),旻宏幫你翻譯一下:就是用大模型來(lái)教小模型,讓小模型花更少的錢,干跟大模型差不多的活。
這本來(lái)是AI公司壓縮成本用的技術(shù)。但這幾年它被玩出了一種更激進(jìn)的用法:各家公司開(kāi)始直接拿競(jìng)爭(zhēng)對(duì)手的模型輸出來(lái)當(dāng)訓(xùn)練數(shù)據(jù),喂進(jìn)自己的系統(tǒng)。
GPT的輸出喂給Llama,Llama的數(shù)據(jù)流進(jìn)Gemini,GEmini的輸出再轉(zhuǎn)手可能就成了下一代產(chǎn)品的語(yǔ)料。
整個(gè)AI行業(yè)的潛規(guī)則之一就是“互抄作業(yè)”。
而抄作業(yè)最直接的結(jié)果,就是原來(lái)需要大量人工來(lái)做的“數(shù)據(jù)生產(chǎn)工作”,正在被這個(gè)循環(huán)越來(lái)越多地內(nèi)化進(jìn)去。于是,那些職校開(kāi)出來(lái)的課程里,本來(lái)依賴的那層崗位需求,開(kāi)始快速萎縮。
學(xué)校不是沒(méi)努力,企業(yè)也不是臨時(shí)變卦,是整個(gè)行業(yè)底層的邏輯悄悄換了,而且換得太快,沒(méi)給任何人留太多反應(yīng)時(shí)間。
最慘的,是那些剛好在這個(gè)時(shí)間窗口里讀完兩年的孩子。
他們不是受害者,也談不上被誰(shuí)坑了。
他們只是,趕上了一個(gè)專業(yè)的有效期比他們的學(xué)制還短的年代。
02. 好消息是蒸餾這件事也有命門
要搞清楚這件事為什么會(huì)發(fā)生,我們得先想明白一個(gè)問(wèn)題:AI互相抄作業(yè),到底會(huì)抄出什么后果?
研究人員發(fā)現(xiàn),純合成數(shù)據(jù)的訓(xùn)練閉環(huán)是有極限的。這個(gè)現(xiàn)象有個(gè)專業(yè)名詞,叫模型坍塌(Model Collapse)。
打個(gè)比方吧。你把一張高清照片復(fù)印,再把復(fù)印件復(fù)印,再?gòu)?fù)印,再?gòu)?fù)印。前幾次看不出來(lái),但復(fù)印到二十次的時(shí)候,圖像已經(jīng)模糊到認(rèn)不出原來(lái)是什么了。
模型蒸餾的多代循環(huán),本質(zhì)上是同一個(gè)問(wèn)題。每轉(zhuǎn)一圈,都在累積誤差。幾代之后,模型開(kāi)始丟失那些只有在真實(shí)世界里才會(huì)出現(xiàn)的東西:文化細(xì)節(jié)、邊緣場(chǎng)景、人的真實(shí)判斷,以及那些很難被歸納成規(guī)律的、活生生的認(rèn)知復(fù)雜性。
特斯拉前AI總監(jiān),也是OpenAI的聯(lián)合創(chuàng)始人之一大神Karpathy專門說(shuō)過(guò)這件事。他的判斷是:純合成數(shù)據(jù)訓(xùn)練出來(lái)的模型會(huì)“靜默崩潰”,質(zhì)量不是一下子垮掉的,而是悄無(wú)聲息地在你看不見(jiàn)的地方慢慢爛掉。
你以為它還好,其實(shí)它已經(jīng)爛了。
所以模型互相抄作業(yè)的盡頭,不是徹底不需要人了,而是如果沒(méi)有高質(zhì)量的真實(shí)人類數(shù)據(jù)壓陣,整個(gè)鏈條最終會(huì)一起失效。
這也就是為什么,真實(shí)人類的高質(zhì)量判斷,在這個(gè)時(shí)代反而更值錢,但遺憾的是,值錢的,可能不是職校在教的那種。
03. 最先被吃掉的,恰好是最多學(xué)校在教的
數(shù)據(jù)標(biāo)注這門生意,過(guò)去幾年確實(shí)火過(guò)一陣。
邏輯很簡(jiǎn)單:大模型要吃大量數(shù)據(jù),數(shù)據(jù)要有人去分類、打標(biāo)簽、做審核。于是市場(chǎng)上出現(xiàn)了很多崗位,也出現(xiàn)了很多培訓(xùn)班、職校專業(yè)、校企合作項(xiàng)目。很多地方一看,這不就是新時(shí)代的就業(yè)出口嗎?
于是趕緊上馬。
這套判斷在當(dāng)時(shí)不能說(shuō)完全錯(cuò)。問(wèn)題在于,技術(shù)演進(jìn)的方向,比教育系統(tǒng)的反應(yīng)速度快得多。
現(xiàn)在模型已經(jīng)不只是需要人打標(biāo)簽,它自己也開(kāi)始會(huì)打標(biāo)簽、會(huì)生成候選答案、會(huì)做初步分類、會(huì)幫你篩一遍數(shù)據(jù)。更重要的是,行業(yè)正在從低成本人工堆量轉(zhuǎn)向高質(zhì)量人類校準(zhǔn)。換句話說(shuō),AI并不是把人徹底踢出去,而是把人從勞動(dòng)密集型那一層往上推了一層。
可職業(yè)教育最難受的地方就在這兒:它最容易批量培養(yǎng)的,恰恰是最容易被替代的那一層,就比如我們提到那家設(shè)在綠電替代火電城市的職校。
這就很尷尬了。
學(xué)校教學(xué)生怎么框圖、怎么分類、怎么轉(zhuǎn)寫、怎么做基礎(chǔ)審核;但行業(yè)真正缺的,慢慢變成了懂業(yè)務(wù)、會(huì)判斷、能質(zhì)檢、能仲裁的人。
一個(gè)是操作員,一個(gè)是把關(guān)人。這中間隔著一條很寬的河。
04. Scale AI為什么還值138億?
說(shuō)到這里不得不提一個(gè)人:Alexandr Wang,華裔,1997年生,19歲創(chuàng)業(yè),做的就是數(shù)據(jù)標(biāo)注生意,公司叫Scale AI,估值一度高達(dá)138億美元,后來(lái)還拿到了美國(guó)國(guó)防部的AI合同。
很多人聽(tīng)到這里會(huì)困惑:這行不是要完了嗎,他怎么還能值這個(gè)數(shù)?
原因在于,大多數(shù)人誤解了Scale AI賣的是什么。
它賣的不是便宜的人力,而是一套數(shù)據(jù)工程體系——如何組織一條高質(zhì)量的標(biāo)注管道,如何做質(zhì)量控制,如何讓數(shù)據(jù)和模型訓(xùn)練形成真正的閉環(huán),如何持續(xù)更新評(píng)測(cè)集和對(duì)齊反饋。
蒸餾時(shí)代,這套東西的價(jià)值反而在漲。
因?yàn)檎麄€(gè)蒸餾鏈條需要一個(gè)錨,那些被反復(fù)驗(yàn)證、質(zhì)量可靠、能防止模型漂移的高質(zhì)量人類數(shù)據(jù),是整個(gè)體系不塌的地基。沒(méi)有這個(gè)錨,合成數(shù)據(jù)訓(xùn)出來(lái)的模型就是那張被復(fù)印了二十次的照片。
所以到今天,行業(yè)里的共識(shí)是這樣的:合成數(shù)據(jù)管規(guī)模,人類標(biāo)注管質(zhì)量。兩者不是你死我活,是分工配合。
05. 職校這次撞上的,不只是行業(yè)變化
說(shuō)到這里,問(wèn)題就不只是“數(shù)據(jù)標(biāo)注行業(yè)會(huì)不會(huì)被替代”了,而是更扎心一點(diǎn):
職校到底是在培養(yǎng)一個(gè)學(xué)生,還是在押注一個(gè)崗位?
這兩者差別很大。
培養(yǎng)學(xué)生,意味著你面對(duì)的是長(zhǎng)期穩(wěn)定的技能需求輸出。押注崗位,意味著你默認(rèn)這個(gè)崗位在未來(lái)幾年里還會(huì)存在,而且數(shù)量還不少。
問(wèn)題在于,很多職業(yè)教育機(jī)構(gòu)的邏輯,其實(shí)更接近后者。
他們不是先研究未來(lái)三年的行業(yè)結(jié)構(gòu),再去設(shè)計(jì)課程;而是先看到一個(gè)崗位熱了、企業(yè)招人了、市場(chǎng)缺口大了,然后迅速把課程開(kāi)出來(lái)。動(dòng)作快的時(shí)候,確實(shí)能吃到紅利。可一旦行業(yè)變向,學(xué)校就會(huì)比公司更被動(dòng)。
公司不行,可以裁。學(xué)校不行,往往只能拖。而學(xué)生是最被動(dòng)的那個(gè)。
他花了兩年時(shí)間,學(xué)了一套當(dāng)時(shí)看起來(lái)很對(duì)的技能,最后發(fā)現(xiàn)這個(gè)技能還沒(méi)來(lái)得及成為自己的飯碗,就先變成了行業(yè)過(guò)渡期的臨時(shí)工具。
學(xué)生們這種落差,和實(shí)實(shí)在在搭進(jìn)去的時(shí)間,才是最傷人的。
因?yàn)樗皇恰澳悴慌Α保膊皇恰澳銓W(xué)不會(huì)”,而是你認(rèn)真學(xué)了,最后發(fā)現(xiàn)課程本身押錯(cuò)了方向。
最后問(wèn)一個(gè)真問(wèn)題:當(dāng)下職業(yè)教育最該重新思考的地方是什么
過(guò)去,很多職校強(qiáng)調(diào)的是上手快、能就業(yè)、證書好拿。這當(dāng)然沒(méi)錯(cuò),但前提是市場(chǎng)對(duì)基礎(chǔ)操作工的需求足夠大。
可現(xiàn)在不一樣了。
AI把很多基礎(chǔ)活兒做掉之后,真正留下來(lái)的,是更靠近判斷、質(zhì)檢、仲裁、反饋、行業(yè)知識(shí)的工作。未來(lái)更值錢的,不是“會(huì)不會(huì)按流程做”,而是“你知不知道這一步為什么要這么做”。
這對(duì)學(xué)校來(lái)說(shuō),意味著課程必須升級(jí):不能只教工具,要教方法;不能只教操作,要教理解;不能只教一個(gè)固定崗位,要教學(xué)生如何在崗位變化之后繼續(xù)活下去。
真正好的職業(yè)教育,不是給學(xué)生一張通往某個(gè)工位的門票,而是給他一套在崗位變化后還能重新站穩(wěn)的能力。
這才是關(guān)鍵!
我是旻宏,咱們下期見(jiàn)~
本文僅作科普分享使用,歡迎小伙伴們點(diǎn)、收藏、關(guān)注,以備不時(shí)之需,當(dāng)然更歡迎您把 介紹給周邊可能需要的更多伙伴們呀。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.