字節(jié)要被取代了,取代它的是token。
Karpathy昨天在推上回了Python之父Guido一句話:LLM = CPU,Agent = 操作系統(tǒng)內(nèi)核。
但他補(bǔ)了一個(gè)很關(guān)鍵的細(xì)節(jié):
LLM處理的數(shù)據(jù)單位不是字節(jié),是token。
這個(gè)操作系統(tǒng)的運(yùn)行方式不是確定性的,而是統(tǒng)計(jì)性的。
這是一種底層計(jì)算的范式轉(zhuǎn)移。
![]()
過(guò)去六十年,計(jì)算機(jī)的世界建立在字節(jié)上。
一個(gè)字符8個(gè)bit,精確,確定,不會(huì)出錯(cuò)。你寫一個(gè)1,存進(jìn)去就是1,讀出來(lái)還是1。
整個(gè)互聯(lián)網(wǎng)、所有軟件、所有數(shù)據(jù)庫(kù),都建立在這種確定性上。
現(xiàn)在LLM來(lái)了。它的基本單位是token,不是字節(jié)。
token是模糊的,一個(gè)詞可能是一個(gè)token,也可能被拆成兩個(gè)。
它的輸出是概率性的,同一個(gè)輸入跑兩遍可能得到不同的結(jié)果。
這就像從牛頓力學(xué)進(jìn)入量子力學(xué)。
精確讓位于概率,確定讓位于統(tǒng)計(jì)。
Karpathy把LLM比作CPU,Agent比作操作系統(tǒng)內(nèi)核。
如果順著這個(gè)類比往下推:
傳統(tǒng)計(jì)算機(jī):CPU處理字節(jié) → 內(nèi)核調(diào)度進(jìn)程 → 操作系統(tǒng)服務(wù)用戶
AI時(shí)代:LLM處理token → Agent編排任務(wù) → AI OS服務(wù)用戶
底層的數(shù)據(jù)單位變了,上面的一切都得跟著變。
操作系統(tǒng)要重寫,軟件要重做,人和計(jì)算機(jī)的交互方式要重新設(shè)計(jì)。
與其說(shuō)是對(duì)上一代的升級(jí),不如說(shuō)是徹底換了軌道。
BYTE ERA ? TOKEN ERA
字節(jié)的世界里,誰(shuí)掌握更多的數(shù)據(jù)(字節(jié))誰(shuí)就贏。
token的世界里,誰(shuí)掌握更多的token誰(shuí)就贏。
字節(jié)的時(shí)代屬于互聯(lián)網(wǎng),token的時(shí)代屬于Agent。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.