AI能連續(xù)工作16小時,人類出的考題不夠用了。
![]()
AI“考爆”了,不是它錯,是題太簡單
通用人工智能的到來,或許比我們預(yù)想的要快。至少在編程領(lǐng)域,變革的浪潮已經(jīng)清晰可見。
最近,一個名為Claude Mithras的模型,在權(quán)威評測中取得了令人震驚的成績。
這好比學(xué)霸與學(xué)神的區(qū)別:學(xué)霸考100分,是努力達(dá)到了極限;學(xué)神考100分,是因為試卷滿分只有100分。
評測機構(gòu)METR在測試新一代模型時,首次遇到了“測不準(zhǔn)”的情況。
并非模型出錯,而是人類設(shè)計的題庫已經(jīng)不夠用了。
你給孩子出考題,本來以為夠難了,結(jié)果孩子全對,不是他只會這么多,是你出的題最多就值這么多分。AI現(xiàn)在就是這樣。
過去,人們測試AI,主要看它能否解答單點問題,比如數(shù)學(xué)計算、代碼片段或語言理解。
但現(xiàn)在,新的測試方向聚焦于另一件事:AI能否像一個真正的員工一樣,連續(xù)、獨立地完成一項復(fù)雜任務(wù)。
例如,一個原本需要程序員花費數(shù)小時的工作,交給AI。
![]()
看它能否自己閱讀理解代碼庫、理解系統(tǒng)架構(gòu)、制定解決方案、調(diào)試錯誤,并最終完整交付。
這種獨立工作的持久力,被稱為“任務(wù)時間跨度”。
幾年前,AI只能處理幾秒鐘級別的任務(wù),比如寫一行代碼。
后來,進化到幾分鐘完成一個簡單函數(shù)。再后來,能花一小時搞定一個小模塊。
而最新一代的模型,其獨立工作時間已經(jīng)輕松超過16小時。
關(guān)鍵點來了:METR評測中最難的題目,耗時就是16小時。
所以,不是模型只能工作16小時,而是題庫里根本沒有更復(fù)雜的題目了。
這標(biāo)志著一個臨界點:AI開始突破人類為它設(shè)定的能力上限。
![]()
從“工具”到“員工”,AI角色變了
互聯(lián)網(wǎng)時代,自動化的是信息流轉(zhuǎn)。
AI時代,真正開始自動化的,是“認(rèn)知勞動”。
這種變化,在編程和網(wǎng)絡(luò)安全行業(yè)感受最為直接。
原本,AI編程是程序員的得力助手。但照此發(fā)展,未來可能真的不再需要那么多程序員了。
AI不僅能寫代碼,更能理解需求、設(shè)計架構(gòu)、持續(xù)調(diào)試,完成一個完整的開發(fā)閉環(huán)。
過去一個軟件開發(fā)團隊需要10個人,如果AI能獨立完成其中80%的工作,那還需要幾個人?
這不是危言聳聽,是正在發(fā)生的事。
網(wǎng)絡(luò)安全領(lǐng)域同樣如此。一些安全公司發(fā)現(xiàn),AI不再只是輔助人類尋找漏洞,而是能像經(jīng)驗豐富的高級黑客一樣,自動將多個微小漏洞串聯(lián)起來,形成完整的攻擊鏈。
過去一個團隊需要數(shù)周才能完成的滲透測試,AI可能只需幾小時甚至幾十分鐘。
![]()
這也催生了“用AI對抗AI”的新賽道:你拿AI攻擊,我就拿AI防守。
人跑不贏AI,但AI可以跑贏AI。
當(dāng)然,不必過度恐慌或神化。今天的AI依然會犯錯誤,會產(chǎn)生“幻覺”,會偏離軌道,也遠(yuǎn)未達(dá)到真正理解世界的人類級智能。
它距離所謂的“技術(shù)奇點”或“外星文明”般的超級智能,還有很長的路要走。
真正值得警惕的,是AI進步的速度和方式
但真正值得警惕的,不是AI是否已成“神”,而是它進步的速度和方式。
過去的AI,更像一個增強版的搜索引擎,有問必答。你問它問題,它給你答案。
未來的AI,將真正成為一個可以委派任務(wù)、獨立工作的數(shù)字員工。
你給它一個目標(biāo),它自己規(guī)劃路徑、執(zhí)行任務(wù)、交付結(jié)果。
更深層的問題是:如果AI未來開始自己研發(fā)更強的AI呢?
現(xiàn)在是人研發(fā)AI。如果AI的編程能力已經(jīng)超過人類,那它完全可以自己寫代碼、自己優(yōu)化自己。
到那時候,技術(shù)進步本身將被AI加速,其增長曲線可能不再是簡單的指數(shù)增長,而是“指數(shù)的指數(shù)”增長。
![]()
評測題庫被AI“打爆”,是一個極具象征意義的信號,它告訴我們?nèi)拢?/p>
變革已至,且正在加速。不是未來某一天,就是現(xiàn)在。
衡量AI的標(biāo)準(zhǔn)變了。從“會不會做這道題”變成了“能不能獨立完成一項工作”。
人類需要重新思考自己在工作中的位置。當(dāng)AI能連續(xù)工作16小時不休息、不出錯、不抱怨,人類的核心競爭力在哪里?
這不是要制造焦慮,而是提醒:適應(yīng)的最好時機是昨天,其次是現(xiàn)在。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.