網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

13小時(shí)不眠不休，300個(gè)分身狂敲代碼！開源第一易主了

2026-04-27 19:43:19　來(lái)源: 賴博士說(shuō)

香港舉報(bào)

分享至

開源AI王座一夜易主！Kimi K2.6出道即巔峰，展示了恐怖的「全棧交付」能力。它不僅能復(fù)刻高盛研報(bào)、手搓奢華官網(wǎng)，甚至能和人類在群組里并肩打工。

開源模型追平甚至反超閉源三巨頭，這件事真的發(fā)生了。

4月20日深夜，Kimi K2.6出道即開源。

HLE「人類最后的考試」54.0分，碾壓GPT-5.4和Claude Opus 4.6
SWE-Bench Pro軟件工程實(shí)戰(zhàn)58.6分，超過(guò)GPT-5.4的57.7
Terminal-Bench終端編碼66.5分，而GPT-5.4只有60.4
Artificial Analysis評(píng)測(cè)中，更是直接坐上了世界開源第一王座

但我們今天拋開跑分，只聊一件事：K2.6到底能干出什么活。

#01

代碼寫完了，設(shè)計(jì)也交了

首先，讓K2.6 Agent制作一個(gè)近地軌道旅行公司ORBITAL的官網(wǎng)，要求植入太空艙座位選擇和航班預(yù)訂功能。

打開的瞬間，商業(yè)航天的高級(jí)感直接拉滿。

全屏視頻背景是太空艙窗口視角，地球弧面緩緩轉(zhuǎn)過(guò)，大氣層邊緣泛著藍(lán)光。

右下的飛行數(shù)據(jù)面板用等寬字體列出關(guān)鍵參數(shù)，左上的熒光青小圓點(diǎn)在緩慢呼吸閃爍，模擬系統(tǒng)在線狀態(tài)。

往下滑動(dòng)，是一條垂直時(shí)間線驅(qū)動(dòng)的飛行敘事。

從T-60:00在樟宜航天港換上定制加壓服，到T+03:00推進(jìn)階段承受過(guò)載，到T+08:00零重力開始，一直到T+92:00 Touchdown，太空艙濺落海面，回收潛水員圍上來(lái)。每個(gè)階段帶一個(gè)橙色關(guān)鍵數(shù)據(jù)和AI生成的場(chǎng)景配圖。

一段prompt，一次生成，從品牌視覺(jué)系統(tǒng)到可交互的艙位SVG圖，全部到位。

K2.6 Agent做出來(lái)的不只是好看的前端，它能做全棧交付。

后臺(tái)的航班預(yù)訂系統(tǒng)是真的能跑的。選日期、挑座位、填乘客信息，預(yù)約數(shù)據(jù)做了持久化存儲(chǔ)，每航班6座上限，滿了自動(dòng)鎖定。

這個(gè)網(wǎng)站不是一個(gè)「看樣子」的空殼，它帶著完整的后端邏輯。

換個(gè)題材。

同樣的prompt結(jié)構(gòu)，K2.6 Agent產(chǎn)出了深海探索研究機(jī)構(gòu)「THALASSA」的官網(wǎng)。

首屏運(yùn)鏡從北大西洋海面垂直下沉入水，穿過(guò)水線的瞬間畫面一分為二，藍(lán)色從淺到深漸變，遠(yuǎn)處墨藍(lán)中亮著兩點(diǎn)暖黃色潛水器燈光。

三臺(tái)潛水器參數(shù)卡片精確到推進(jìn)方式和觀察窗尺寸，6種深海生物各占一屏。田野筆記區(qū)三篇文章分別署名首席科學(xué)家、海洋生物學(xué)家和紀(jì)錄片導(dǎo)演。

奢侈香水品牌?THER的官網(wǎng)，K2.6 Agent在「極致美學(xué)」上的統(tǒng)治力展現(xiàn)得最充分。

只見一支琥珀色香水瓶在大理石臺(tái)面上，瓶?jī)?nèi)液體緩慢旋轉(zhuǎn)，光線穿透玻璃投射出焦散紋。

「?THER」五個(gè)字母用Cormorant Garamond襯線體疊在瓶身上。La Collection區(qū)展示5款香水，可拖拽切換。

5款香水、5套完整香調(diào)金字塔、5句手寫文案、5張各不相同的瓶身圖。

這些網(wǎng)站能做到這個(gè)水準(zhǔn)，背后是K2.6模型加上Kimi Agent 模式 harness 的實(shí)力。超過(guò)了 Google AI Studio中的Gemini 3.1 Pro。

產(chǎn)出的是可以直接丟進(jìn)項(xiàng)目的React組件和HTML/CSS代碼，帶動(dòng)畫關(guān)鍵幀、hover狀態(tài)、滾動(dòng)觸發(fā)動(dòng)效，甚至拖拽界面和多步表單，跟靜態(tài)Mockup完全兩碼事。

前端編碼的審美是 Kimi 從 K2.5 就開始卷的能力，到 K2.6 又券出了新境界。沒(méi)猜錯(cuò)的話，這應(yīng)該是楊植麟在2025年底內(nèi)部信中提到的agent產(chǎn)品taste之一？

#02

300個(gè)Agent，4000步，一次交付

1T巨量參數(shù)，每個(gè)token只激活32B的開源MoE，384個(gè)專家選8個(gè)激活。

連續(xù)編碼13小時(shí)不斷線，單次修改超過(guò)4000行代碼。

內(nèi)部實(shí)測(cè)中自主重構(gòu)了一個(gè)8年歷史的金融撮合引擎，峰值吞吐量漲了133%。

有了這個(gè)底子，Agent集群才真正有了用武之地。

長(zhǎng)程編碼解決「一個(gè)人能干多久」，Agent集群解決「一支團(tuán)隊(duì)能做多大的事」。

K2.5時(shí)代是100個(gè)子Agent、1500步。K2.6直接拉到300個(gè)子Agent、4000步。

不同技能特長(zhǎng)的Agent互補(bǔ)協(xié)作，一次運(yùn)行就能交付從文檔到網(wǎng)頁(yè)、從PPT到表格的全套產(chǎn)物。

過(guò)去丟給Kimi一個(gè)復(fù)雜任務(wù)，它一個(gè)人從頭干到尾，遇到不擅長(zhǎng)的環(huán)節(jié)就可能卡住。現(xiàn)在它會(huì)自己拆活、組隊(duì)、分頭干，每個(gè)子Agent專攻自己擅長(zhǎng)的那塊，最后匯總交付。

Claw Bench的內(nèi)部測(cè)試結(jié)果顯示，K2.6在無(wú)需人工干預(yù)的長(zhǎng)時(shí)間自主運(yùn)行場(chǎng)景中提升尤為明顯。

在自主Agent場(chǎng)景中，K2.6與OpenClaw、Hermes Agent配合可長(zhǎng)達(dá)5天持續(xù)自主運(yùn)行。

這個(gè)「集群」到底能干什么？我們做了三輪測(cè)試。

30個(gè)Agent寫30座城市的凌晨四點(diǎn)

首先，讓Agent們化身為30座城市在凌晨四點(diǎn)仍然醒著的一個(gè)人。

拉各斯的發(fā)電機(jī)維修工、孟買的送報(bào)員、里約的沙灘清潔工、新加坡的港口調(diào)度員、舊金山的程序員、馬尼拉呼叫中心的夜班接線員……

每人寫一段200字以內(nèi)的第一人稱片段，只寫動(dòng)作和感官，禁止出現(xiàn)「孤獨(dú)」「寂寞」等直白情感詞。

這類任務(wù)的難點(diǎn)不在單篇文字，而是30篇之間不能撞。

拉各斯維修工寫的是「柴油滴在指關(guān)節(jié)上，油膜裹住皮膚的紋理，滑膩的觸感像涂了一層冷蠟。我握緊扳手，將十六毫米套筒扣住螺栓，順時(shí)針擰動(dòng)，金屬與金屬碰撞出咔噠咔噠的咬合聲」。

舊金山程序員寫的是「Cherry青軸的咔噠聲在黑暗里格外脆。食指敲下回車，藍(lán)光從屏幕撲到臉上，眼皮被刺得一緊」。

馬尼拉接線員寫的是「隔斷板上女兒的相片邊角翹起來(lái)了，我用小拇指把它按平，膠紙的粘性不夠了」。

感官錨點(diǎn)沒(méi)有一個(gè)重復(fù)，每頁(yè)的背景圖也是匹配生成的。30張圖30種氣氛，視覺(jué)風(fēng)格統(tǒng)一在深夜的暗調(diào)里。

Skill × Agent集群，復(fù)刻高盛研報(bào)

Agent集群負(fù)責(zé)干活，但「按什么標(biāo)準(zhǔn)干」還需要一個(gè)東西來(lái)定義。

Kimi Agent的技能（Skill）就是干這個(gè)的。

系統(tǒng)內(nèi)置了上百個(gè)官方推薦技能包，用戶也可以自己創(chuàng)建，輸入斜杠「/」即可調(diào)用。

兩者疊在一起會(huì)怎樣？

我們上傳一份高盛的研究報(bào)告，讓Kimi K2.6分析架構(gòu)、語(yǔ)言風(fēng)格，并總結(jié)出一個(gè)Skill。

做好之后，就可以直接調(diào)用這個(gè)最新的技能goldman-research-report，讓Kimi K2.6做一份類似的調(diào)研報(bào)告：

2026年的硅谷AI競(jìng)爭(zhēng)格局，需要提及Anthropic、OpenAI、谷歌、xAI、Meta。

命令一發(fā)出，一大批Agent全部上線，每一人分工任務(wù)明確。

比如，納什負(fù)責(zé)OpenAI、唐墨負(fù)責(zé)Anthropic、逸飛谷歌、莉香xAI、胡博士Meta......

然后，這些Agent團(tuán)隊(duì)分別開始推進(jìn)自己的子任務(wù)的報(bào)告，每一個(gè)完成后，都會(huì)主動(dòng)匯報(bào)已完成。

調(diào)研完成后，進(jìn)入交叉驗(yàn)證階段，素材事實(shí)性沒(méi)有問(wèn)題后，交由「高盛報(bào)告撰寫員Agent」再次分配任務(wù)。

最后，就得到了一份非常詳實(shí)，且1:1復(fù)刻「高盛風(fēng)格」的硅谷局勢(shì)分析的Word版報(bào)告。

一次出三件套，跨文檔數(shù)據(jù)零誤差

加大難度。

這次要求Agent集群一次性交付PDF深度報(bào)告、Excel數(shù)據(jù)底表和英文PPT三件套，主題是全球AI基礎(chǔ)設(shè)施競(jìng)爭(zhēng)情報(bào)，覆蓋芯片、云計(jì)算、數(shù)據(jù)中心、網(wǎng)絡(luò)設(shè)備四個(gè)層級(jí)的60家企業(yè)。

Agent集群跑完后交付了一份76頁(yè)的PDF、一份Excel底表和一套PPT。

PDF采用摩根士丹利藍(lán)皮書風(fēng)格，內(nèi)容細(xì)到芯片架構(gòu)的算力密度公式和NVIDIA B200 vs AMD MI350X的參數(shù)對(duì)比表。

同樣的，系統(tǒng)也自動(dòng)做了跨文檔一致性驗(yàn)證，五項(xiàng)檢查，全部綠勾。

60家企業(yè)的名稱和數(shù)據(jù)，在PDF、Excel、PPT里對(duì)得上每一個(gè)數(shù)字。

這種「交付即可審計(jì)」的完成度，放在真人團(tuán)隊(duì)里都不一定做得到。

#03

One More Thing

Agent集群讓AI學(xué)會(huì)了自動(dòng)化分工。

但下一步的問(wèn)題更大，能不能把人類和各種不同來(lái)源的Agent放在一個(gè)群組里，像真正的團(tuán)隊(duì)一樣協(xié)作？

人類統(tǒng)治地球靠的是大規(guī)模協(xié)作，單個(gè)人打不過(guò)老虎。

AI Agent走向?qū)嵱没苍谧咄瑯拥穆罚瑥膫€(gè)體智能到群體智能，再到人機(jī)混合智能。

Kimi團(tuán)隊(duì)的答案叫「Claw群組」，目前已開啟小范圍內(nèi)測(cè)。

用戶可以接入來(lái)自任何設(shè)備、任何供應(yīng)商、運(yùn)行任何模型的龍蝦，每個(gè)龍蝦攜帶各自的工具包、技能和持久化記憶。首批兼容OpenClaw，后續(xù)會(huì)加入Hermes Agent等框架。

無(wú)論部署在本地筆記本、手機(jī)還是云端，都能進(jìn)入同一個(gè)協(xié)同辦公群組。

K2.6在群組中擔(dān)任協(xié)調(diào)者（包工頭），根據(jù)Agent的技能畫像動(dòng)態(tài)匹配任務(wù)。人類是下達(dá)任務(wù)的甲方。

當(dāng)某個(gè)Agent故障或停滯時(shí)，協(xié)調(diào)者自動(dòng)重新分配任務(wù)或生成子任務(wù)，對(duì)交付物全生命周期進(jìn)行主動(dòng)管理。

Kimi自己的營(yíng)銷團(tuán)隊(duì)已經(jīng)在用Claw群組跑內(nèi)容生產(chǎn)流水線。有人教自己的蝦學(xué)會(huì)了剪視頻，有人教自己的蝦調(diào)研社媒熱帖，有人的蝦是做Benchmark圖的好手……那為什么不把他們拉到一個(gè)群里干活。

Demo Maker、Benchmark Maker、Social Media Agent、Video Maker各司其職，K2.6做全局協(xié)調(diào)，從創(chuàng)意到成品一條線拉通。

從一個(gè)Agent做一件事，到300個(gè)Agent做一套事，到人類和Agent坐進(jìn)同一個(gè)群里一起干活……進(jìn)化的從來(lái)不是技術(shù)，而是“我們“的邊界。

公眾號(hào)最近更改了推送規(guī)則，不再按時(shí)間順序推送，而是根據(jù)人工智能算法有選擇性向用戶推送，有可能以后你無(wú)法看到賴博士的文章推送了。

解決方法是將《賴博士說(shuō)》的公眾號(hào)“星標(biāo)”，順手點(diǎn)下文末右下角的“在看”，系統(tǒng)會(huì)默認(rèn)我們公眾號(hào)的文章符合你的喜好，以后賴博士的文章就會(huì)在第一時(shí)間推送到你面前。

賴博士說(shuō)

幫你站在高處，重新理解財(cái)富

賴博士說(shuō)

公眾號(hào)：@賴博士說(shuō)

視頻號(hào)：@賴博士說(shuō)

小紅書：@賴博士說(shuō)

今日頭條：@賴博士說(shuō)

Youtube：@賴博士說(shuō)

免責(zé)聲明：本公眾微信平臺(tái)“賴博士說(shuō)”所載的資料及說(shuō)明只可作一般性參考資料來(lái)閱讀。平臺(tái)不會(huì)就文章內(nèi)資料、或因使用此等資料之正確性、準(zhǔn)確性、可靠性或其他方面所導(dǎo)致的后果作出任何保證或其他聲明。平臺(tái)有酌情權(quán)隨時(shí)刪除、暫時(shí)停載或修改本帳號(hào)上的各項(xiàng)資料而無(wú)須給予任何通知或理由。若資料內(nèi)容涉及產(chǎn)品資料，一概只可作一般性參考且并非適用于各產(chǎn)品及服務(wù)的所有條款及細(xì)則。詳細(xì)資料請(qǐng)參閱有關(guān)產(chǎn)品及服務(wù)之協(xié)議。本文內(nèi)容僅供內(nèi)部參考及培訓(xùn)使用，并不構(gòu)成任何法律、稅務(wù)、投資或其他專業(yè)意見。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.