![]()
編輯|+0、杜偉
今年最出圈的 AI 應(yīng)用是什么?OpenClaw 一定是繞不開的答案。
回過頭看二三月份,「養(yǎng)蝦」一度成為流行的社交貨幣。但它的意義遠(yuǎn)不止是一款爆款應(yīng)用:OpenClaw 真正將智能體概念從開發(fā)者圈層推向了大眾視野,讓普通用戶第一次直觀感受到 Agent 到底能做什么。
當(dāng)更多人開始理解 Agent 的價(jià)值之后,行業(yè)的焦點(diǎn)也自然進(jìn)入到了下一階段:誰家的 Agent 做得更好、上手起來更容易以及更能負(fù)擔(dān)得起。這些才是決定 Agent 生態(tài)走向的關(guān)鍵變量。
誰能在這一節(jié)點(diǎn)完成轉(zhuǎn)型,就能在「后 OpenClaw 時(shí)代」搶占先機(jī)。事實(shí)上,國內(nèi)已經(jīng)有玩家率先落子。
就在今日,昆侖萬維旗下的天工 AI(Skywork)全新發(fā)布了 SkyClaw-v1.0 智能體模型,成為其長期深耕云端助理的又一里程碑,也開始了從助手形態(tài)向智能體基座模型的架構(gòu)升級(jí)。
作為一款專為 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能體框架深度優(yōu)化的基座模型,SkyClaw-v1.0 模型在底層能力上實(shí)現(xiàn)了質(zhì)的提升,工具調(diào)用精度更準(zhǔn)、多輪任務(wù)執(zhí)行更穩(wěn)、長鏈路推理更優(yōu),能夠更好地適配真實(shí)場景中復(fù)雜、動(dòng)態(tài)的智能體工作流。
與此同時(shí),Skywork 還同步上線了 SkyClaw-v1.0-lite。這一輕量化版本瞄準(zhǔn)了高頻調(diào)用和成本敏感場景,在保持核心智能體能力的同時(shí),大幅優(yōu)化了推理速度與資源開銷,為開發(fā)者提供了一個(gè)更靈活的部署選擇。
兩款模型在 X 上搶先亮相以來,熱度持續(xù)走高。
![]()
Nanobot 官方發(fā)文,「很高興能與 Skywork 攜手推出 SkyClaw-v1.0!期待看到各位開發(fā)者用它創(chuàng)造出無限可能。」
![]()
不少海外活躍 AI 博主對(duì)它評(píng)價(jià)頗高,「SkyClaw-v1.0 的訓(xùn)練任務(wù)來源于用戶的實(shí)際操作場景,而不是通用的實(shí)驗(yàn)室數(shù)據(jù)。它在基準(zhǔn)測試上超越了 DeepSeek V4 Flash 等模型,穩(wěn)定性經(jīng)過了多次驗(yàn)證。這才是打造真正能在實(shí)際場景中好用模型的方式。」
![]()
「基準(zhǔn)測試之爭結(jié)束了。SkyClaw-v1.0 登場,干凈利落地贏下了所有。」
![]()
目前,SkyClaw-v1.0 兩款模型限時(shí)免費(fèi)開放體驗(yàn),并已在 5 月 22 日接入到了 Skywork 平臺(tái)。
![]()
- 天工地址:tiangong.cn
- SkyClaw-v1.0 項(xiàng)目地址:https://skyworkai.github.io/skyclaw/
- apifree.ai API 地址:https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api
打出這三張牌
很難不選擇它
從產(chǎn)品層面來看,SkyClaw-v1.0 確實(shí)拿出了有說服力的東西,具體可以拆成三個(gè)維度來看:Agent 能力、使用門檻和性價(jià)比。
首先,Agent 能力要強(qiáng)
根據(jù) Skywork 的官方結(jié)果,在主流智能體基準(zhǔn)以及內(nèi)部開發(fā)的 Claw 任務(wù)評(píng)估中,包括 PinchBench、Claw-Eval Pass^3 和 Skywork-Claw-Bench(基于 OpenClaw 構(gòu)建的內(nèi)部智能體評(píng)估套件),SkyClaw-v1.0 和 SkyClaw-v1.0-lite 的表現(xiàn)均優(yōu)于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6 35B A3B/27B 模型
另外,在 OpenClaw 相關(guān)任務(wù)上,SkyClaw-v1.0 的性能逼近更大規(guī)模的開閉源模型,包括 DeepSeek V4 Pro、Claude Opus 4.6 和 Qwen 3.6 Plus。
![]()
跑分亮眼之外,SkyClaw-v1.0 在實(shí)際應(yīng)用場景中表現(xiàn)驚艷。
在交互式網(wǎng)頁與游戲生成方面,它能夠輸出功能齊全的網(wǎng)頁應(yīng)用,從物理模擬到完整的游戲。結(jié)果不僅渲染正確、動(dòng)畫流暢,用戶交互處理得也恰到好處。
![]()
賓果消消樂
在深度研究與數(shù)據(jù)可視化方面,SkyClaw-v1.0 展現(xiàn)出了超越單純代碼生成的綜合能力:它能夠自主研究現(xiàn)實(shí)世界課題,從多個(gè)來源收集并交叉驗(yàn)證數(shù)據(jù),最終將分析結(jié)果整合為交互式、達(dá)到出版級(jí)質(zhì)量的儀表盤和報(bào)告。
可以說,SkyClaw-v1.0 不只是在評(píng)測榜單上跑出了好成績,也在真實(shí)場景中證明了自己作為生產(chǎn)力工具的實(shí)際價(jià)值。
其次,門檻要低
對(duì)于用戶來說,上手 SkyClaw-v1.0 幾乎沒有額外的學(xué)習(xí)成本,按需選擇使用渠道。在 Skywork 平臺(tái),一鍵選擇模型即可使用。另外,通過 AI 模型聚合服務(wù)平臺(tái) apifree.ai 注冊(cè)賬號(hào)并創(chuàng)建 APIKey,就能免費(fèi)調(diào)用。
生態(tài)適配也很完善。Nanobot 已經(jīng)率先完成對(duì) SkyClaw-v1.0 的適配,后續(xù)還將上線 OpenRouter。隨著更多平臺(tái)的接入,開發(fā)者將能夠在自己熟悉的工具鏈中直接調(diào)用模型,無需重新搭建一套工作流。
![]()
在 nanobot 中,只需填入 API 密鑰即可使用 SkyClaw-v1.0。
最后,性價(jià)比要高
SkyClaw-v1.0 的定價(jià)顯著低于當(dāng)前主流 Agent 模型。與 Minimax 2.7 和 Qwen 3.6 系列模型相比,定價(jià)僅為它們的一半甚至更低。
![]()
SkyClaw-v1.0 打出的這幾張牌,直指當(dāng)前 Agent 模型市場的核心矛盾:性能強(qiáng)的用不起,用得起的不夠強(qiáng),好用的生態(tài)封閉。它同時(shí)從能力、成本和易用性三個(gè)層面給出了一個(gè)相對(duì)均衡的解,這恰恰是當(dāng)前市場最稀缺的選項(xiàng)。
一手實(shí)測
拿捏住了「快與準(zhǔn)」
接下來,我們通過 Claude Code 來調(diào)用此次的 SkyClaw-v1.0,上手進(jìn)行了一些測試。接入過程非常絲滑,配置好 API Key 就能直接跑。
先來做一個(gè)小游戲:貪吃蛇。
![]()
SkyClaw-v1.0 僅用時(shí) 33s 就完成了單文件網(wǎng)頁版的基礎(chǔ)開發(fā),不僅包含了完整的游戲邏輯、計(jì)分系統(tǒng),并且運(yùn)行流暢。
![]()
再追加進(jìn)階需求:「在游戲中增加隨機(jī)獎(jiǎng)勵(lì),吃到蛇身邊長三格」
![]()
依然非常快速,系統(tǒng)在普通食物的基礎(chǔ)上增加了一個(gè)有 25% 概率掉落的金色星星獎(jiǎng)勵(lì)。
接下來,讓 SkyClaw-v1.0 把這個(gè)游戲打包成 Windows 桌面可獨(dú)立運(yùn)行的 EXE 應(yīng)用,并附帶要求:「色系改成多巴胺色」。這一階段的測試能夠很好地反映 Agent 在面對(duì)涉及環(huán)境依賴的復(fù)雜工程以及排錯(cuò)時(shí)的真實(shí)能力。
在 UI 需求上,自主定義了包含 12 種高飽和色彩的 CSS 變量,落實(shí)了「多巴胺色系」的設(shè)計(jì)。
在打包環(huán)節(jié),采用了 Electron 方案,完成了工程腳手架搭建及依賴安裝。
在異常處理方面,遇到報(bào)錯(cuò)不陷入死循環(huán),能讀懂報(bào)錯(cuò)日志,并嘗試改變配置(從一個(gè)打包器換到另一個(gè))來繞過環(huán)境限制。
接下來換一個(gè)真實(shí)辦公場景,這時(shí)需求不是單一格式的,這就考驗(yàn)到了模型能不能同時(shí)輸出文檔、PPT 和視頻,以及執(zhí)行任務(wù)過程中的全局規(guī)劃與跨格式協(xié)調(diào)能力。
這一次,我們直接在 Skywork 中調(diào)用 SkyClaw-v1.0,給它一個(gè)有難度的復(fù)合任務(wù)。
讓它「制作分別介紹地球四大洋的海底生態(tài)視頻(每個(gè) 10 秒),視頻生成后將其作為中間素材,構(gòu)建一份全球海洋科普專題 PPT。要求將這 4 段視頻嵌入到對(duì)應(yīng)的 PPT 頁面中,并在視頻旁配上基于視頻內(nèi)容自動(dòng)生成的專業(yè)解說詞。」
在整個(gè)執(zhí)行鏈路中,模型需要先生成四段風(fēng)格統(tǒng)一的視頻素材,再把視頻作為輸入反哺到 PPT 制作中,最后根據(jù)視頻內(nèi)容自動(dòng)撰寫解說詞。前后環(huán)環(huán)相扣,任何一步執(zhí)行不到位可能都會(huì)導(dǎo)致最終結(jié)果不可用。
![]()
從結(jié)果來看,包括視頻生成質(zhì)量、PPT 排版完成度以及解說詞與視頻畫面的匹配程度,SkyClaw-v1.0 都表現(xiàn)得面面俱到。
放上一段生成的「太平洋海底珊瑚生態(tài)」視頻,大家感受一下效果:
![]()
完整 PPT 效果如下:
![]()
兩個(gè)案例測下來,我們發(fā)現(xiàn),從理解需求、調(diào)用工具、遇錯(cuò)自修以及完整跑通多步驟任務(wù)等能力來看,SkyClaw-v1.0 以遠(yuǎn)低于行業(yè)的價(jià)格,交付出了接近頂流的 Agent 體驗(yàn)。
技術(shù)拆解
三步練出一個(gè)頂級(jí) Agent
SkyClaw-v1.0 之所以能在評(píng)測與實(shí)戰(zhàn)中交出亮眼成績,離不開一套系統(tǒng)化的訓(xùn)練流程。整個(gè)過程涵蓋環(huán)境構(gòu)建、中期訓(xùn)練與監(jiān)督微調(diào)、強(qiáng)化學(xué)習(xí)三個(gè)階段,層層遞進(jìn),構(gòu)成了一條完整的能力鏈路。
首先是搭建高質(zhì)量的訓(xùn)練環(huán)境
團(tuán)隊(duì)構(gòu)建了一個(gè)高復(fù)雜度的模擬 OpenClaw 環(huán)境,其中內(nèi)置了豐富的高質(zhì)量工具和技能,以供模型探索調(diào)用。
不僅如此,團(tuán)隊(duì)還深入分析了真實(shí)用戶在類 OpenClaw 環(huán)境下的實(shí)際任務(wù)行為,并結(jié)合線上高頻技能的使用數(shù)據(jù)和反饋,梳理出工具之間的關(guān)系圖譜。基于這張圖譜,合成大量貼近真實(shí)用戶需求的復(fù)雜任務(wù),確保模型從訓(xùn)練階段就接觸到足夠真實(shí)與復(fù)雜的場景。
有了環(huán)境基礎(chǔ),接下來是大規(guī)模的中期訓(xùn)練與監(jiān)督微調(diào)
依托上面經(jīng)過充分驗(yàn)證的訓(xùn)練環(huán)境,團(tuán)隊(duì)合成了海量高質(zhì)量訓(xùn)練數(shù)據(jù)。而為了把控?cái)?shù)據(jù)質(zhì)量,團(tuán)隊(duì)建立了嚴(yán)格的過濾和評(píng)估機(jī)制,在考核最終答案正確性的同時(shí),還會(huì)回溯評(píng)估模型完成任務(wù)的完整軌跡,確保解題過程本身也是合理高效的。
另外,團(tuán)隊(duì)進(jìn)行了大量數(shù)據(jù)配比實(shí)驗(yàn),找到智能體任務(wù)訓(xùn)練數(shù)據(jù)的最優(yōu)組合。
最后,團(tuán)隊(duì)通過強(qiáng)化學(xué)習(xí)進(jìn)一步打磨模型的泛化能力
由于自建的 OpenClaw 環(huán)境天然支持端到端的探索與反饋,模型能夠在其中進(jìn)行充分的強(qiáng)化學(xué)習(xí)訓(xùn)練。這一階段的核心目標(biāo),除了確保模型在特定任務(wù)上表現(xiàn)出色,其在不同智能體框架和陌生任務(wù)場景下也要保持穩(wěn)定的泛化能力。
整體來看,SkyClaw-v1.0 采用的這套技術(shù)路徑,沒有依賴單點(diǎn)突破,而是圍繞「真實(shí)智能體場景下的可用性」這一目標(biāo),實(shí)現(xiàn)了數(shù)據(jù)、訓(xùn)練與優(yōu)化的貫通。
環(huán)境構(gòu)建解決「用什么數(shù)據(jù)來練」,中期訓(xùn)練和 SFT 解決「如何練出基礎(chǔ)能力」,強(qiáng)化學(xué)習(xí)解決「如何進(jìn)一步提升性能上限和泛化性」。
如同此前所有 AI 熱點(diǎn)一樣,OpenClaw 經(jīng)歷了正常的波動(dòng)起伏。雖然熱度會(huì)消退,但趨勢不會(huì)。Agent 作為當(dāng)前 AI 發(fā)展最重要的方向之一,其地位在短時(shí)間內(nèi)不會(huì)改變。
上周的谷歌 I/O 大會(huì)是很好的例證,智能體成為貫穿全場的主角,Gemini Spark 的亮相更是直接對(duì)標(biāo) OpenClaw。這釋放出了一個(gè)清晰的信號(hào):巨頭們正在加速 Agent 技術(shù)的消費(fèi)級(jí)落地。
在這樣的行業(yè)背景下,「一個(gè)真正好用且用得起的 Agent」勢必將成為市場的香餑餑。但現(xiàn)實(shí)是,頂級(jí) Agent 能力幾乎被海外御三家(Anthropic、OpenAI 和谷歌)的少數(shù)閉源模型壟斷,高昂的調(diào)用成本導(dǎo)致大量中小開發(fā)者和企業(yè)望而卻步。
換句話說,Agent 的瓶頸不在技術(shù)天花板,在于落地門檻。SkyClaw-v1.0 的發(fā)布,切中了這一痛點(diǎn)。
它以接近 Claude Opus 4.6 等閉源頂流的 Agent 性能,定價(jià)卻只有主流模型的一半。結(jié)果就是,一個(gè)此前因預(yù)算有限只能用輕量模型「湊合跑」的開發(fā)者,現(xiàn)在可以用同樣的成本調(diào)用到接近頂級(jí)水平的 Agent 能力。
回過頭看,此次新發(fā)布是昆侖萬維在 AI 領(lǐng)域長期布局的又一階段性成果。自 2022 年確立「All in AGI 與 AIGC」戰(zhàn)略以來,昆侖萬維基于自主研發(fā)的全球領(lǐng)先大模型基座,已構(gòu)建起短劇和 A I 短劇平臺(tái)、AI 音樂、AI 游戲、AI SuperAgent、AI 社交五大核心產(chǎn)品矩陣。
其中在 Agent 領(lǐng)域,昆侖萬維在今年一、二月先后發(fā)布了 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 云端智能體。桌面版實(shí)現(xiàn)全本地化運(yùn)行,無需上傳數(shù)據(jù)即可處理多格式內(nèi)容;SkyClaw 集成 70 余項(xiàng)技能,支持跨設(shè)備多端監(jiān)控。
SkyClaw-v1.0 能夠做到高性能與低成本兼顧,與昆侖萬維在模型、應(yīng)用和生態(tài)層面的長期積累密不可分。
當(dāng) Agent 賽道從狂歡期進(jìn)入冷靜期,最后能留在牌桌上的,一定是把基本功做得最扎實(shí)的那一個(gè)。SkyClaw-v1.0 交出的這份答卷,正是昆侖萬維對(duì)這一判斷最有力的回應(yīng)。
文中視頻鏈接:https://mp.weixin.qq.com/s/SSfxXcx8Sr0XQH04rcASrg
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.