中國(guó)工業(yè)物理AI的真正優(yōu)勢(shì)不在模型參數(shù),而在全球12倍的工業(yè)機(jī)器人部署密度、兩倍的發(fā)電量和密集的5G邊緣節(jié)點(diǎn)——場(chǎng)景密度、基建底座和開(kāi)源模型的合力,正在推動(dòng)物理AI從實(shí)驗(yàn)室走向規(guī)模化落地。
江行智能提出工業(yè)物理AI的三層模型,這套系統(tǒng)已在新能源場(chǎng)站和電網(wǎng)巡檢場(chǎng)景落地——覆蓋貴州、內(nèi)蒙古等多地,核心算法準(zhǔn)確率達(dá)99%。陳龍?zhí)貏e指出,工業(yè)場(chǎng)景下一個(gè)看似簡(jiǎn)單的巡檢任務(wù)通常需要拆成100到200個(gè)子任務(wù),這對(duì)AI的穩(wěn)定性和可靠性提出了遠(yuǎn)超消費(fèi)級(jí)應(yīng)用的要求。
以下為演講內(nèi)容,經(jīng)36氪整理編輯:
![]()
陳龍丨江行智能基模CTO
各位嘉賓、行業(yè)伙伴下午好,我是來(lái)自江行智能的具身基模CTO陳龍,我的分享題目是從感知環(huán)境到改變世界:物理AI的機(jī)遇、路徑和挑戰(zhàn)。
AI 的競(jìng)爭(zhēng)已經(jīng)從數(shù)字世界的模型參數(shù)之爭(zhēng),轉(zhuǎn)向了真實(shí)物理世界的系統(tǒng)能力之爭(zhēng)。中國(guó)憑借獨(dú)特的五層產(chǎn)業(yè)基礎(chǔ),正在成為全球工業(yè)物理 AI 落地的最佳土壤。江行智能通過(guò)打造全棧工業(yè)物理 AI 模型架構(gòu),已經(jīng)在新能源、電網(wǎng)等核心領(lǐng)域?qū)崿F(xiàn)了規(guī)模化部署,證明了物理 AI 從概念走向現(xiàn)實(shí)的可行性。
AI 競(jìng)爭(zhēng)正在從模型競(jìng)爭(zhēng)走向物理系統(tǒng)競(jìng)爭(zhēng)
過(guò)去幾年,生成式 AI 在數(shù)字世界充分證明了自身價(jià)值,能夠完成內(nèi)容生成、代碼編寫(xiě)、智能問(wèn)答等任務(wù)。但對(duì)于工業(yè)企業(yè)而言,真正的價(jià)值前線不在屏幕里,而在風(fēng)電場(chǎng)、光伏電站、變電站、礦山、化工園區(qū)和生產(chǎn)車(chē)間這些真實(shí)的物理空間。
AI 正在經(jīng)歷從 “生成答案” 到 “執(zhí)行任務(wù)” 的關(guān)鍵演進(jìn)。當(dāng) AI 走進(jìn)工業(yè)現(xiàn)場(chǎng),競(jìng)爭(zhēng)的核心不再是模型參數(shù)規(guī)模或單點(diǎn)算法準(zhǔn)確率,而是能否將人工智能穩(wěn)定、可控、低成本地部署到真實(shí)物理世界。工業(yè)現(xiàn)場(chǎng)的任務(wù)從來(lái)不是 “看一張圖判斷有沒(méi)有異常” 這么簡(jiǎn)單,它需要完成數(shù)據(jù)采集、環(huán)境理解、設(shè)備接入、任務(wù)規(guī)劃、執(zhí)行反饋和閉環(huán)迭代的全流程。這意味著物理 AI 不是一個(gè)孤立的模型,而是一套能夠在現(xiàn)場(chǎng)持續(xù)運(yùn)行的完整智能系統(tǒng)。
中國(guó)工業(yè)物理 AI 的五層基礎(chǔ)與三大結(jié)構(gòu)性機(jī)會(huì)
為什么工業(yè)物理 AI 在中國(guó)擁有最好的落地條件?中國(guó)已經(jīng)形成了其他國(guó)家難以復(fù)制的五層系統(tǒng)性基礎(chǔ)。
第一層是應(yīng)用層。中國(guó)擁有全球最高密度的工業(yè)場(chǎng)景,工業(yè)機(jī)器人安裝量約為美國(guó)的 8.6 倍,過(guò)去十年增長(zhǎng)了約 12 倍。真實(shí)場(chǎng)景越密集,“數(shù)據(jù) - 模型 - 具身智能機(jī)器人” 的閉環(huán)就越容易形成。
第二層是模型層。以 DeepSeek、通義千問(wèn)(Qwen)、Kimi 為代表的國(guó)產(chǎn)化開(kāi)源模型追趕迅速,性能快速逼近行業(yè)最優(yōu)水平,并已在全行業(yè)完成廣泛的垂直化部署,越來(lái)越貼近產(chǎn)業(yè)的實(shí)際需求。
第三層是基礎(chǔ)設(shè)施層。中國(guó) 5G 基站數(shù)量已超過(guò) 448 萬(wàn),全球占比超過(guò) 60%,同時(shí)新增發(fā)電容量也遠(yuǎn)超美國(guó)。這使得我們?cè)诙藗?cè)和邊緣側(cè)擁有更強(qiáng)的網(wǎng)絡(luò)與基建能力,能夠更好地支持物理 AI 設(shè)備的現(xiàn)場(chǎng)接入與實(shí)時(shí)交互。
第四層是芯片層。不可否認(rèn),我們?cè)诟叨擞?xùn)練芯片領(lǐng)域與美國(guó)仍存在差距。但這一挑戰(zhàn)也倒逼行業(yè)走上了更高效的技術(shù)路線,推動(dòng)企業(yè)通過(guò)更優(yōu)的模型結(jié)構(gòu)、端邊協(xié)同和軟硬件聯(lián)合優(yōu)化來(lái)最大化現(xiàn)有硬件的性能潛力。
第五層是能源層。當(dāng)前中國(guó)發(fā)電量約為美國(guó)的兩倍,發(fā)電機(jī)組裝機(jī)量更是達(dá)到美國(guó)的三倍。充足且穩(wěn)定的能源供給,為 AI 從云端訓(xùn)練走向大規(guī)模現(xiàn)場(chǎng)部署提供了長(zhǎng)期的底層支撐。
這五層基礎(chǔ)疊加在一起,使中國(guó)工業(yè)物理 AI 不只是有技術(shù)想象,更有真實(shí)的落地土壤。在此基礎(chǔ)上,我們總結(jié)出中國(guó)工業(yè)物理 AI 的三類(lèi)核心結(jié)構(gòu)性機(jī)會(huì)。
第一類(lèi)是供給側(cè)底座機(jī)會(huì)。能源、網(wǎng)絡(luò)、基礎(chǔ)設(shè)施和邊緣節(jié)點(diǎn)的持續(xù)完善,為 AI 進(jìn)入工業(yè)現(xiàn)場(chǎng)提供了長(zhǎng)期可靠的支撐。
第二類(lèi)是現(xiàn)場(chǎng)側(cè)閉環(huán)機(jī)會(huì)。高密度的工業(yè)場(chǎng)景、大規(guī)模的機(jī)器人部署和多模態(tài)傳感設(shè)備,讓物理 AI 能夠形成 “部署 - 采集 - 訓(xùn)練 - 迭代 - 再部署” 的完整數(shù)據(jù)飛輪,這是其他國(guó)家無(wú)法比擬的優(yōu)勢(shì)。
第三類(lèi)是效率側(cè)路線機(jī)會(huì)。高端芯片的約束會(huì)推動(dòng)行業(yè)走向更高效的模型、更強(qiáng)的邊緣智能和更深的軟硬協(xié)同,使工業(yè)物理 AI 更加注重低成本、可控性和可部署性。
江行智能的定位,正是把這些組合優(yōu)勢(shì)組織成可部署、可復(fù)制、可持續(xù)迭代的工業(yè)物理 AI 系統(tǒng)。
江行智能全棧工業(yè)物理 AI 模型架構(gòu)
工業(yè)現(xiàn)場(chǎng)的問(wèn)題不能靠單一模型解決,它需要數(shù)據(jù)基礎(chǔ)設(shè)施、物理世界建模、行業(yè)大模型、應(yīng)用框架、設(shè)備控制和安全機(jī)制協(xié)同工作。基于這一認(rèn)知,江行智能打造了面向工業(yè)場(chǎng)景的三層全棧物理 AI 模型架構(gòu),圍繞工業(yè)物理 AI 對(duì)自主性、多模態(tài)、長(zhǎng)任務(wù)和可靠性的核心需求設(shè)計(jì)。
數(shù)據(jù)與基礎(chǔ)設(shè)施層:JX-Phi World 雙輪驅(qū)動(dòng)
作為整個(gè)架構(gòu)的底座,JX-Phi World 采用 AutoEdge 和 AutoWorld 雙輪驅(qū)動(dòng)的核心設(shè)計(jì),解決模型訓(xùn)練更快、落地更穩(wěn)、成本更低的問(wèn)題。
AutoEdge 負(fù)責(zé)真實(shí)工業(yè)數(shù)據(jù)的全流程處理,包括多模態(tài)環(huán)境數(shù)采、云端訓(xùn)練、邊端推理、模型部署和 OTA 升級(jí)。它能夠持續(xù)采集真實(shí)現(xiàn)場(chǎng)的任務(wù)、設(shè)備、工況和反饋數(shù)據(jù),同時(shí)通過(guò)邊緣側(cè)推理顯著降低網(wǎng)絡(luò)傳輸壓力與模型端到端時(shí)延。底層數(shù)據(jù)涵蓋了傳感器、熱成像、無(wú)人機(jī)巡檢以及低軌衛(wèi)星遙感等工業(yè)現(xiàn)場(chǎng)的全維度信息。
AutoWorld 則是世界模型仿真和數(shù)據(jù)引擎。工業(yè) AI 的一大痛點(diǎn)在于,很多關(guān)鍵異常并不高頻發(fā)生,但一旦發(fā)生就必須準(zhǔn)確識(shí)別和可靠處置。真實(shí)工業(yè)數(shù)據(jù)通常只能覆蓋 90%-95% 的常規(guī)場(chǎng)景,對(duì)于極端天氣、突發(fā)事件等 5% 的潛在風(fēng)險(xiǎn)與極端工況存在數(shù)據(jù)缺口。AutoWorld 通過(guò)生成式 AI 與 3D 重建技術(shù),模擬生成各類(lèi)罕見(jiàn)場(chǎng)景和復(fù)雜任務(wù)過(guò)程,支持 Sim-to-Real 遷移,讓 AI 在仿真環(huán)境中把錯(cuò)誤犯完,再部署到真實(shí)現(xiàn)場(chǎng)。
模型層:JX-Phi Brain 向工業(yè)場(chǎng)景 WAM 演進(jìn)
JX-Phi Brain 是整個(gè)架構(gòu)的核心大腦,正在向工業(yè)場(chǎng)景 World Action Model(WAM)演進(jìn),融合了三類(lèi)核心能力。
第一類(lèi)是空間視覺(jué)語(yǔ)言模型(S-VLM),解決 “感知 + 理解” 的問(wèn)題。工業(yè)現(xiàn)場(chǎng)不是一張平面圖,而是包含設(shè)備、人員、空間關(guān)系、運(yùn)行狀態(tài)和行業(yè)規(guī)則的動(dòng)態(tài)環(huán)境。S-VLM 不僅能夠感知工業(yè)廠房的物理環(huán)境,還能理解各類(lèi)傳感器讀數(shù)與環(huán)境參數(shù),實(shí)現(xiàn)跨模態(tài)推理與工業(yè)場(chǎng)景建模。
第二類(lèi)是長(zhǎng)任務(wù)視覺(jué)語(yǔ)言動(dòng)作模型(LT-VLA),解決 “感知 + 執(zhí)行” 的問(wèn)題。工業(yè)任務(wù)往往不是一步完成,而是多任務(wù)、多設(shè)備、多流程協(xié)同。LT-VLA 能夠感知現(xiàn)場(chǎng)環(huán)境約束與任務(wù)要求,將復(fù)雜工業(yè)任務(wù)拆解為一系列可執(zhí)行的子任務(wù),并實(shí)現(xiàn)自引導(dǎo)式的任務(wù)優(yōu)化與動(dòng)態(tài)調(diào)整。
第三類(lèi)是行業(yè)垂類(lèi)模型,把電力、化工、礦山等行業(yè)的專(zhuān)業(yè)知識(shí)融入模型,使模型能理解強(qiáng)規(guī)則、強(qiáng)約束、強(qiáng)安全要求下的真實(shí)任務(wù)。目前江行已經(jīng)在電力、化工、礦山等行業(yè)支持超過(guò) 1000 個(gè)場(chǎng)站和點(diǎn)位的常態(tài)化數(shù)據(jù)采集,持續(xù)構(gòu)建 “模型 + 數(shù)據(jù)” 的閉環(huán)。
應(yīng)用層:JX-Phi Agent 通過(guò)工業(yè) Harness 與一腦多體實(shí)現(xiàn)價(jià)值落地
模型本身不會(huì)自動(dòng)創(chuàng)造產(chǎn)業(yè)價(jià)值,價(jià)值發(fā)生在模型被封裝成可部署、可調(diào)用、可監(jiān)管的現(xiàn)場(chǎng)系統(tǒng)之后。JX-Phi Agent 應(yīng)用層的核心是工業(yè) Harness 和一腦多體控制兩大技術(shù)。
工業(yè) Harness 負(fù)責(zé)把任務(wù)拆解、安全規(guī)范、工具調(diào)用、規(guī)則約束、異常響應(yīng)和全程留痕組織起來(lái)。它讓模型不是自由發(fā)揮,而是嚴(yán)格在工業(yè)流程和安全邊界內(nèi)運(yùn)行,同時(shí)能夠整合行業(yè)知識(shí)庫(kù)與下游專(zhuān)用模型,對(duì)模型輸出結(jié)果進(jìn)行自動(dòng)復(fù)核,并支持專(zhuān)家人工審核介入。
一腦多體則是面向復(fù)雜現(xiàn)場(chǎng)的協(xié)同控制引擎。核心是一個(gè)參數(shù)量達(dá) 100B 的全局預(yù)控制器,負(fù)責(zé)跨工區(qū)的全局任務(wù)調(diào)度與管理。一個(gè)站端大腦,可以接入無(wú)人機(jī)、機(jī)械狗、輪式機(jī)器人、固定攝像頭、傳感器、機(jī)械臂等多種終端,實(shí)現(xiàn)任務(wù)分配、狀態(tài)同步、沖突消解和協(xié)同執(zhí)行。目前該架構(gòu)已在貴州山區(qū)電網(wǎng)、內(nèi)蒙古沙漠光伏等復(fù)雜場(chǎng)景成功部署,實(shí)現(xiàn)了具身終端在客戶側(cè)的規(guī)模化應(yīng)用。
四大關(guān)鍵技術(shù)支撐工業(yè)物理 AI 落地
為了支撐全棧架構(gòu)的高效運(yùn)行,江行智能在四大核心技術(shù)領(lǐng)域?qū)崿F(xiàn)了關(guān)鍵突破。
第一項(xiàng)關(guān)鍵技術(shù)是動(dòng)態(tài)可更新的工業(yè)場(chǎng)景底座。真實(shí)工業(yè)現(xiàn)場(chǎng)是動(dòng)態(tài)變化的,一次性建好的三維模型很快就會(huì)和真實(shí)現(xiàn)場(chǎng)脫節(jié)。江行通過(guò) TrackerSplat 技術(shù)解決了動(dòng)態(tài)場(chǎng)景中的穩(wěn)定重建問(wèn)題,能夠在機(jī)器人移動(dòng)過(guò)程中清晰抓取儀表盤(pán)等關(guān)鍵傳感器數(shù)據(jù),有效過(guò)濾雨滴、電磁干擾等環(huán)境噪聲。同時(shí)通過(guò) SizeGS 技術(shù)解決了弱網(wǎng)環(huán)境下的三維內(nèi)容壓縮和傳輸問(wèn)題,確保檢測(cè)結(jié)果與中間決策能夠穩(wěn)定回傳云端大腦。
第二項(xiàng)關(guān)鍵技術(shù)是世界模型與物理推演。工業(yè)現(xiàn)場(chǎng)真實(shí)試錯(cuò)成本極高,尤其在電力、能源、化工等場(chǎng)景,有些錯(cuò)誤絕對(duì)不能在真實(shí)現(xiàn)場(chǎng)發(fā)生。江行通過(guò)世界模型把 “真實(shí)、仿真、真實(shí)” 組織成閉環(huán)訓(xùn)練,讓機(jī)器人策略先在仿真中試錯(cuò)、評(píng)測(cè)和迭代,再遷移到真實(shí)現(xiàn)場(chǎng),大幅降低了落地風(fēng)險(xiǎn)和成本。
第三項(xiàng)關(guān)鍵技術(shù)是多模態(tài)感知與根因分析。江行融合了紅外熱成像、可見(jiàn)光、三維空間信息、設(shè)備狀態(tài)數(shù)據(jù)以及無(wú)人機(jī)、低軌衛(wèi)星遙感數(shù)據(jù),讓模型不僅能夠看到異常,還能理解異常發(fā)生在哪里、為什么重要、風(fēng)險(xiǎn)等級(jí)如何,以及下一步應(yīng)該怎么處理。這實(shí)現(xiàn)了從 “缺陷識(shí)別” 到 “缺陷理解” 的跨越,為客戶提供真正可執(zhí)行的運(yùn)維決策。
第四項(xiàng)關(guān)鍵技術(shù)是 VLA 執(zhí)行閉環(huán)與一腦多體協(xié)同。江行通過(guò) DyGRO-VLA 技術(shù)和一腦多體系統(tǒng),讓全局大腦完成語(yǔ)義理解、任務(wù)拆解、目標(biāo)分配、路徑規(guī)劃和沖突消解,再由具身終端完成導(dǎo)航、避障、讀數(shù)、復(fù)核、操作和狀態(tài)回傳。與消費(fèi)級(jí)具身智能的短任務(wù)不同,一個(gè)簡(jiǎn)單的機(jī)械狗檢查設(shè)備讀數(shù)任務(wù),在工業(yè)場(chǎng)景中通常要拆成 100 到 200 個(gè)子任務(wù),還需要綜合考慮地形、氣候等環(huán)境因素。
兩大標(biāo)桿案例驗(yàn)證物理 AI 規(guī)模化價(jià)值
江行智能的全棧工業(yè)物理 AI 技術(shù)已在多個(gè)核心工業(yè)領(lǐng)域?qū)崿F(xiàn)規(guī)模化落地,其中新能源風(fēng)光場(chǎng)站和電網(wǎng)變電站是兩個(gè)最具代表性的場(chǎng)景。
在新能源領(lǐng)域,江行打造了風(fēng)、光場(chǎng)站物理 AI 運(yùn)維系統(tǒng),實(shí)現(xiàn)了升壓站、光伏板區(qū)、風(fēng)機(jī)區(qū)、周界道路等多區(qū)域的全域覆蓋,支持 7×24 小時(shí)全天候巡檢。系統(tǒng)已經(jīng)在全國(guó) 600 + 站群級(jí)場(chǎng)景中驗(yàn)證,能夠跨區(qū)域、跨站型、跨業(yè)主快速?gòu)?fù)制。傳統(tǒng)人工巡檢一個(gè)大型場(chǎng)站可能需要 30 天以上,而物理 AI 系統(tǒng)只需 2 天即可完成全站巡檢,徹底重構(gòu)了新能源運(yùn)維的效率。
在電網(wǎng)領(lǐng)域,江行的變電站物理 AI 智巡系統(tǒng)構(gòu)建了中樞大腦、具身大腦和可控終端的協(xié)同體系,實(shí)現(xiàn)了空地立體巡檢和多終端協(xié)同執(zhí)行。系統(tǒng)覆蓋站內(nèi) 1 萬(wàn) + 高密度智巡點(diǎn)位,能夠在 4 小時(shí)內(nèi)完成單次全站巡檢,核心算法準(zhǔn)確率達(dá)到 99%,平均準(zhǔn)確率達(dá)到 96%。目前該系統(tǒng)已覆蓋全國(guó) 27 個(gè)省份,在國(guó)家電網(wǎng)和南方電網(wǎng)體系中完成了 500 + 場(chǎng)景落地。
特別值得一提的是,江行開(kāi)發(fā)的搭載機(jī)械臂的機(jī)械狗,能夠自主完成電表箱開(kāi)啟、設(shè)備讀數(shù)讀取、簡(jiǎn)單調(diào)壓操作等復(fù)雜任務(wù),特別適用于狹小空間、高危區(qū)域等人員難以到達(dá)的場(chǎng)景。該設(shè)備采用端邊云協(xié)同架構(gòu),在機(jī)械狗本地部署了 8B 參數(shù)量的端側(cè)推理模型,同時(shí)結(jié)合邊緣與云端的算力資源,實(shí)現(xiàn)了高精度、低時(shí)延的作業(yè)能力。
江行智能作為工業(yè)物理 AI 的堅(jiān)定實(shí)踐者,堅(jiān)信物理 AI 已經(jīng)從概念走向了現(xiàn)實(shí)。下一階段 AI 最重要的產(chǎn)業(yè)價(jià)值,不會(huì)只發(fā)生在屏幕里,而會(huì)發(fā)生在真實(shí)空間、真實(shí)設(shè)備、真實(shí)任務(wù)和真實(shí)生產(chǎn)力之中。
江行智能希望和更多產(chǎn)業(yè)伙伴一起,讓物理 AI 走進(jìn)真實(shí)工業(yè)現(xiàn)場(chǎng),從感知環(huán)境開(kāi)始,真正用智能改變工業(yè)世界。
謝謝大家!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.