文 | 孫小雯
訪談 / 編輯 | 海若鏡
「暗涌Waves」獨家獲悉,侵入式腦機接口公司「芯生視界」近日完成近億元人民幣種子輪融資。本輪融資由經緯創(chuàng)投領投,星連資本、燕緣創(chuàng)投、水木創(chuàng)投跟投。
當下,侵入式腦機接口已經在治療癱瘓、腦控外設等醫(yī)療場景落地,驗證長期植入的安全、有效。與此同時,AI Agent和具身智能技術加速進化,也放大了市場對腦機接口的期待:改寫未來“人機交互”的方式,實現人機融合、增強人類。馬斯克和他的Neuralink,正是這一敘事的風向標。
芯生視界團隊集合了多位國家“腦計劃”腦機接口方向“青年首席”:創(chuàng)始人王茜來自北京大學心理與認知科學學院、IDG麥戈文腦科學研究所。聯(lián)合創(chuàng)始人李遠寧來自上海科技大學,是卡耐基梅隆大學人工智能和神經科學博士,曾在加州大學舊金山分校Edward Chang實驗室(腦機接口頂級實驗室)從事博后研究多年。聯(lián)創(chuàng)團隊還包括來自北京大學具身智能、腦機芯片和類腦芯片等方向的專家。
這支年輕的科學家團隊,出道就獲得了一線科技基金、北大及清華系機構的同時注資。他們選擇的方向也很明確:視覺、語言和具身融合;目標是做萬通道、一體式植入的“神經顯卡”腦機接口系統(tǒng)。
芯生視界聯(lián)合創(chuàng)始人李遠寧認為,視覺是人類最重要的感知輸入,語言則是人類對外表達的核心輸出。在腦機接口研究中,視覺信息如何高效寫入人的大腦,意圖和語義又該如何被讀出。這既對應失明、失語患者的功能重建,也更接近人機交互的核心問題。
為什么第一步選擇視覺重建,當下能做到什么程度?腦機接口“神經顯卡”究竟意味著什么?視覺、語言和具身智能之間,又如何構成下一代人機交互的橋梁?以下是我們與李遠寧的對話(經編輯):
01 科學家下場
暗涌:芯生視界的幾位聯(lián)合創(chuàng)始人是如何走到一起,決定創(chuàng)立公司的?
李遠寧:這其實源于一個對技術終局的共同判斷:人類與世界交互的本質,一端是“感知”,一端是“表達”。
我和王茜研究人腦視覺、語言皮層時間比較久。十幾年前,在CMU攻讀博士期間,我便在匹茲堡大學醫(yī)學中心開展了侵入式的人類視皮層神經編解碼研究,發(fā)表了多篇關于電刺激產生文字和記憶幻覺的研究。后來我又參與領導了國內最早的侵入式漢語腦機接口研究。
與此同時,王茜老師團隊在國內率先實現了基于臨床病人的視皮層單神經元記錄,并在2020年發(fā)表了“人類視皮層電刺激誘發(fā)彩色視覺幻覺的映射機制”的研究論文。
當我們將跨越十年的底層算法、試驗數據匯聚,想合作將其真正推向臨床轉化時,發(fā)現急需一套能夠精密調控、實現信息雙向閉環(huán)的硬件基座。
為此,我們聯(lián)合了北京大學主攻腦機硬件芯片的頂尖團隊,他們擁有稀缺的工業(yè)級流片與規(guī)模化量產經驗。
芯生視界的另一位聯(lián)創(chuàng)朱毅鑫教授,同樣來自北京大學。作為國內少有的曾受邀在NVIDIA GTC全球大會上作報告的具身智能專家,他也被“人機融合”的愿景所打動而加入。
至此團隊最終聚集了從神經機制解析、底層高通量芯片、前沿臨床醫(yī)學,再到具身AI互聯(lián)的全鏈條專家,這也是我們從硅基算力到碳硅融合的技術壁壘。
暗涌:現在國內估值百億的腦機接口公司已有幾家,現在入場,會有點晚嗎?既往做運動功能重建的公司,所積累的數據和能力,容易泛化到視覺、語言等適應癥嗎?
李遠寧:從公司成立時間來看,我們不算早的。但此前的公司大都是針對運動功能重建,而我們選擇的視覺、語言和具身方向,大家都剛剛開始,我們積累可能還更深。
運動功能重建積累的數據飛輪,很難遷移到其他認知功能上。
運動控制的維度相對較低,但視覺和語言涉及極高維度的非線性編碼。在全新的賽道上,芯生視界的積累不僅在算法上,更在于我們的創(chuàng)始團隊在臨床一線多年,積累了海量的顱內多模態(tài)數據,包括百余例患者的視覺皮層電刺激的數據庫。這意味著我們不需要從零開始進行臨床試錯。
02 萬通道的可能
暗涌:現在受市場追捧的幾家侵入式腦機接口公司,多是從“柔性電極”這一長板入手創(chuàng)業(yè),而芯生視界的解決方案是什么?
李遠寧:柔性電極是進入大腦的物理接口,這很重要。但腦機接口背后是一整套系統(tǒng),真正決定腦機交互上限和信息通量的,是電極之下的芯片和神經編解碼算法——這就是我們提出“神經顯卡”的原因。
現在臨床上使用的一些硬件可控性不高,也不是為了高效的雙向交互設計的。就像顯卡支撐了AI的爆發(fā)一樣,芯生視界正在構建的“神經顯卡”系統(tǒng),攻克的是大腦極端高帶寬數據流的“編解碼-重建”閉環(huán),它有可能成為支撐腦機融合、人機共生的核心基礎設施。
暗涌:業(yè)內也有一種聲音,腦機接口系統(tǒng)并不一定需要超高通量。馬斯克Neuralink開始時植入了1024通道的腦機系統(tǒng),但實際發(fā)揮作用的也只有幾百通道?
李遠寧:不同任務對通量需求不一樣,運動控制需要記錄的維度較低。比如手臂運動,只需要不到十個自由度的神經信號,就能實現在二維平面上精準地控制鼠標。
而目前所有語言解碼的工作,本質上也是解碼構音器官的精細運動:只需要十幾個自由度的神經信號,就能很好的刻畫口唇舌咽等構音器官運動,并解碼生成出語音。
但真正的視覺重塑和自然語義解碼,是另一個量級的工程。你想在盲人的腦海里像素級寫入一張清晰的圖像,或者直接解碼“腦海中飄過的一個復雜抽象想法”,每一個環(huán)節(jié)對應的都是上千或者上萬維度的信息并發(fā)。這時,高通量電極和高通量芯片的必要性就出來了。目前馬斯克的Neuralink能做到 3000 個通道,我們正在朝萬通道努力。
暗涌:所以你們認為必須開發(fā)高通量的腦機芯片。做腦機芯片的難點有哪些?
李遠寧:腦機芯片是“帶著鐐銬跳舞”。要把這樣的芯片植入到大腦,既需要小尺寸、低功耗,又要滿足高通量實時并發(fā),還要能夠雙向交互。
這件事并不是無解,和 GPU 相比,當下腦機芯片制程沒有那么高。但是在沒有規(guī)模化的情況下,利潤就會很薄。芯片研發(fā)很燒錢,小規(guī)模流一次片可能就成百上千萬。
而腦機領域才剛剛起步,投入多少資源,決定能解決多少問題。從這個視角來看,對比芯片、具身智能等方向,腦機接口賽道獲得的資金規(guī)模還是比較少。
暗涌:你們的腦機芯片方案目前是什么進展?
李遠寧:我們是國內為數不多流片出28nm級腦機芯片的團隊,目前的芯片是256通道,今年應該會出一個更高通量、雙向交互的芯片。
03 視覺與語言重建的未來
暗涌:為什么“視覺重建”成為大家現在想要攻克的重要方向?你們團隊在此的積累有哪些?
李遠寧:從臨床需求來看,視覺重建的需求量足夠大,且現在沒有好的替代解決方案。中國最常見的三種殘障類型是肢體、視力和聽力殘疾,其中肢體殘疾有義肢等方案,聽力障礙也有人工耳蝸的方案能夠部分解決。但在視力障礙領域,針對全盲患者,植入式腦機接口幾乎是唯一的復明方案。
從研究路徑來看,它的第一步驗證路線足夠清晰。初級視覺皮層有retinotopy機制,即刺激皮層對應的位置,就能產生色覺和光感。
王茜老師早在2020年就開展了相關研究,讓被試者在受到皮層電刺激之后,描述視野中什么位置產生了畫面。比如把視野分成幾塊后,患者可以感知到左邊有紅色,右邊有藍色。得益于國內臨床資源等優(yōu)勢,此前已研究積累了100多例的實驗數據,部分解決了視覺皮層自下而上的簡單輸入問題。
在復雜場景的視覺編碼算法方面,神經編碼領域有一個兩年一度的國際挑戰(zhàn)賽叫 Algonauts, 主辦方會給出一個公開的神經大數據集,要求參賽者提交算法,基于給定的刺激內容來盡可能準確地預測大腦的神經響應活動。這個比賽,2021年和2023年我們團隊都拿了全球冠軍。不過,2025年我們沒有再參賽,而那一年的冠軍是 Meta AI。
暗涌:此前有腦機接口專家講到,視覺重建的難度非常大。為什么讓“盲人復明”存在巨大挑戰(zhàn)?
李遠寧:因為還有兩個關鍵的問題沒有解決。
首先是動態(tài)視覺中大腦對環(huán)境的補全機制。我們看世界時,人腦每一刻其實只會接收到很小范圍的視覺信息:我們視網膜中真正具備高分辨率的區(qū)域非常小,大腦是依靠眼球高頻的掃視,結合內部建立的世界模型,來腦補和拼接出完整、連續(xù)的視覺場景。
這套機制也導致腦機接口的重建異常困難,因為初級視覺皮層并不是簡單的前饋網絡,存在大量的橫向抑制和跨腦區(qū)的反饋連接,一個神經元的激活會橫向影響周圍的神經元,也就是說點亮一處可能會影響另一處,這就加大了視覺編碼重建的難度。如果把一萬個電極當成一萬個獨立的像素點去簡單粗暴地同時激發(fā),大概率會得到一片模糊。
另一個困難是如何利用神經可塑性,讓大腦學會接受這樣的輸入,產生感知。當我們將經過算法編碼的電信號輸入盲人的大腦時,對大腦而言,這是一種從未見過的新型“語言”。
盲人并非一接上設備就能立刻“看懂”世界,而是需要經歷一個類似“強化學習”的主動適應過程。這本質上是利用神經可塑性,讓人機共同進化,最終幫大腦重新“長”出一條感知通道。
暗涌:腦機接口做視覺、語言這兩種功能的重建及研究,對“人機交互”未來的意義是什么?
李遠寧:語言和視覺,是我們跟世界交流最核心的輸入和輸出,視覺提供了我們80%的感知輸入,在大腦深處構建起復雜的“世界模型”;語言則負責將這些意識解碼并向外輸出。
但語言本身,其實是受制于人類運動器官物理約束的一種低帶寬的有損壓縮。芯生視界的終極目標是打破這種束縛,實現高通量的人機交互,在人腦的高維語義空間與大模型、具身AI之間,架起一座直接對接的橋梁。
未來,思想的交互也許不再需要被降維成顯性的語言或動作。人腦或能與AI實現語義級的直連。這可能不僅是人機交互的終局,更是碳基生命與硅基智能跨越物理邊界、走向融合共生的進化一躍。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.