<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      ChatGPT那一套要過時了?翁荔實測創業首個模型,回合制AI被“原生實時交互”秒了

      0
      分享至


      整理 | 華衛

      AI 是否正在結束“回合制”聊天的時代?

      所有在工作或日常生活中經常使用 AI 模型的人都知道,在文本、圖像、音頻和視頻等各種模態下,現在基本的交互模式仍然是一樣的:人類用戶先提供輸入,然后等待從幾毫秒到幾分鐘不等(在某些特別復雜的問題中,甚至需要數小時或數天),隨后 AI 模型再給出輸出。用 Thinking Machines 的話說,目前大多數 AI 模型都是通過“外掛式”的方式來實現交互,將不同組件拼接在一起以模擬打斷、多模態或并發等能力。然而,這類手工構建的系統終將被通用能力的進步所超越。

      “如果 AI 真正要承擔那些需要自然交互的工作,它就必須超越這種「回合制」的交互方式。最終,它需要能夠更流暢、更自然地響應人類輸入,甚至在處理下一次人類輸入(無論是文本還是其他形式)的同時就做出回應。”這是 Thinking Machines 的觀點。去年,前 OpenAI 首席技術官 Mira Murati、前 OpenAI 研究員兼聯合創始人 John Schulman 等人創立了這家資金充足的 AI 初創公司,致力于讓先進 AI 系統“更易理解、更可定制,并具備更通用的能力”。

      今天,Thinking Machines 宣布推出“交互模型”TML-Interaction-Small,將其稱為“首個同時具備強大智能 / 指令遵循能力與交互性的模型”。據介紹,這是一個擁有 2760 億參數的混合專家(MoE)模型,其中活躍參數為 120 億,可以持續接收音頻、視頻和文本輸入,并在實時中進行思考、響應和行動,不依賴外部“腳手架”來實現交互能力。根據第三方基準測試結果,這種方法在性能上取得了顯著提升,同時也降低了延遲。

      不過,該模型目前尚未向公眾或企業開放,該公司在公告博客中表示:“在接下來的幾個月里,我們將開放一個有限的研究預覽以收集反饋,并計劃在今年晚些時候更廣泛發布。”

      137 頁訓練日志的交互模型

      實力碾壓其他前沿模型

      在研究預覽中,Thinking Machines 展示了 TML-Interaction-Small 模型在交互能力上的質變,以及在智能與響應速度之間達到的當前最先進的綜合表現。

      “整體體驗更像是在協作,而不是在‘下提示詞’。”演示視頻中,OpenAI 前應用研究副總裁、Thinking Machines 聯合創始人翁荔出鏡展示了 TML-Interaction-Small 模型的無縫對話管理能力。該模型能夠隱式判斷說話者是在思考、讓出話語權、自我修正,還是在邀請回應,無需單獨的對話管理模塊。

      在 X 上,翁荔表示,“過去幾個月,我們玩得很開心,也有很多壓力,最終產出了 12 個版本(外加大量子版本)和 137 頁的訓練日志。事實證明,人與人之間的協作對于提升人機協作非常重要。”


      不僅如此,TML-Interaction-Small 模型還解鎖了一系列原本需要通過“外部腳手架”實現的能力,包括:

      • 語言與視覺的即時插話:模型可以根據上下文在需要時主動插入,而不僅僅是在用戶說完之后才回應。

      • 同時語音(Simultaneous speech):用戶與模型可以同時說話(例如實時翻譯)。

      • 時間感知(Time-awareness):模型對時間流逝具有直接的感知能力。

      • 同時進行工具調用、搜索與生成式 UI:在與用戶對話(說與聽)的同時,模型可以并行執行搜索、瀏覽網頁或生成界面,并將結果自然地融入對話之中。

      為衡量交互質量,該實驗室使用了 FD-bench,這是目前少數專門用于衡量交互性的基準之一。為量化智能水平,他們使用 Audio MultiChallenge,這是一個常用的基準,用于評估智能和指令遵循能力。結果顯示,TML-Interaction-Small 顯著優于現有的實時系統,包括 Gemini-3.1-flash-live 和 GPT-realtime-2.0 minimal。


      • 響應速度:其輪次響應延遲為 0.40 秒,而 Gemini-3.1-flash-live 為 0.57 秒,GPT-realtime-2.0 minimal 為 1.18 秒。

      • 交互質量:在 FD-bench V1.5 上,其得分為 77.8,幾乎是主要競爭對手的兩倍(GPT-realtime-2.0 minimal 為 46.8)。在 FD-bench v1.5 中,模型會接收預錄音頻,并需要在特定時刻作出響應。該基準從多個場景評估模型行為,包括用戶打斷、用戶回應性反饋(backchannel)、與他人對話以及背景語音。


      同時,該實驗室改造了 RepCount-A、ProactiveVideoQA 和 Charades 三個基準來評估模型的視覺主動性。結果顯示,在 RepCount-A(視頻中物理動作計數)和 ProactiveVideoQA 等專項測試中,Thinking Machines 的模型能夠主動參與視覺環境,而其他前沿模型則保持沉默或給出錯誤答案,包括高推理模型。

      Thinking Machines 認為,通過將“交互性”內化為模型的一部分,模型規模的擴展將不僅讓其更聰明,也會讓它成為更高效的協作伙伴。此外,他們表示,雖然預計隨著模型規模的擴大,交互能力也會進一步提升,但目前更大規模的預訓練模型在這一實時交互場景下仍然過于緩慢,無法投入使用。“今年晚些時候,我們計劃發布更大規模的模型。”

      從零開始訓練,

      200 毫秒為單位實時響應

      這次發布的核心,是 AI 在“時間感知”和“存在感”上的一次根本性轉變。當前的前沿模型通常以單線程方式體驗現實。它們會等待用戶完成輸入后才開始處理,并且在生成回應時,其“感知”是凍結的。在博客中,Thinking Machines 的研究人員將這種現狀描述為一種限制,它迫使人類不得不去“遷就”AI 接口,比如把問題寫得像郵件一樣,并將思考打包成一整塊再輸入。

      為解決這種“協作瓶頸”,Thinking Machines 從零開始訓練了這一交互模型,并放棄了標準的交替式 token 序列。取而代之的是,他們采用了一種多流(multi-stream)、微回合(micro-turn)的設計,可以以 200 毫秒為單位同時處理輸入和輸出,確保實時響應能力。這種“全雙工”(full-duplex)架構使模型能夠實時地“聽、說、看”,從而在用戶說話時進行回應性反饋(backchannel),或在捕捉到視覺線索時主動插話。例如,當用戶在代碼片段中寫出 bug,或者有朋友進入視頻畫面時。

      技術上,該模型采用了無編碼器的早期融合(encoder-free early fusion)。系統不再依賴像 Whisper 這樣龐大的獨立編碼器來處理音頻,而是通過一個輕量級嵌入層,直接接收原始音頻信號(以 dMel 表示)和圖像塊(40×40),并在 Transformer 架構中從零開始聯合訓練所有組件。

      由于實時交互需要近乎即時的響應速度,而這往往與深度推理能力存在沖突,該實驗室因還此設計了一種由兩部分組成的系統:

      • 交互模型(Interaction Model):始終與用戶保持持續交互,負責對話管理、存在感維持以及即時響應。

      • 后臺模型(Background Model):作為一個異步代理,負責處理持續性推理、網頁瀏覽或復雜工具調用,并將結果流式傳回交互模型,由后者自然地融入對話中。


      在整個過程中,交互模型始終保持在線,回答后續問題、接收新的輸入、維持對話上下文,并在后臺結果返回時將其整合進對話中。當某個任務需要比即時響應更深層的推理時,交互模型會將其委托給異步運行的后臺模型。這種分工讓用戶既能獲得高響應速度,又能享受到完整的智能能力,包括推理模型的規劃能力、工具使用能力以及代理式工作流,同時又具備非“思考型”模型的低延遲響應。

      并且,這種架構使 AI 能夠在執行任務(如實時翻譯或生成 UI 圖表)的同時,繼續監聽用戶反饋。這一功能在發布視頻中也得到了展示,模型在生成條形圖的同時,給出了類似人類反應時間的多種提示反饋。需要注意的是,后臺模型和交互模型本身都具備智能能力。即使單獨使用,交互模型在交互性能和智能基準測試上也具有很強的競爭力。

      一旦開放,將為企業帶來巨大價值

      如果 Thinking Machines 的交互模型向企業開放,很可能將從根本上改變企業將 AI 融入運營流程的方式。像 TML-Interaction-Small 這樣的原生交互模型,可以實現當前標準多模態模型無法做到或極其脆弱的多種企業能力。

      當前的企業 AI 必須完成一個“回合”后才能分析數據。而在制造業或實驗室環境中,原生交互模型可以持續監控視頻流,一旦檢測到安全違規或流程偏差,就能主動插入提醒,無需等待工作人員提出問題。該模型在 RepCount-A(精確計數重復動作)和 ProactiveVideoQA(隨著視覺證據出現即時回答問題)等視覺基準中的表現,表明它可以作為高風險物理任務的實時審計員。

      在語音客服中,主要的摩擦來自于 2026 年標準 API 常見的 1–2 秒“處理延遲”。Thinking Machines 的模型將輪次延遲降低至 0.40 秒,大致相當于自然人類對話的速度。由于其原生支持同時語音處理,企業客服機器人可以在不打斷用戶的情況下,一邊傾聽客戶情緒,一邊提供“回應性反饋”(例如“我明白”“嗯嗯”),并提供實時翻譯,使對話更像自然交流,而不是一段段割裂的錄音。

      標準大模型缺乏“內在時鐘”,只有在文本提示中提供時間信息時才“知道時間”。而交互模型天生具備時間感知能力,可以管理時間敏感流程,例如“每 4 分鐘提醒我檢查一次溫度”或“如果這個流程比上一次耗時更長就提醒我”。這對于工業維護和制藥研究尤為關鍵,因為時間是核心變量。

      此前,Thinking Machines 表示,將在其發布中堅持“重要的開源組件”,以賦能研究社區。但目前,尚不清楚這些新的交互模型是否會遵循同樣的開源策略。

      另值得一提的是,此次模型發布前,Meta 已從 Thinking Machines 挖走 7 名創始成員。據外媒報道,挖人前,Meta CEO 馬克·扎克伯格曾接觸 Mira Murati,試圖收購 Thinking Machines Lab,但被拒絕了。

      不過,Thinking Machines 并非單向流失人才,公司也聘請了 PyTorch 創始人 Soumith Chintala 擔任 CTO,并引入 Neal Wu 等知名技術人才。有外媒報道稱,曾在 Meta 工作 8 年、負責多模態感知系統的 Weiyao Wang 也已加入該公司。目前,該公司的規模增長至約 130 人。

      https://thinkingmachines.ai/blog/interaction-models/

      聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。

      會議推薦

      世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?

      AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。

      誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。

      今日薦文

      你也「在看」嗎?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      形勢到底有多嚴峻?竟有那么多待業在考公務員

      形勢到底有多嚴峻?竟有那么多待業在考公務員

      慧翔百科
      2026-05-19 11:25:41
      2026世界杯12組實力排名:法國陷死亡之組,意大利缺席

      2026世界杯12組實力排名:法國陷死亡之組,意大利缺席

      趙或是個熱血青年
      2026-05-20 07:14:44
      李時珍行醫一生,臨終前叮囑弟子:觀人壽命,先看其怎么吃飯

      李時珍行醫一生,臨終前叮囑弟子:觀人壽命,先看其怎么吃飯

      千秋文化
      2026-03-06 20:42:44
      規模排面一樣,普京跟走親戚一樣

      規模排面一樣,普京跟走親戚一樣

      三叔的裝備空間
      2026-05-19 23:38:47
      陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

      陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

      杰絲聊古今
      2026-05-03 13:35:27
      意外?德比斯奪5冠后承認:我和張雪沒簽合同效力的是意大利車隊

      意外?德比斯奪5冠后承認:我和張雪沒簽合同效力的是意大利車隊

      霽寒飄雪
      2026-05-19 19:42:49
      中國持續3年的通縮,終于結束了!通脹就要來了

      中國持續3年的通縮,終于結束了!通脹就要來了

      壹號股權
      2026-05-19 13:39:55
      蔡卓妍被曝含淚控訴小10歲老公,結婚不到1個月,男方私生活被扒

      蔡卓妍被曝含淚控訴小10歲老公,結婚不到1個月,男方私生活被扒

      代軍哥哥談娛樂
      2026-05-19 09:14:12
      艾司唑侖立大功!老人吃艾司唑侖,不止助眠,還有5大獲益

      艾司唑侖立大功!老人吃艾司唑侖,不止助眠,還有5大獲益

      健康之光
      2026-05-19 16:58:40
      白天住院晚上回家的好日子結束了!全國統一執行

      白天住院晚上回家的好日子結束了!全國統一執行

      觀星賞月
      2026-05-19 06:11:54
      國家電影局介入!電影撤檔,主演賬號被封,汪涵周冬雨姚晨跑不掉

      國家電影局介入!電影撤檔,主演賬號被封,汪涵周冬雨姚晨跑不掉

      譚談社會
      2026-05-19 22:49:47
      意外?德比斯奪5冠后承認:我和張雪沒簽合同效力的是意大利車隊

      意外?德比斯奪5冠后承認:我和張雪沒簽合同效力的是意大利車隊

      洲洲影視娛評
      2026-05-20 00:11:58
      私生活被扒底朝天僅半月,官媒出手,竇靖童迎好消息,王菲沒說錯

      私生活被扒底朝天僅半月,官媒出手,竇靖童迎好消息,王菲沒說錯

      春日筆記
      2026-05-20 09:23:28
      紐約時報刷屏長文:硅谷正在準備迎接「永久底層階級」!AI時代的四個新階層,你的孩子將被困在哪一層?

      紐約時報刷屏長文:硅谷正在準備迎接「永久底層階級」!AI時代的四個新階層,你的孩子將被困在哪一層?

      新浪財經
      2026-05-19 09:11:27
      畏懼?格林質疑切特不敢防文班,雷霆拿什么限制外星人?

      畏懼?格林質疑切特不敢防文班,雷霆拿什么限制外星人?

      仰臥撐FTUer
      2026-05-20 10:05:02
      紀實:河南“惡魔首富”吳天喜,年近60卻死性不改,是噩夢般的存在

      紀實:河南“惡魔首富”吳天喜,年近60卻死性不改,是噩夢般的存在

      卡西莫多的故事
      2025-01-06 10:41:00
      U17國足2-0進決賽!球員評分:2人滿分4人9.7分,亞足聯看人真準

      U17國足2-0進決賽!球員評分:2人滿分4人9.7分,亞足聯看人真準

      何老師呀
      2026-05-20 05:34:47
      小學生吃早餐視頻火了,116萬網友點贊:這就是有父母兜底的幸福

      小學生吃早餐視頻火了,116萬網友點贊:這就是有父母兜底的幸福

      世界圈
      2026-05-20 08:57:17
      29歲嫁68歲老頭,連生五胎母憑子貴,如今65歲的她坐擁千億家產

      29歲嫁68歲老頭,連生五胎母憑子貴,如今65歲的她坐擁千億家產

      一盅情懷
      2026-05-19 16:42:38
      人民幣78歲了!你見沒見過的人民幣,都在這里!

      人民幣78歲了!你見沒見過的人民幣,都在這里!

      中國藝術家
      2026-05-12 05:24:45
      2026-05-20 10:39:00
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
      1509文章數 149關注度
      往期回顧 全部

      科技要聞

      一文看懂谷歌I/O2026:谷歌打響智能體大戰

      頭條要聞

      "父子娶堂姐妹"等倫理傳聞的發酵 讓毛巾大王坐不住了

      頭條要聞

      "父子娶堂姐妹"等倫理傳聞的發酵 讓毛巾大王坐不住了

      體育要聞

      文班亞馬:沒拿到MVP,就證明自己是MVP

      娛樂要聞

      舒淇大方承認:卸了妝就是50 歲的模樣

      財經要聞

      白酒榜|汾酒營收凈利雙增 口子窖"造富"

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態度原創

      時尚
      家居
      旅游
      教育
      軍事航空

      “黑色淺口鞋”今年夏天太火了,怎么搭都好看!

      家居要聞

      觀山隱秀 心靈沉淀

      旅游要聞

      僑鄉文化帶給游客獨特體驗

      教育要聞

      為什么老師都喜歡拒絕公開課?

      軍事要聞

      特朗普暫緩打擊伊朗 稱系應中東三國請求

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲一区二区三区首页| 日本乱码在线看亚洲乱码| 巨熟乳波霸若妻在线播放| 国产成人调教在线视频| 国产初高中生粉嫩无套第一次| 九九国产| 国产网红女主播在线视频| 久久综合国产色美利坚| 元码人妻精品一区二区三区9| 日韩精品一区二区三免费| 亚洲中文无码av永久| 精品福利视频一区二区三区| 日韩精品国产二区三区| 亚洲?欧美?中文?字幕| 国产精品无码久久久久免费AV| 一本久道中文无码字幕av| 波多野结衣av无码久久一区| 国产精品国产三级国产专区53| 黑人玩弄人妻中文在线| 91精品国产免费人成网站| 日韩成人无码中文字幕| 日日摸夜夜添夜夜添无码专区| 久九九精品免费视频| 色屁屁www影院免费观看入口 | 免费无码观看的AV在线播放| 国产精品A片| 久久亚洲精品中文| 亚洲国产精品线播放| 一区二区三区av天堂| 亚洲V天堂V手机在线| 18禁成人网站免费观看| 西西人体大胆瓣开下部69| 涩涩AV| 亚洲精品日产精品乱码不卡| 日本高清不卡一区二区三| 制服丝袜先锋影音| 国产伦久视频免费观看视频| 国产在线你懂| 最近中文字幕免费mv在线视频| 国产精品中文字幕免费| 精品黑人一区二区三区国语馆|