<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      OpenAI 「實(shí)時(shí)語音」架構(gòu)首次公開

      0
      分享至

      PRODUCT

      Realtime API 是 OpenAI 的實(shí)時(shí)語音交互接口,在 24 年的 DevDay 首次亮相,當(dāng)時(shí)還是 beta,調(diào)用貴到離譜,音頻輸出 200 刀/百萬 token:

      兩個(gè)月后新加坡 DevDay,我在現(xiàn)場(chǎng)看了多語言混合輸入輸出的演示,情緒和語氣都非常到位,比 Whisper 鏈路的效果好了一個(gè)量級(jí)

      之后經(jīng)歷了 WebRTC 支持、SIP 電話接入、圖片輸入、多輪調(diào)價(jià),到 2025 年 8 月正式 GA?,F(xiàn)在這套系統(tǒng)服務(wù)數(shù)億周活用戶,語音 AI 這條線上,目前沒有第二家能打的

      Realtime API 這個(gè)東西,最牛逼的是延遲:從你對(duì)著手機(jī)說一句話開始,到聽到 AI 返回聲音為止,只需要不到 0.3 秒

      在這個(gè)過程中,聲音變成數(shù)據(jù)包,穿過 Wi-Fi、運(yùn)營商的網(wǎng)絡(luò)、橫跨大半個(gè)互聯(lián)網(wǎng),到達(dá) OpenAI 的服務(wù)器。然后,服務(wù)器跑完推理、生成語音,再原路返回。整個(gè)過程必須快到讓你感覺不到延遲,就像跟一個(gè)真人在說話

      對(duì)于這玩意兒是怎么實(shí)現(xiàn)的,OpenAI 今天發(fā)了個(gè)技術(shù) Blog,來詳細(xì)介紹了下


      https://openai.com/index/delivering-low-latency-voice-ai-at-scale/

      然后...第二作者,是麥當(dāng)勞

      核心信息包括:

      → OpenAI 沒有用行業(yè)默認(rèn)方案,自己設(shè)計(jì)了relay + transceiver兩層架構(gòu),前者只負(fù)責(zé)轉(zhuǎn)發(fā)數(shù)據(jù)包,后者負(fù)責(zé)所有通話狀態(tài)

      → relay 極其輕量,不解密、不解碼、不參與任何協(xié)商,只看數(shù)據(jù)包頭部的一小段標(biāo)記就知道往哪兒轉(zhuǎn)

      → 全球各地部署了相同的 relay 入口,用戶的數(shù)據(jù)包在離自己最近的地方進(jìn)入 OpenAI 的網(wǎng)絡(luò)

      → relay 用 Go 語言寫的,沒有用更底層的高性能方案,因?yàn)閴蛴昧?/p>

      → 整套架構(gòu)跑在 Kubernetes 上,對(duì)外只暴露少量固定端口

      技術(shù)方案選型

      OpenAI 用的實(shí)時(shí)通信協(xié)議叫WebRTC,就是你平時(shí)微信視頻通話、Google Meet 開會(huì)時(shí)底層跑的那套技術(shù)。它是一個(gè)開放標(biāo)準(zhǔn),能在瀏覽器、手機(jī)和服務(wù)器之間傳輸?shù)脱舆t的音頻和視頻

      做 WebRTC 服務(wù),行業(yè)里有一個(gè)默認(rèn)選擇叫SFU(選擇性轉(zhuǎn)發(fā)單元)。簡(jiǎn)單說就是一個(gè)中轉(zhuǎn)站,每個(gè)參與者跟它建一條連接,它負(fù)責(zé)把聲音和畫面轉(zhuǎn)發(fā)給其他人。多人視頻會(huì)議用這個(gè)方案很合適,音視頻編解碼、錄制、策略控制都集中管理


      SFU 方案:AI 作為 WebRTC 參與者加入,適合多方通話

      OpenAI 的場(chǎng)景不一樣。絕大多數(shù)會(huì)話是 1:1,一個(gè)用戶對(duì)一個(gè)模型,每一輪對(duì)話都對(duì)延遲極度敏感。SFU 帶來的多方通話基礎(chǔ)設(shè)施,在這個(gè)場(chǎng)景里是多余的

      他們還評(píng)估過另一個(gè)常規(guī)方案TURN,這是 WebRTC 穿透防火墻時(shí)常用的中繼方式。但 TURN 要求中繼節(jié)點(diǎn)持有客戶端的連接分配狀態(tài),不夠輕量

      最后選的方案叫 transceiver 模型:在網(wǎng)絡(luò)邊緣部署一個(gè) WebRTC 服務(wù),負(fù)責(zé)跟客戶端完成連接建立、加密握手這些協(xié)議工作,然后把收到的音頻轉(zhuǎn)成更簡(jiǎn)單的內(nèi)部協(xié)議,分別送給后面的推理、轉(zhuǎn)錄、語音合成服務(wù)。所有通話狀態(tài)集中在 transceiver 一個(gè)地方,后端的 AI 服務(wù)可以當(dāng)普通服務(wù)來擴(kuò)展,完全不需要懂 WebRTC


      transceiver 方案:在邊緣終止 WebRTC,轉(zhuǎn)換為后端協(xié)議

      端口占用問題

      選定 transceiver 方案之后,還有一個(gè)工程問題要解決:端口占用

      傳統(tǒng) WebRTC 部署里,每個(gè)通話需要占用一個(gè)獨(dú)立的網(wǎng)絡(luò)端口。當(dāng)同時(shí)通話的用戶有幾百萬個(gè)的時(shí)候,端口會(huì)不夠用。OpenAI 的基礎(chǔ)設(shè)施跑在容器化平臺(tái) Kubernetes 上,沒法給每個(gè)容器預(yù)留幾千個(gè)公網(wǎng)端口

      他們的做法是把數(shù)據(jù)包的「轉(zhuǎn)發(fā)」和「處理」拆成兩層

      relay是第一層,部署在面向公網(wǎng)的入口。它是一個(gè)極輕的 UDP 轉(zhuǎn)發(fā)服務(wù):不解密通話內(nèi)容,不跑任何協(xié)議狀態(tài)機(jī),不參與編解碼協(xié)商,不知道你在說什么。它只做一件事,讀取數(shù)據(jù)包頭部的一小段標(biāo)記來判斷這個(gè)包屬于哪個(gè)會(huì)話,然后轉(zhuǎn)發(fā)給對(duì)應(yīng)的 transceiver

      transceiver是第二層,在 relay 后面。它擁有通話的全部協(xié)議狀態(tài),包括 ICE 連通性檢查、DTLS 加密握手、SRTP 媒體解密,以及會(huì)話的整個(gè)生命周期。從用戶的手機(jī)或?yàn)g覽器來看,通話行為沒有任何變化


      relay 只做無狀態(tài)轉(zhuǎn)發(fā),transceiver 持有完整會(huì)話狀態(tài)

      relay 持有的信息極其精簡(jiǎn):一條內(nèi)存中的轉(zhuǎn)發(fā)映射(這個(gè)客戶端的包往哪個(gè) transceiver 送),加幾個(gè)監(jiān)控計(jì)數(shù)器和過期定時(shí)器。沒有持久化,沒有協(xié)議參與。如果 relay 重啟了,下一個(gè)數(shù)據(jù)包到達(dá)時(shí)就能自動(dòng)重建路由

      解決首響應(yīng)問題

      Realtime API 最牛逼的地方,是在 0.3 秒內(nèi)完成首響應(yīng),這就需要對(duì)首包進(jìn)行路由管理。用戶發(fā)出的第一個(gè)數(shù)據(jù)包到達(dá) relay 時(shí),relay 還沒有任何關(guān)于這個(gè)用戶的信息,但它必須立刻知道往哪里轉(zhuǎn)發(fā)。在這一步中,如果停下來查數(shù)據(jù)庫或者問別的服務(wù)都會(huì)增加延遲,是不行的

      OpenAI 利用了 WebRTC 協(xié)議自帶的一個(gè)機(jī)制:ICE ufrag(ICE 用戶名片段)。這是在通話建立階段雙方交換的一個(gè)短標(biāo)識(shí)符,之后客戶端發(fā)的每個(gè)連通性檢查包都會(huì)帶上它。OpenAI 在服務(wù)端生成 ufrag 時(shí),把路由需要的信息編碼在了里面

      具體流程:通話建立時(shí),transceiver 分配好會(huì)話狀態(tài),在協(xié)商應(yīng)答(SDP answer)里返回一個(gè)共享的 relay 虛擬 IP 和 UDP 端口??蛻舳丝吹降氖且粋€(gè)固定的目標(biāo)地址,比如203.0.113.10:3478,背后其實(shí)是整個(gè) relay 集群

      客戶端發(fā)出的第一個(gè)數(shù)據(jù)包通常是一個(gè) STUN binding request。relay 只解析這個(gè)包頭部的 ufrag 字段,解碼出路由提示,把包轉(zhuǎn)發(fā)給擁有該會(huì)話的 transceiver。之后這個(gè)客戶端的所有后續(xù)包都走同一條已建立的路


      從連接建立到媒體傳輸?shù)耐暾麜r(shí)序:Client → LB → Relay → Transceiver

      容災(zāi)方面,Redis 緩存了「客戶端 IP:Port → transceiver IP:Port」的映射。relay 重啟后可以在下一個(gè) STUN 包到來之前就從 Redis 恢復(fù)轉(zhuǎn)發(fā)路徑,進(jìn)一步縮短中斷窗口

      進(jìn)行全球部署

      如果用戶在北京說一句話,如果數(shù)據(jù)包要跑到美國西海岸才開始處理,單程網(wǎng)絡(luò)延遲就可能超過 150 毫秒,一來一回 300 毫秒。對(duì)話體驗(yàn)會(huì)明顯卡頓。解決辦法是讓數(shù)據(jù)包盡早進(jìn)入 OpenAI 自己的高速網(wǎng)絡(luò)

      relay 的公網(wǎng)暴露面縮到少量固定地址和端口之后,同一套轉(zhuǎn)發(fā)邏輯就能在全球各地復(fù)制部署。OpenAI 把這個(gè)叫Global Relay,一組地理分布式的 relay 入口點(diǎn),都運(yùn)行相同的包轉(zhuǎn)發(fā)行為


      Global Relay 接收全球客戶端的數(shù)據(jù)包,轉(zhuǎn)發(fā)給 transceiver 集群

      用戶的數(shù)據(jù)包在離自己最近的入口進(jìn)入 OpenAI 網(wǎng)絡(luò),然后通過內(nèi)部骨干網(wǎng)到達(dá) transceiver。跟直接穿越公網(wǎng)相比,延遲更低,抖動(dòng)更小,丟包更少

      整套架構(gòu)跑在 Kubernetes 上不需要暴露成千上萬個(gè) UDP 端口。更小且固定的暴露面更容易做安全策略和負(fù)載均衡,擴(kuò)展時(shí)也不需要預(yù)留大段公網(wǎng)端口范圍

      底層是 Go 寫的

      做實(shí)時(shí)媒體轉(zhuǎn)發(fā),常規(guī)選擇是 C/C++ 或者 Rust,有些追求極致的團(tuán)隊(duì)甚至?xí)?kernel bypass,繞過操作系統(tǒng)內(nèi)核讓程序直接操作網(wǎng)卡。OpenAI 的 relay 用 Go 寫,這在行業(yè)里算非常規(guī)

      他們?cè)?Go 運(yùn)行時(shí)層面做了幾個(gè)針對(duì)性優(yōu)化:

      SO_REUSEPORT讓同一臺(tái)機(jī)器上多個(gè) relay 進(jìn)程共享同一個(gè) UDP 端口,操作系統(tǒng)內(nèi)核在它們之間分配數(shù)據(jù)包,避免單一進(jìn)程成為瓶頸

      runtime.LockOSThread把每個(gè)負(fù)責(zé)讀 UDP 數(shù)據(jù)的 goroutine 釘在一個(gè)固定線程上,配合 SO_REUSEPORT,同一個(gè)通話的包傾向于落在同一個(gè) CPU 核心,緩存命中率更高

      → 預(yù)分配內(nèi)存緩沖區(qū),最小化數(shù)據(jù)拷貝,避免在轉(zhuǎn)發(fā)熱路徑上觸發(fā) Go 的垃圾回收

      這套實(shí)現(xiàn)撐住了全球的實(shí)時(shí)媒體流量,relay 集群規(guī)模相對(duì)不大。所以他們沒有進(jìn)一步走 kernel bypass 路線

      補(bǔ)充一個(gè)細(xì)節(jié):OpenAI 使用了Pion,一個(gè) Go 語言的 WebRTC 開源庫。Pion 的作者 Sean Der 在 Hacker News 上確認(rèn)了這一點(diǎn)

      三條設(shè)計(jì)原則

      對(duì)于這個(gè)項(xiàng)目,OpenAI 在總結(jié)了三條原則,對(duì)任何做實(shí)時(shí)系統(tǒng)的團(tuán)隊(duì)都有參考價(jià)值:

      硬性狀態(tài)集中在一個(gè)地方transceiver 擁有 ICE、DTLS、SRTP 和會(huì)話生命周期,relay 只轉(zhuǎn)發(fā)。狀態(tài)集中意味著出了問題只查一個(gè)地方

      在已有信息上做路由ICE ufrag 是協(xié)議自帶的標(biāo)識(shí)符,把路由信息編碼在里面,首包到達(dá)時(shí)就能路由,不需要在熱路徑上加外部查詢

      夠用就不換Go 配合幾個(gè)內(nèi)核級(jí)優(yōu)化對(duì)當(dāng)前負(fù)載已經(jīng)夠用,就沒有上 kernel bypass。先跑起來,再?zèng)Q定要不要換更重的方案

      實(shí)時(shí)語音 AI 能跑起來,靠的是基礎(chǔ)設(shè)施讓延遲變得感知不到

      OpenAI 改變的是 WebRTC 部署的內(nèi)部形態(tài),但沒有改變客戶端對(duì) WebRTC 協(xié)議的預(yù)期

      openai.com/index/delivering-low-latency-voice-ai-at-scale

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      5月8日俄烏最新:以牙還牙

      5月8日俄烏最新:以牙還牙

      西樓飲月
      2026-05-08 18:40:39
      81年彭真會(huì)見江青,江青大罵一句,彭真一臉淡定:你還有什么要求

      81年彭真會(huì)見江青,江青大罵一句,彭真一臉淡定:你還有什么要求

      大運(yùn)河時(shí)空
      2026-05-09 09:30:03
      剛剛,全線拉升!美聯(lián)儲(chǔ),降息大消息

      剛剛,全線拉升!美聯(lián)儲(chǔ),降息大消息

      中國基金報(bào)
      2026-05-08 22:34:31
      韓國寺廟給機(jī)器人剃度:1.35萬美元的Gabi成 Buddhist monk

      韓國寺廟給機(jī)器人剃度:1.35萬美元的Gabi成 Buddhist monk

      碼上閑敘
      2026-05-08 09:40:01
      中方關(guān)鍵時(shí)刻伸出援手,給生死存亡的老杜家族,送出了一絲希望

      中方關(guān)鍵時(shí)刻伸出援手,給生死存亡的老杜家族,送出了一絲希望

      阿七說體育
      2026-05-09 08:03:51
      太突然了!杜鋒被曝可能不再續(xù)約,廣東隊(duì)第一個(gè)消息就讓球迷破防

      太突然了!杜鋒被曝可能不再續(xù)約,廣東隊(duì)第一個(gè)消息就讓球迷破防

      小娛樂悠悠
      2026-05-09 08:40:45
      全部推倒重建!天津一爛尾豪宅已拆除,項(xiàng)目要被盤活了!近期規(guī)劃又有調(diào)整

      全部推倒重建!天津一爛尾豪宅已拆除,項(xiàng)目要被盤活了!近期規(guī)劃又有調(diào)整

      天津人
      2026-05-09 06:08:07
      人民網(wǎng)三問鴻蒙智行

      人民網(wǎng)三問鴻蒙智行

      新浪財(cái)經(jīng)
      2026-05-08 09:10:45
      辣眼睛!韓安冉和景區(qū)里的NPC吻得難分難舍,路過的人都看呆了!

      辣眼睛!韓安冉和景區(qū)里的NPC吻得難分難舍,路過的人都看呆了!

      樂悠悠娛樂
      2026-05-09 10:31:53
      充電速度“行業(yè)墊底”,特斯拉的充電這么慢!為何沒有車主吐槽?

      充電速度“行業(yè)墊底”,特斯拉的充電這么慢!為何沒有車主吐槽?

      少數(shù)派報(bào)告Report
      2026-05-09 04:41:12
      中方?jīng)]想到,金磚國家赴美求和,給美國送上稀土資源,動(dòng)機(jī)不簡(jiǎn)單

      中方?jīng)]想到,金磚國家赴美求和,給美國送上稀土資源,動(dòng)機(jī)不簡(jiǎn)單

      半身Naked
      2026-05-09 08:51:58
      28歲守寡,村里一光棍趁雨夜翻墻進(jìn)來,我沒喊,反而給他煮了碗面

      28歲守寡,村里一光棍趁雨夜翻墻進(jìn)來,我沒喊,反而給他煮了碗面

      一口娛樂
      2026-05-09 05:47:03
      心理學(xué)有個(gè)殘忍發(fā)現(xiàn):讓一個(gè)人終身困在焦慮里、無法自拔,從不是缺愛缺安全感,而是這兩道“埋在意識(shí)底層的心理門檻”

      心理學(xué)有個(gè)殘忍發(fā)現(xiàn):讓一個(gè)人終身困在焦慮里、無法自拔,從不是缺愛缺安全感,而是這兩道“埋在意識(shí)底層的心理門檻”

      心理觀察局
      2026-05-09 09:10:05
      美國政府突然公開UFO檔案,看完有點(diǎn)無語

      美國政府突然公開UFO檔案,看完有點(diǎn)無語

      萬物皆可科普2啊
      2026-05-09 03:36:41
      三兄弟買下4臺(tái)挖掘機(jī),稱僅用幾個(gè)月就被人悄悄拖走 經(jīng)銷商方:和上級(jí)代理商的經(jīng)濟(jì)糾紛傷及無辜

      三兄弟買下4臺(tái)挖掘機(jī),稱僅用幾個(gè)月就被人悄悄拖走 經(jīng)銷商方:和上級(jí)代理商的經(jīng)濟(jì)糾紛傷及無辜

      紅星新聞
      2026-05-08 19:39:36
      “4只皮皮蝦1035元”店主事發(fā)次日病逝,年僅43歲;家人稱其有基礎(chǔ)病,事發(fā)前已腦出血,店鋪收到多起威脅電話,不打算繼續(xù)開業(yè)

      “4只皮皮蝦1035元”店主事發(fā)次日病逝,年僅43歲;家人稱其有基礎(chǔ)病,事發(fā)前已腦出血,店鋪收到多起威脅電話,不打算繼續(xù)開業(yè)

      揚(yáng)子晚報(bào)
      2026-05-08 12:46:41
      湖人G2慘敗陷絕境!詹姆斯賽后一針見血,盡顯巨星擔(dān)當(dāng)!

      湖人G2慘敗陷絕境!詹姆斯賽后一針見血,盡顯巨星擔(dān)當(dāng)!

      田先生籃球
      2026-05-08 14:02:52
      過去30年,中國男性平均身高實(shí)現(xiàn)驚人跨越,平均身高增長(zhǎng)超8厘米

      過去30年,中國男性平均身高實(shí)現(xiàn)驚人跨越,平均身高增長(zhǎng)超8厘米

      張可象博士
      2026-05-01 10:53:19
      大瓜!許家印昔日恒大奢靡細(xì)節(jié)流出,丁玉梅海外包養(yǎng)30歲白人小伙

      大瓜!許家印昔日恒大奢靡細(xì)節(jié)流出,丁玉梅海外包養(yǎng)30歲白人小伙

      壹月情感
      2026-05-09 00:00:07
      上海一男子進(jìn)理發(fā)店扔法拉利鑰匙炫富,完成約1000元染發(fā)后借口上廁所逃單,店員:跑得跟法拉利一樣快;目前店家尚未找到該男子

      上海一男子進(jìn)理發(fā)店扔法拉利鑰匙炫富,完成約1000元染發(fā)后借口上廁所逃單,店員:跑得跟法拉利一樣快;目前店家尚未找到該男子

      大象新聞
      2026-05-09 00:14:07
      2026-05-09 12:07:00
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      428文章數(shù) 53關(guān)注度
      往期回顧 全部

      科技要聞

      美國政府強(qiáng)力下場(chǎng) 蘋果英特爾達(dá)成代工協(xié)議

      頭條要聞

      年輕女子190元買榴蓮僅退款被拘留 代收點(diǎn)離家3公里

      頭條要聞

      年輕女子190元買榴蓮僅退款被拘留 代收點(diǎn)離家3公里

      體育要聞

      成立128年后,這支升班馬首奪頂級(jí)聯(lián)賽冠軍

      娛樂要聞

      張藝謀《印象劉三姐》全裸鏡頭引爭(zhēng)議

      財(cái)經(jīng)要聞

      Meta瘋狂擁抱人工智能:?jiǎn)T工苦不堪言

      汽車要聞

      全系智能泊車 鉑智3X年款升級(jí)限時(shí)權(quán)益價(jià)9.48萬起

      態(tài)度原創(chuàng)

      藝術(shù)
      教育
      游戲
      時(shí)尚
      家居

      藝術(shù)要聞

      齊白石 紫藤蜜蜂

      教育要聞

      北京師范大學(xué)第1專業(yè),就業(yè)現(xiàn)狀與報(bào)考性價(jià)比分析!#金榜同行人

      吃相難看!三大主機(jī)集體坐地漲價(jià) 玩家吐槽毫無底線

      盧昱曉真的要被審判到這種程度嗎?

      家居要聞

      菁英人居 全能豪宅

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 91中文字幕一区在线| 日本一区二区三本视频在线观看| 中文字幕乱码无码人妻系列蜜桃| 精品无码成人片一区二区| 精品人妻码一区二区三区| 仁化县| 综合久青草视频在线观看| 久久亚洲国产成人精品性色 | 东北妇女精品bbwbbw| 自拍偷在线精品自拍偷99| 无码少妇人妻一区二区三区久9| 国产成人精品无码播放| 超碰人人摸| 欧美人与物videos另类xxxxx| 久久只有这里有精品4| 一区二区三区国产不卡| 亚洲熟妇色自偷自拍另类| 亚洲日韩第9页| 欧美成人一区二区三区| 91青青草视频在线观看| 国产真实伦在线观看视频| 亚洲国产片一区二区三区| 91免费在线| 国产精久久一区二区三区| 久久加勒比| 超碰97人人做人人爱综合| 精品国产午夜福利在线观看 | 狠狠人妻久久久久久综合老师| 无码专区人妻系列制服丝袜| 日日做夜狠狠爱欧美黑人| 国产成人午夜精品福利| 香蕉EEWW99国产精选免费| 亚洲国产成人AⅤ片在线观看| 97人妻中文字幕精品| www午夜| 男人j进入女人j内部免费网站| 国产精品老熟女一区二区| 在线视频免费看3| 亚洲一区二区三区在线播放无码 | 国产美女午夜福利视频| 69人妻人人澡人人爽人人精品|