<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      本地優先 AI 推理:高性價比文檔處理云架構模式

      0
      分享至


      作者 | Obinna Iheanachor

      譯者 | 明知山

      一種三層混合架構可將 Azure OpenAI 的成本降低 75%,并在 4700 份文檔的生產級工作負載中把處理耗時縮短 55%。2026 年云文檔處理的默認架構是將每份文檔都推送給托管 AI 端點,然后接收返回的結構化數據。這種方式雖然可行,但效率低下。在工程圖紙、發票、監管文件這類具有固定結構化版式的文檔語料中,有 60% 至 70% 的輸入內容都可以通過確定性本地算法在毫秒級完成處理,且無需產生任何 API 調用成本。

      本文介紹了一種我稱之為本地優先 AI 推理(Local-First AI Inference)的可復用模式:這是一種三層架構,由確定性本地處理器處理大部分輸入內容,云端 AI 服務僅用于應對邊緣情況,人工審核層則用來限制錯誤率。云 AI 系統中最重要的架構選擇不在于選用哪款模型,而在于何時調用模型。本地優先模式打破了固有的默認做法,提出了一個核心問題:“這份文檔是否真的需要調用云端模型?”而不是不加區分地將所有內容都發送給端點。

      我在 Azure 上部署了這種模式,用于從 4700 多份工程圖紙 PDF 文件中提取元數據。采用純云端方案需要花費 47 美元的 Azure OpenAI API 調用費用,耗時 100 分鐘,且每份文檔都會存在幻覺風險。采用混合架構方案后,API 成本降至 10 至 15 美元,處理時長縮短至 45 分鐘,同時人工審核層有效控制了錯誤率。

      手動替代方案需要工程師逐份打開 PDF、查找標題欄,并把修訂信息錄入電子表格,每份文檔大約耗時 2 分鐘,4700 份文件合計約 160 個工時。按照工程人力費率計算,每次遷移流程的成本超過 8000 英鎊。這個系統已在四個站點投入使用。這種模式可推廣至所有輸入結構可預測的云 AI 工作負載場景:發票處理、合同信息提取、醫療記錄解析等。

      三層架構

      層級數量由失敗模式的數量決定。雙層系統(本地加云端)要么默認采信存在幻覺的云端結果,要么直接拒絕這類結果并丟失覆蓋率。四層系統會增加復雜度,但可靠性不會獲得相應的提升。三層架構是覆蓋全部三類失敗場景所需的最少層級:可通過規則直接處理的文檔(第 1 層)、需要通過視覺解析的文檔(第 2 層),以及以上兩種方式都不足以可靠處理、必須依靠人工介入審核的文檔(第 3 層)。

      第 1 層:本地確定性提取

      每份文檔都經過 PyMuPDF 本地提取環節進入處理流水線。第一層能以零 API 成本、單文檔約 3 秒的耗時處理 70% 至 80% 的文檔。這個層級采用高精準度、低召回率的設計原則:當無法確定結果時,會直接返回空值而不是猜測。它幾乎不會產生誤報,但會漏掉版式特殊的文檔,而這類文檔恰好可以交由第二層處理。

      第 2 層:云 AI 推理

      未能通過第一層處理的文檔會被渲染成圖像并發送給 Azure OpenAI 的 GPT-4 Vision 端點。這一層以每次調用約 1 美分、每份文檔約 10 秒的耗時處理 20% 至 30% 的文檔。它的失敗模式與第一層恰好相反:有可能給出看似篤定實則錯誤的結果。

      第 3 層:人工審核

      第一層與第二層產出結果存在沖突的文檔或是第二層返回低置信度輸出的文檔都會被標記為人工審核,這類文檔約占總量的 5%。


      圖 1. 本地優先 AI 推理架構——三層混合流水線

      注意圖 1 中各層之間的差異:

      • 第 1 層(本地 PyMuPDF 提取,占比 70% 至 80%,耗時約 3 秒,零成本),有置信度門控。

      • 第 2 層(Azure OpenAI Vision 兜底處理,占比 20% 至 30%,耗時約 10 秒,單次花費 1 美分)。

      • 第 3 層(人工審核,占比約 5%)。

      置信度評分:該模式的核心架構

      從第一層升級至第二層的決策由置信度評分函數驅動。候選內容先經過黑名單過濾,再根據四項加權標準進行打分。

      預過濾:黑名單

      在進行評分之前,顯式黑名單會剔除已知的誤報模式:截面標記(“SECTION C-C”)、網格參考字母、頁碼標識(“OF”)以及修訂歷史列標題。凡是匹配黑名單的候選項都會被直接剔除,不再參與后續評分。

      空間位置

      提取器將搜索限制在預期目標字段所在的文檔區域內(工程圖紙標題欄位于頁面底部 30%、右側 40% 的范圍)。該區域以外的候選項都會被舍棄。同樣的原則也適用于其他場景:發票號碼通常在右上角,合同日期則出現在序言部分。


      圖 2:帶注釋的工程圖紙

      圖 2 是一份代表性圖紙,包含標題欄(右下角)及 REV 值“E”、修訂歷史表(右上角,常見誤報來源),還有網格參考字母(邊框位置,極易被誤判為單字母修訂值)。

      錨點鄰近度

      靠近已知標簽(“REV:”、“DWG NO”、“SHEET”)的候選項會獲得更高分。與標簽精確相鄰(例如 “REV: E”)的得分最高;在同一區域內共同出現的得分則相對更低。

      格式合規性

      候選項會按照合規格式進行校驗:帶連字符的數字編號(1-0、2-0)、單個英文字母(A-Z)、雙字母組合(AA、AB)以及特殊值(EMPTY、NO_REV)。凡是不符合格式的候選項都會被做降分處理。

      上下文信號

      證實候選項有效性的次要指標包括:鄰近佐證標簽(SHEET、SCALE、DWG NO 在附近出現)、與其他已提取元數據的一致性,以及同一區域內不存在相互沖突的候選項。

      綜合得分計算如下:

      score = (40 * spatial) + (30 * anchor) + (20 * format) + (10 * context),

      其中空間維度為二元判定(在邊界區域內 / 不在邊界區域內),錨點權重隨著與最近標簽的像素距離衰減,格式維度同樣為二元判定(格式有效 / 格式無效);上下文則用來捕獲次要信號:鄰近佐證標簽(SHEET、SCALE、DWG NO 在附近出現)、與其他已提取元數據的一致性,以及同一區域內不存在沖突候選項。

      具體示例

      參考圖 2,PyMuPDF 從圖紙中提取文本,并在三個不同位置識別出字符“E”:位于右下角標題欄的 REV 字段內(緊鄰圖紙編號)、右上角修訂歷史表的最新條目處(附帶備注“New Release”),以及右側邊框上的網格參考字母。三處字符完全一致,這也正是空間評分機制至關重要的原因。

      網格參考字符“E”會因為無法通過空間過濾(處在標題欄邊界區域之外,空間得分為 0.0)立即被舍棄。修訂歷史處的“E”通過了空間過濾(位于頁面右側區域,空間得分為 1.0)與格式校驗(為合法單字母,格式得分為 1.0),但錨點得分僅為 0.2,原因是它處在 DESCRIPTION 列標題旁,而非 REV 標簽旁;上下文得分為 0.0,因其周邊標簽(LTR、REVISION、DPT)與佐證標簽集合(SHEET、SCALE、DWG NO)并不匹配,綜合得分為 66。標題欄處的“E”空間得分為 1.0(處于邊界區域內),錨點得分為 1.0(與“REV”標簽直接相鄰),格式得分為 1.0(合規單字母),上下文得分為 0.8(SHEET、SCALE、DWG NO 均在周邊區域),綜合得分為 98。系統以高置信度選定標題欄的“E”,直接輸出結果,無需調用云端 API。倘若它的得分為 72(例如 REV 標簽破損或缺失,僅能依靠位置做推斷),則會被送入第二層進行云端核驗。

      路由閾值設置如下:90 分及以上直接輸出結果(高置信度),50 至 89 分觸發第二層校驗,低于 50 分則啟動完整云端提取。

      驗證方法與提示詞迭代

      通過分層抽樣構建了包含 400 份文件的驗證集,涵蓋 PDF 格式(含文本型與掃描型,貼合語料庫 7:3 的比例)、版本格式(五個類別均有樣本覆蓋)以及文檔年份(1995 至 2024 年,包含掃描質量與標題欄布局的各類變化)。真實標簽由工程師手動標定,工程師逐份打開文檔并記錄版本 REV 值。對于模糊樣本(掃描破損、版式特殊的文檔),由第二位工程師獨立復核數值。存在分歧的樣本(約占整體的 3%),通過查閱實體圖紙檔案最終裁定。

      系統提示詞經過了五輪迭代,每一輪迭代均由一類特定錯誤觸發:

      每輪迭代都會在部署前對完整的 400 份文件數據集進行測試。僅優化某一類格式但會導致其他類別性能下降的更改會作為性能回歸予以駁回。整體準確率從 89% 提升至 98%,歷時三周、歷經五個迭代周期,每個周期都專門針對當前占比最高的單一錯誤類型,而非盲目進行大范圍泛化優化。

      權衡分析

      純云方案與混合方案之間 2% 的準確率差距在脫離上下文的情況下具有誤導性。純云方案 98% 的準確率意味著仍有 2% 的文檔會默認接收錯誤結果,且沒有任何機制能夠識別這類疏漏。對于工程圖紙而言,錯誤的版本修訂號可能會導致按照過時規格生產零部件,這類靜默錯誤遠比已知遺漏風險更高。混合方案的預審核準確率略低,僅有 96%,但由人工審核的 5% 文檔可捕獲剩余的錯誤,最終審核后的實際準確率可超 99%。核心問題不在于預審核數值誰更高,而在于產生的錯誤是靜默隱藏還是被主動暴露。

      云部署與運維

      云推理應該被視為異常處理路徑,而非默認的路徑。本節中的每一項架構設計決策均遵循這一原則。

      Azure OpenAI 治理

      我使用 Azure OpenAI 服務(而非直接調用 OpenAI API),確保可以將文檔內容保留在組織的 Azure 租戶環境內。系統主動管理速率限制(嚴格控制在配額上限內,而不是等到觸發 429 錯誤后重試)。圖像以 150 DPI 分辨率渲染,因為針對 400 份文件驗證集的測試表明,72 DPI 會降低掃描件的識別準確率,而 300 DPI 使會負載體積翻倍,卻不會帶來效果提升。預調用驗證(旋轉校正、空白頁檢測)防止了約 5% 的 API 調用被浪費。

      可觀測性

      結構化日志會記錄每層路由去向、置信度得分、處理耗時,以及每份文檔的 Azure OpenAI 詞元消耗量。漂移檢測用于監控運行過程中第一層的成功率:若數值持續下降,說明語料庫中的文檔格式已發生變化。第二層調用失敗時,采用指數退避策略進行重試(最多重試三次),之后再路由至第三層。對于產生幻覺的結果,絕不使用相同提示詞進行重試。

      模型升級即基礎設施遷移

      在 GPT-4.1 上運行穩定后,我使用相同的生產提示詞在 GPT-5+ 上進行基準測試,針對相同的 400 份文件驗證集且未對新模型做任何修改。整體準確率表現持平,兩者均達到 98%。我按照文檔類別對結果做了細分:文本清晰且標題欄規整的 PDF、打印質量欠佳的掃描件,以及過往易產生誤報的特殊布局圖紙。三類文檔的表現均相差無幾。GPT-5+ 既沒有識別出 GPT-4.1 遺漏的文檔,也未出現新的失敗類型。提取任務本質是在限定文檔區域內進行受空間約束的模式匹配,性能上限取決于系統能否鎖定正確識別區域并設置合理判定規則,而非大模型自身的推理能力。

      Azure 上的模型遷移工作(包含新部署、提示詞重新驗證、API 版本更新、速率限制測試以及完整驗證套件測試)只在新模型能夠為實際業務負載帶來可量化的提升時才有價值。本次場景中新模型并無實質提升,因此我繼續使用 GPT-4.1,規避了不必要的遷移成本與工作量。

      多站點架構

      該系統已從單站點命令行工具擴展為部署在四個工程站點上的內部 Web 應用。

      身份驗證與治理

      用戶通過 Azure AD 安全組進行身份驗證。Azure OpenAI 服務主體采用權限受限的獨立應用注冊,與用戶會話解耦。API 密鑰存儲在 Azure Key Vault 中,運行時通過托管身份進行讀取,任何站點均無法直接訪問憑證信息。


      圖 3. 多站點部署架構

      圖 3 展示了進行本地第一層提取的各站點節點,這些節點通過 Azure AD、密鑰保管庫及托管身份接入共享的 Azure OpenAI 環境。系統同時配備了站點本地文檔存儲,并支持元數據統一輸出。

      計算、存儲與作業編排

      本地提取任務(第 1 層)在每個站點自己的計算資源上運行。Azure OpenAI 端點是共享的,并在各站點之間分配速率限制配額,防止某一個站點的大批量作業擠占其他站點資源。每次提取任務均以批處理作業形式提交;Web 應用程序先驗證上傳的文件,將其寫入暫存區域并加入作業排隊。作業在每個站點內按順序執行,但在各站點之間是獨立并行運行的。上傳的文檔保留在站點本地存儲中,只有結構化元數據(CSV 輸出)傳給下游資產管理系統所用的共享網絡路徑。因此,原始文檔永遠不會離開它們所在的站點。新站點上線需要部署 Web 應用程序、添加 Azure AD 安全組并分配速率限制配額,無需修改提取邏輯或 Azure OpenAI 部署配置。

      該模式的局限性

      當三個條件同時滿足時,本地優先 AI 推理模式就會奏效:目標字段具備可預測的空間位置、語料庫包含大量文本類文件,且任務僅涉及單一且定義明確的數值。若無法滿足以上條件,則采用替代架構會更為合適。

      無空間約定

      對于自由格式文檔(會議記錄、普通信函),第 1 層不存在相關錨點,所有文檔都會進入第 2 層。此時運行的是有額外開銷的純云架構。在這些情況下,可以直接跳過本地層,并投入精力設計結構化提示詞,對輸出結果進行模式驗證。

      以掃描為主的語料庫

      如果 80% 或更多的文檔是掃描圖像,本地提取幾乎無法處理。此時應轉向純云架構,同時采用高效批處理、請求并行化,以及重復文檔模板的緩存層方案。

      多字段依賴

      提取相互依賴的字段(發票行項目,其中數量、價格和總額必須一致)會讓置信度閾值更難校準。采用結構化輸出驗證的云優先方案,由模型將所有字段以 JSON 格式返回,再通過后處理步驟校驗內部一致性,這種方式遠比依靠脆弱的跨字段規則做本地提取更為可靠。

      快速變化的文檔格式

      黑名單與空間啟發式規則均針對已知語料庫做了適配調整。若文檔格式頻繁變動(如新供應商、新標題欄布局),第一層的識別成功率會下降,維護成本也隨之增加。對于高度異構的文檔來源,結合少樣本提示詞、并以格式檢測分類器作為路由層的云優先處理方案,相比人工調校的空間規則,能夠更平穩、順暢地自適應適配。

      查看英文原文

      https://www.infoq.com/articles/local-first-ai-inference-cloud/

      聲明:本文為 AI 前線編譯,不代表平臺觀點,未經許可禁止轉載。

      會議推薦

      Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?

      AICon 上海站 2026,13 大重磅專題已上線,誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題

      今日薦文


      你也「在看」嗎?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      夯爆了!U17國足橫掃3大強隊闖進亞洲杯決賽,亞足聯:實至名歸

      夯爆了!U17國足橫掃3大強隊闖進亞洲杯決賽,亞足聯:實至名歸

      何老師呀
      2026-05-20 06:59:43
      內馬爾:名單公布后我哭了好幾個小時,一路走到這真的不容易

      內馬爾:名單公布后我哭了好幾個小時,一路走到這真的不容易

      懂球帝
      2026-05-20 08:00:16
      武大校長可以辭職了!一個平庸的領導者,是整個大學的災難

      武大校長可以辭職了!一個平庸的領導者,是整個大學的災難

      麥大人
      2025-08-02 13:16:39
      蘇州拙政園“鳥啄櫻桃”火出圈,網友感嘆仿佛誤入古代工筆畫中,工作人員:這兩天還可觀賞

      蘇州拙政園“鳥啄櫻桃”火出圈,網友感嘆仿佛誤入古代工筆畫中,工作人員:這兩天還可觀賞

      極目新聞
      2026-05-19 12:41:42
      程維高并非被一擼到底,下臺后享受副省級待遇,活了78歲

      程維高并非被一擼到底,下臺后享受副省級待遇,活了78歲

      史不語
      2026-05-13 08:10:10
      C羅沒有吸引力?19歲前鋒送阿森納奪冠 拒絕代表葡萄牙踢世界杯

      C羅沒有吸引力?19歲前鋒送阿森納奪冠 拒絕代表葡萄牙踢世界杯

      智道足球
      2026-05-20 09:53:18
      美國畫的大餅碎了,日菲連夜 “變臉”,臺海風向徹底逆轉

      美國畫的大餅碎了,日菲連夜 “變臉”,臺海風向徹底逆轉

      瀲滟晴方DAY
      2026-05-20 11:55:57
      趙繼偉新的東家浮出水面?

      趙繼偉新的東家浮出水面?

      體育哲人
      2026-05-19 23:31:31
      存儲漲價,賣二手的愛回收Q1凈利潤增長近8成|看財報

      存儲漲價,賣二手的愛回收Q1凈利潤增長近8成|看財報

      鈦媒體APP
      2026-05-20 10:32:39
      謝爾基在解說臺前停球失誤,遭到解說嘉賓“無情嘲諷”

      謝爾基在解說臺前停球失誤,遭到解說嘉賓“無情嘲諷”

      懂球帝
      2026-05-20 03:05:17
      快訊!張雪機車立大功了!

      快訊!張雪機車立大功了!

      故事終將光明磊落
      2026-05-20 10:01:08
      女生主動起來有多黏人?網友:這些女的太開放了

      女生主動起來有多黏人?網友:這些女的太開放了

      帶你感受人間冷暖
      2026-01-27 00:20:06
      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      周軍律師聊案子
      2026-04-21 09:50:16
      49歲當大官,73歲被開除黨籍!薄一波親家李雪峰,后勁太大了

      49歲當大官,73歲被開除黨籍!薄一波親家李雪峰,后勁太大了

      混沌錄
      2026-05-19 19:23:07
      3次精準預言俄烏走向,這位歷史老師的眼光有多毒?

      3次精準預言俄烏走向,這位歷史老師的眼光有多毒?

      麥大人
      2025-11-05 15:45:51
      明晚,成品油價或迎第八輪上漲

      明晚,成品油價或迎第八輪上漲

      財聞
      2026-05-20 13:05:10
      馬刺臉盲癥:“雙胞胎”瓦塞爾與卡斯爾,誰才是圣村真超跑?

      馬刺臉盲癥:“雙胞胎”瓦塞爾與卡斯爾,誰才是圣村真超跑?

      仰臥撐FTUer
      2026-05-19 11:45:05
      楊紫也救不活《家業》?爆是爆了,但網友棄劇理由一致

      楊紫也救不活《家業》?爆是爆了,但網友棄劇理由一致

      星宿影視鴨
      2026-05-20 11:24:03
      NBA獨行俠有大動作!參與東契奇交易的都將被解雇,球隊推倒重建

      NBA獨行俠有大動作!參與東契奇交易的都將被解雇,球隊推倒重建

      丹妮觀
      2026-05-20 10:55:29
      女籃世界杯賽程出爐!中國球迷又要熬夜:生死戰被安排在凌晨2點

      女籃世界杯賽程出爐!中國球迷又要熬夜:生死戰被安排在凌晨2點

      籃球快餐車
      2026-05-20 05:37:22
      2026-05-20 13:35:00
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
      1509文章數 149關注度
      往期回顧 全部

      科技要聞

      一文看懂谷歌I/O2026:谷歌打響智能體大戰

      頭條要聞

      烈性犬咬死2歲女童狗主人賠25萬 狗被警方無公害處理

      頭條要聞

      烈性犬咬死2歲女童狗主人賠25萬 狗被警方無公害處理

      體育要聞

      不再美麗的阿森納,終于成為英超冠軍

      娛樂要聞

      舒淇大方承認:卸了妝就是50 歲的模樣

      財經要聞

      白酒榜|汾酒營收凈利雙增 口子窖"造富"

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態度原創

      時尚
      家居
      房產
      藝術
      本地

      為了攻克漸凍癥,她把自己活成了“破冰”的人

      家居要聞

      日常印記 靜謐溫馨

      房產要聞

      7516元/㎡,161套一次全甩!海口住宅最低價出現了!

      藝術要聞

      18幅 玫瑰花與女子畫作

      本地新聞

      別搜晉江小說了,去看真的晉江

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产v亚洲v天堂a无| 欧美va亚洲va在线观看不卡| japanese无码中文字幕| 亚洲精品tv久久久久久久久久| 婷婷丁香五月激情综合| 秋霞无码久久久精品| 亚洲av中文乱码乱人伦在线| 免费A级毛片中文字幕| 暖暖 免费 高清 日本 在线观看5 色老头亚洲成人免费影院 | 日韩欧美人妻一区二区三区| 日韩欧美视频一区二区三区| 久久精品中文字幕少妇| 欧美亚洲| www.日韩av| 国产一区国产精品自拍| 永久免费不卡在线观看黄网站| 青青青爽在线视频观看| 国产高清在线男人的天堂| 亚洲综合色丁香婷婷六月图片 | 精品无人区无码乱码毛片国产 | 国产自产精品露脸刺激91在线| 中文字幕精品人妻熟女| 人妻久久999精品1024| 亚洲精品A| 亚洲精品中文av在线| 人妻熟女一区无中文字幕| 久久水蜜桃亚洲av无码精品麻豆 | 久久国产成人亚洲精品影院老金| 婷婷色综合成人成人网小说| 精品国产三级在线观看| 亚洲无码一区二区百度| 黄色三级片视频| 男人下部进女人下部视频| 亚洲av乱码一区二区| 伊人一区| 色又黄又爽18禁免费视频| 亚洲色综合久久五月| 亚洲精品动漫在线观看| 综合一区二区| 97欧美精品系列一区二区| 久久99精品久久久久久9|