代碼面開 AI,不是開卷考
今天鴨鴨刷到一條挺有意思的招聘新聞。
外媒 Business Insider 報道稱,谷歌內部文件顯示,從今年下半年起,計劃在軟件工程師招聘的“代碼理解”面試環節,允許候選人使用谷歌官方認證的 AI 助手;試點階段將統一使用自研模型 Gemini。谷歌發言人向媒體證實了這一安排。
![]()
報道里寫得很具體:候選人要在現有代碼庫里做閱讀、排錯和優化;面試官會重點看“AI 應用熟練度”,包括提示詞工程、對 AI 輸出結果的核驗,以及調試能力。谷歌把整套新流程定調為“人為主導、AI 輔助”,說是想更貼近生成式 AI 時代工程師的真實工作狀態。
試點會先落在美國部分團隊,面向初、中級崗位,谷歌云以及平臺與設備等業務線會先試。如果跑得順,再擴到更多業務和地區。
嗯,讀到這兒很多人第一反應可能是:那不就是開卷嗎。
但鴨鴨想先把話說在前面:
允許帶 Gemini 進考場,不等于題目變簡單。它更像把考場從“默寫語法”挪到“帶一個會瞎編的實習生一起干活”。你不會驗,他寫得越快,你死得越快。
為啥鴨鴨會這么看?
第一,代碼理解本來就不是比誰敲得快。陌生倉庫里找 bug、理調用鏈、判斷一次改動會不會牽一發而動全身,這些活以前靠手寫思路;現在多了一條:你得判斷 AI 給你的“捷徑”是不是在抄近道抄進溝里。
第二,報道里提到的考核點,其實是在把工程師拆成兩半。一半是“會不會指揮 AI”,提示詞怎么寫、上下文怎么給、約束怎么說清楚;另一半是“敢不敢簽字”,AI 改完你敢不敢說這版能合、能發、能背鍋。缺一半,面試里都會露餡。
第三,這事不是谷歌一家自嗨。報道里還提到,澳大利亞公司 Canva 早在 2025 年 6 月就要求相關崗位候選人在技術面試里必須用 Copilot、Cursor 或 Claude 這類工具。美國 AI 編程公司 Cognition 也對 Business Insider 表示,已經把 AI 使用納入面試流程,還把“面試禁用 AI”比作“讓孩子不帶計算器參加數學考試”。行業方向很直白:以后默認工作流里就有 AI,面試還在假裝沒有 AI,反而失真。
第四,皮查伊在 2026 年 4 月 22 日谷歌 Cloud Next 活動上說過,谷歌內部約 75% 的新代碼由 AI 生成。這個數字不是用來嚇唬人的,是用來解釋公司為什么要改面試題。公司真正想問的是:當 AI 能吐出海量代碼時,你還剩下什么不可替代的判斷力。
那這事兒對正在準備面試的人意味著啥?
鴨鴨說幾句實在話。
別把“會用 AI”理解成“會點生成”:面試里更值錢的是你怎么拆問題、怎么限定 AI 的發揮范圍、怎么對輸出做對照驗證。會點生成的人一抓一把,敢驗收的人不多。
刻意練“讀陌生代碼 + 小步驗證”:給自己找一段不熟悉的開源模塊,先用 AI 生成三種改法,再逐條對照測試用例、邊界條件和性能影響。練的是肌肉記憶,不是 prompt 玄學。
準備一兩個“AI 翻過車”的真實例子:面試里能講清楚你怎么發現 AI 給的建議不靠譜、你怎么糾偏,比背八股更像高級工程師。
心態上把它當成開卷里的閉卷:卷子是開的,評分標準沒開。公司要的是你能不能把 AI 的產出變成可上線的結果。
大家怎么看?如果國內大廠跟進“代碼理解環節允許官方 AI”,你覺得公平嗎,還是更卷了?歡迎評論區聊聊~
今天鴨鴨和大家分享一道 AI大模型面試題。
【什么是大模型微調?與預訓練的核心區別是什么?】
回答重點
大模型微調就是在預訓練模型的基礎上,用特定任務的數據對模型做二次訓練,讓它從"通才"變成某個領域的"專家"。
跟預訓練的核心區別有三點:
1)目標不同。預訓練是讓模型學通用的語言理解能力,在幾百 GB 甚至幾 TB 的通用語料上訓練,比如維基百科、書籍、網頁。微調是讓模型適應特定任務,比如情感分析、代碼生成、醫療問答,用的是跟任務相關的小規模標注數據
2)數據規模差異大。預訓練動輒用幾萬億 token 的數據,訓練成本是幾百萬甚至上千萬美元。微調可能只需要幾千到幾十萬條標注樣本,幾張 A100 跑幾個小時就能搞定
3)學習方式不同。預訓練主要是自監督學習,讓模型預測下一個 token 或者還原被遮蓋的詞,不需要人工標注。微調通常是監督學習,需要輸入輸出配對的標注數據
![]()
擴展知識為什么需要微調
預訓練模型雖然能力強,但它學的是通用知識,面對特定場景還是差點意思。比如用 GPT 直接做法律合同審查,它可能連行業術語都理解不準;用它做客服問答,回復風格可能跟公司調性對不上。
![]()
微調就是一個性價比極高的中間方案,不用從零開始訓練,也不用忍受通用模型在特定場景的平庸表現。
主流微調策略
1)全參數微調,把模型所有參數都拿出來重新訓練。效果最好,但成本也最高。一個 70B 參數的模型,光加載到 GPU 就需要 140GB 顯存,還得額外留空間存梯度和優化器狀態,沒有幾十張頂級顯卡根本跑不動
2)部分參數微調,凍結大部分層,只訓練最后幾層或者特定模塊。減少了計算量,但效果往往不如全參數微調
3)參數高效微調 PEFT,這是現在的主流做法。核心思路是往原模型里插入少量可訓練參數,原模型參數全部凍結。LoRA是最流行的一種,它在 attention 層的權重矩陣旁邊加兩個低秩矩陣,訓練時只更新這兩個小矩陣。一個 7B 的模型用 LoRA 微調,可訓練參數可能只有幾百萬,顯存占用直接降一個數量級
LoRA 的原理
LoRA 基于一個假設:微調時權重的變化量是低秩的,不需要更新整個大矩陣。
原本要更新的權重矩陣 W 是 d×d 的,比如 4096×4096,有 1600 多萬參數。LoRA 把變化量分解成兩個小矩陣 A 和 B 的乘積,A 是 d×r,B 是 r×d,r 一般取 8 或 16。這樣可訓練參數從 d2 降到 2dr,壓縮了幾百倍。
推理時把 LoRA 矩陣合并回原權重,不增加任何推理延遲。而且可以給同一個基座模型掛不同的 LoRA 權重,實現多任務切換。
微調數據的質量比數量重要
搞微調最容易踩的坑就是迷信數據量。其實幾千條高質量數據的效果往往比幾萬條噪聲數據好。Alpaca 當年只用了 52000 條數據就把 LLaMA 調成了能聊天的模型。
高質量數據的標準:指令清晰、回答準確、覆蓋多樣場景、格式一致。與其花時間爬更多數據,不如花時間清洗和篩選已有數據。
篇幅有限,完整答案可以點擊下方小程序進行查閱:
我們精選了近兩年的高頻面試真題,已經有 10000 多道面試題目啦,由大廠資深面試官手寫答案,押題命中率超高!
不僅有傳統八股文,場景題、項目題、系統設計題等等應有盡有,還在不斷更新中!
目前優惠最低特價 129 元即永久(限時上架)暢看所有面試題和答案,正式運營價格為 399+,不要錯過這次優惠哈!
且,現在邀請好友注冊并成為會員,還可獲得 10% 的分傭!詳情見面試鴨拉新邀請有賞規則(網頁版面試鴨點擊頭像查看)
![]()
網頁端網址:www.mianshiya.com
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.