網易首頁 > 網易號 > 正文申請入駐

谷歌面試官：“以后面試都允許用 Gemini。” 我：“那還考什么？” 面試官：“考你會不會被 AI 帶溝里。”

2026-05-18 14:28:44　來源: 程序員魚皮

上海舉報

分享至

代碼面開 AI，不是開卷考

今天鴨鴨刷到一條挺有意思的招聘新聞。

外媒 Business Insider 報道稱，谷歌內部文件顯示，從今年下半年起，計劃在軟件工程師招聘的“代碼理解”面試環節，允許候選人使用谷歌官方認證的 AI 助手；試點階段將統一使用自研模型 Gemini。谷歌發言人向媒體證實了這一安排。

報道里寫得很具體：候選人要在現有代碼庫里做閱讀、排錯和優化；面試官會重點看“AI 應用熟練度”，包括提示詞工程、對 AI 輸出結果的核驗，以及調試能力。谷歌把整套新流程定調為“人為主導、AI 輔助”，說是想更貼近生成式 AI 時代工程師的真實工作狀態。

試點會先落在美國部分團隊，面向初、中級崗位，谷歌云以及平臺與設備等業務線會先試。如果跑得順，再擴到更多業務和地區。

嗯，讀到這兒很多人第一反應可能是：那不就是開卷嗎。

但鴨鴨想先把話說在前面：

允許帶 Gemini 進考場，不等于題目變簡單。它更像把考場從“默寫語法”挪到“帶一個會瞎編的實習生一起干活”。你不會驗，他寫得越快，你死得越快。

為啥鴨鴨會這么看？

第一，代碼理解本來就不是比誰敲得快。陌生倉庫里找 bug、理調用鏈、判斷一次改動會不會牽一發而動全身，這些活以前靠手寫思路；現在多了一條：你得判斷 AI 給你的“捷徑”是不是在抄近道抄進溝里。

第二，報道里提到的考核點，其實是在把工程師拆成兩半。一半是“會不會指揮 AI”，提示詞怎么寫、上下文怎么給、約束怎么說清楚；另一半是“敢不敢簽字”，AI 改完你敢不敢說這版能合、能發、能背鍋。缺一半，面試里都會露餡。

第三，這事不是谷歌一家自嗨。報道里還提到，澳大利亞公司 Canva 早在 2025 年 6 月就要求相關崗位候選人在技術面試里必須用 Copilot、Cursor 或 Claude 這類工具。美國 AI 編程公司 Cognition 也對 Business Insider 表示，已經把 AI 使用納入面試流程，還把“面試禁用 AI”比作“讓孩子不帶計算器參加數學考試”。行業方向很直白：以后默認工作流里就有 AI，面試還在假裝沒有 AI，反而失真。

第四，皮查伊在 2026 年 4 月 22 日谷歌 Cloud Next 活動上說過，谷歌內部約 75% 的新代碼由 AI 生成。這個數字不是用來嚇唬人的，是用來解釋公司為什么要改面試題。公司真正想問的是：當 AI 能吐出海量代碼時，你還剩下什么不可替代的判斷力。

那這事兒對正在準備面試的人意味著啥？

鴨鴨說幾句實在話。

別把“會用 AI”理解成“會點生成”：面試里更值錢的是你怎么拆問題、怎么限定 AI 的發揮范圍、怎么對輸出做對照驗證。會點生成的人一抓一把，敢驗收的人不多。
刻意練“讀陌生代碼 + 小步驗證”：給自己找一段不熟悉的開源模塊，先用 AI 生成三種改法，再逐條對照測試用例、邊界條件和性能影響。練的是肌肉記憶，不是 prompt 玄學。
準備一兩個“AI 翻過車”的真實例子：面試里能講清楚你怎么發現 AI 給的建議不靠譜、你怎么糾偏，比背八股更像高級工程師。
心態上把它當成開卷里的閉卷：卷子是開的，評分標準沒開。公司要的是你能不能把 AI 的產出變成可上線的結果。

大家怎么看？如果國內大廠跟進“代碼理解環節允許官方 AI”，你覺得公平嗎，還是更卷了？歡迎評論區聊聊～

今天鴨鴨和大家分享一道 AI大模型面試題。

【什么是大模型微調？與預訓練的核心區別是什么？】

回答重點

大模型微調就是在預訓練模型的基礎上，用特定任務的數據對模型做二次訓練，讓它從"通才"變成某個領域的"專家"。

跟預訓練的核心區別有三點：

1）目標不同。預訓練是讓模型學通用的語言理解能力，在幾百 GB 甚至幾 TB 的通用語料上訓練，比如維基百科、書籍、網頁。微調是讓模型適應特定任務，比如情感分析、代碼生成、醫療問答，用的是跟任務相關的小規模標注數據

2）數據規模差異大。預訓練動輒用幾萬億 token 的數據，訓練成本是幾百萬甚至上千萬美元。微調可能只需要幾千到幾十萬條標注樣本，幾張 A100 跑幾個小時就能搞定

3）學習方式不同。預訓練主要是自監督學習，讓模型預測下一個 token 或者還原被遮蓋的詞，不需要人工標注。微調通常是監督學習，需要輸入輸出配對的標注數據

擴展知識為什么需要微調

預訓練模型雖然能力強，但它學的是通用知識，面對特定場景還是差點意思。比如用 GPT 直接做法律合同審查，它可能連行業術語都理解不準；用它做客服問答，回復風格可能跟公司調性對不上。

微調就是一個性價比極高的中間方案，不用從零開始訓練，也不用忍受通用模型在特定場景的平庸表現。

主流微調策略

1）全參數微調，把模型所有參數都拿出來重新訓練。效果最好，但成本也最高。一個 70B 參數的模型，光加載到 GPU 就需要 140GB 顯存，還得額外留空間存梯度和優化器狀態，沒有幾十張頂級顯卡根本跑不動

2）部分參數微調，凍結大部分層，只訓練最后幾層或者特定模塊。減少了計算量，但效果往往不如全參數微調

3）參數高效微調 PEFT，這是現在的主流做法。核心思路是往原模型里插入少量可訓練參數，原模型參數全部凍結。LoRA是最流行的一種，它在 attention 層的權重矩陣旁邊加兩個低秩矩陣，訓練時只更新這兩個小矩陣。一個 7B 的模型用 LoRA 微調，可訓練參數可能只有幾百萬，顯存占用直接降一個數量級

LoRA 的原理

LoRA 基于一個假設：微調時權重的變化量是低秩的，不需要更新整個大矩陣。

原本要更新的權重矩陣 W 是 d×d 的，比如 4096×4096，有 1600 多萬參數。LoRA 把變化量分解成兩個小矩陣 A 和 B 的乘積，A 是 d×r，B 是 r×d，r 一般取 8 或 16。這樣可訓練參數從 d2 降到 2dr，壓縮了幾百倍。

推理時把 LoRA 矩陣合并回原權重，不增加任何推理延遲。而且可以給同一個基座模型掛不同的 LoRA 權重，實現多任務切換。

微調數據的質量比數量重要

搞微調最容易踩的坑就是迷信數據量。其實幾千條高質量數據的效果往往比幾萬條噪聲數據好。Alpaca 當年只用了 52000 條數據就把 LLaMA 調成了能聊天的模型。

高質量數據的標準：指令清晰、回答準確、覆蓋多樣場景、格式一致。與其花時間爬更多數據，不如花時間清洗和篩選已有數據。

篇幅有限，完整答案可以點擊下方小程序進行查閱：

我們精選了近兩年的高頻面試真題，已經有 10000 多道面試題目啦，由大廠資深面試官手寫答案，押題命中率超高！

不僅有傳統八股文，場景題、項目題、系統設計題等等應有盡有，還在不斷更新中！

目前優惠最低特價 129 元即永久（限時上架）暢看所有面試題和答案，正式運營價格為 399+，不要錯過這次優惠哈！

且，現在邀請好友注冊并成為會員，還可獲得 10% 的分傭！詳情見面試鴨拉新邀請有賞規則（網頁版面試鴨點擊頭像查看）

網頁端網址：www.mianshiya.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.