馬斯克最新訪談談到:2026年實現AGI,奇點降臨。甚到有媒體解讀到:“留給舊世界的時間只剩2000天”。馬斯克說,到 2030 年,人工智能將超過所有人類智能的總和。在3 到 4 年內,Optimus 機器人在精密手術方面的表現將超越人類醫生。機器人擁有共享記憶、極限精度,且不受情緒干擾。馬斯克認為,雖然未來 3 到 7 年的過渡期會充滿動蕩和不安,但技術將最終消除物質匱乏、徹底改變醫療與能源,并將人類帶入一個以智能和豐饒為底色的全新時代。
2026年第一個月AI又開始加速:特斯拉、谷歌們要慌了……
特斯拉們,慌了?英偉達智能駕駛實測曝光:僅用一年追平馬斯克八年心血
GPT-5.2連肝7天,300萬行代碼造出Chrome級瀏覽器
特斯拉們,慌了?英偉達智能駕駛實測曝光:
僅用一年追平馬斯克八年心血
![]()
來源:新智元
【導讀】 英偉達汽車業務雖僅占總收入1%,但十年積累已成氣候。與Uber合作、推廣L2級城市功能,到2028年實現L3高速公路駕駛,英偉達只用1年幾乎完全追上了馬斯克的FSD。
舊金山,晴空萬里。
記者Andrew J.Hawkins坐進了一輛奔馳CLA的副駕駛。
駕駛座上的安全員盧卡斯雙手雖然虛握著方向盤,但顯然只是為了合規——車輛完全在自主思考。
在近40分鐘的體驗中,沒有發生任何碰撞事故,甚至幾乎沒有任何頓挫。
結束后,Hawkins不禁發出了一聲感嘆:英偉達的自動駕駛即將起飛,特斯拉真的該著急了。
![]()
這或許會讓馬斯克脊背發涼:英偉達僅用1年時間就實現了城市自動駕駛功能,而特斯拉為此花費了整整8年。
比FSD更安全?
英偉達聯手奔馳首秀智能駕駛
這輛測試車搭載了英偉達全新的點對點L2++級輔助駕駛系統。
![]()
舊金山的街道,如往日一般繁忙和混亂。
在測試中,車輛需要避讓送貨卡車、穿行的騎行者、行人,甚至還要與Waymo的無人出租車「比賽」。
![]()
在英偉達AI系統與車輛自帶攝像頭、雷達的配合下,這輛奔馳從從容容、游刃有余:無論是復雜的四向停車路口、雙排違停的車輛,還是偶爾的無保護左轉,都難不倒它。
最令人印象深刻的一幕是:為了繞過一輛擋路的卡車,系統主動發起了一個大角度右轉,但在執行動作前,它非常紳士地禮讓了幾位緩慢過馬路的行人。
特斯拉粉絲可能會對英偉達的演示嗤之以鼻,認為馬斯克花了8年時間打造的「FSD」遙遙領先,能力要高出幾個數量級。
的確,并不是所有智能駕駛都叫「FSD」(完全自動駕駛)。
不過,從實際體驗來看,英偉達在最復雜路況下的表現,絕對有實力與特斯拉一較高下。
而且奔馳車輛的雷達提供了冗余感知能力,有人甚至會說這套系統比純視覺方案的FSD更安全、更穩健。
但也大可不必把兩家公司視為仇寇。
畢竟,特斯拉是英偉達最重要的客戶之一,其AI模型訓練依賴著數萬顆英偉達GPU,這代表著價值數十億美元的人工智能基礎設施投入。
因此,即使最終特斯拉獲勝,從某種意義上看,英偉達同樣是贏家。
英偉達:在汽車領域十年的投入
英偉達的智能駕駛系統,讓人頗感意外。
畢竟,它并非公認的自動駕駛領頭羊。
盡管英偉達長期以來一直為各大汽車制造商提供用于輔助駕駛系統的芯片和軟件,但與其在 AI 領域狂攬的數十億美元相比,其汽車業務的規模仍微不足道。
英偉達汽車部門負責人吳新宙表示,自2015年以來,英偉達以Drive品牌為汽車提供芯片和其他技術,但這仍是公司業務中的一小部分。
截至2025年10月,汽車和機器人芯片僅占5.92億美元銷售額,約占英偉達總收入的1%。
![]()
英偉達正在打造汽車科技業務。圖為2023年6月5日,公司位于加利福尼亞圣克拉拉汽車維修廠的自動駕駛測試車
在過去十多年里,英偉達已投入數十億美元打造一套全棧式解決方案,涵蓋系統級芯片(SoC)、操作系統、軟件和硅片技術。
這其中就包括英偉達的Drive AGX系統級芯片(SoC),該系統基于Blackwell GPU架構,據稱每秒可執行1000萬億次高性能計算操作(TOPS),類似于特斯拉的「完全自動駕駛」芯片或英特爾旗下Mobileye的EyeQ芯片。
英偉達將這些供應商提供的傳感器融合成一個無縫生態系統,涵蓋攝像頭、雷達、激光雷達和超聲波技術。
它還通過低延遲互連實現了制動、懸掛和轉向的跨域控制。
吳新宙對媒體說:「黃仁勛總是說,我和我團隊的使命實際上就是讓一切移動的物體都實現自主化。」
物理AI的ChatGPT時刻
最近,首款基于英偉達自駕系統的奔馳CLA,獲得了五星級歐洲NCAP安全評級,Nvidia驅動的主動安全功能為這一成績做出了貢獻。
在CES 2026上,英偉達發布了Alpamayo,專為應對自動駕駛長尾難題而設計,首次將視覺-語言-行動(VLA)人工智能引入量產車。
Alpamayo系列還包括用于自動駕駛開發的仿真工具與數據集。
![]()
Alpamayo 1、AlpaSim和Physical AI開放數據集,能夠助力開發具備人類判斷力、可感知、推理和行動的車輛——使開發者能夠微調、提煉和測試模型,從而解鎖更高的安全性、魯棒性和可擴展性。
Alpamayo系列引入了基于鏈式思維推理的視覺語言動作模型,將類人思維帶入自動駕駛決策過程。
這些系統能夠逐步思考新穎或罕見場景,從而提升駕駛能力和可解釋性。
這對于在智能汽車中建立可擴展的信任與安全至關重要。
英偉達創始人兼首席執行官黃仁勛表示:
物理AI的「ChatGPT時刻」已經到來——機器開始理解、推理并在現實世界中行動。
![]()
他認為:「自動駕駛出租車是最先受益的領域之一。Alpamayo為自動駕駛汽車帶來了推理能力,使它們能夠仔細思考罕見場景,在復雜環境中安全駕駛,并解釋其駕駛決策——這是實現安全、可擴展自動駕駛的基礎。」
英偉達在自動駕駛上的野心
2025年10月,英偉達與Uber建立自動駕駛出租車合作關系,并準備于2026年向更多汽車制造商推廣。類似Waymo無人駕駛出租車的「小規模」L4試驗也計劃在2026年展開,隨后將于2027年通過與合作伙伴部署機器人出租車服務。
英偉達汽車部門負責人吳新宙介紹:
2026年上半年推出L2級高速與城市駕駛功能,包括自動變道、識別停車標志和交通信號燈等。
到下半年,英偉達計劃將城市駕駛能力擴展至自動泊車。
到2026年底,英偉達的L2++自動駕駛系統預計將覆蓋整個美國。
對于L2和L3級車輛,英偉達計劃使用基于Drive AGX Orin的SoC;而對于真正的L4級全自動駕駛車輛,則會轉向新一代的Thor芯片。
在2026年開展「小規模」L4級道路測試(類似Waymo的自動駕駛出租車)。
他還分享了更遠的計劃:
在2027年與合作伙伴共同推進Robotaxi部署。
到2028年,英偉達計劃提供支持L3級高速公路駕駛的系統,允許駕駛員在特定條件下放開方向盤并移開視線。
黃仁勛選擇了與馬斯克不一樣的路線
在1月5號拉斯維加斯CES大會的發布會,英偉達表示汽車制造商可以使用其每顆約 3500 美元的 Drive AGX Thor 汽車電腦,節省研發成本,并更快地將自動駕駛功能推向市場
與特斯拉試圖追求完全的自動駕駛不同,英偉達提供的方案中,允許駕駛員放開雙手駕駛的最終決定權掌握在整車廠(OEM)手中。
英偉達還將他們與汽車制造商合作,對自動駕駛功能進行個性化的定制需求,使車企可以設定諸如加減速、變道時機和駕駛風格等參數。
這種靈活性使每個車企都能展現自己獨特的「駕駛個性」,比如讓系統開起來像一輛奔馳,而不是千篇一律的「通用型」自動駕駛。
![]()
比如奔馳就采用了一種名為「協同轉向(cooperative steering)」的機制,允許駕駛員在不退出L2輔助駕駛系統的情況下進行細微的轉向調整,比如在遇到系統未識別為障礙物的坑洼路面時手動微調方向。
駕駛員也可以通過輕踩油門來啟動車輛或略微提速,同樣無需關閉輔助系統。
與馬斯克FSD試圖追求完全的自動駕駛不同,英偉達并不是要為所有人解決駕駛問題。他們的目標是「可用性」:想用這套部分自動化系統的人可以使用,不想用的人也可以輕松選擇退出。
同時,英偉達的這套系統基于強化學習,意味著它會隨著經驗積累持續改進。
長途城市路況的對比測試中,英偉達系統的駕駛員干預次數與FSD已經不相上下,而這只花了一年的時間,要知道實現這一目標,英偉達可不像特斯拉花了8年時間,分析的數十億行駛里程。
在未來幾個月內,奔馳開始搭載該技術,而這會讓特斯拉聲稱的在自動駕駛領域領先地位變得搖搖欲墜。
有趣的是,機器人領域也投射出類似的血腥屠殺。特斯拉承諾打造大量機器人,但英偉達已經在為波士頓動力、卡特彼勒和 LG 電子等公司的下一代機器人提供動力。
參考資料:
https://www.theverge.com/news/852880/nvidia-autonomous-driving-demo-tesla-fsd
https://www.cnbc.com/2026/01/05/nvidia-plans-to-test-a-robotaxi-service-in-2027-in-self-driving-push.html
https://www.autoevolution.com/news/nvidia-s-autonomous-driving-and-robotics-projects-deliver-brutal-reality-check-to-tesla-263676.html
https://teslanorth.com/2026/01/05/nvidia-announces-new-self-driving-ai-to-rival-tesla-fsd/
GPT-5.2連肝7天,300萬行代碼造出谷歌Chrome級瀏覽器
![]()
來源:新智元
【導讀】一個大模型持續寫代碼,能寫多久?一小時?一天?還是像大部分AI編程工具那樣,完成一個任務就結束對話?Cursor的CEO MichaelTruell決定搞一次極限壓力測試!
Michael Truell讓Cursor中的GPT-5.2連續運行了整整一周。
不是一小時,不是一天,而是不眠不休,晝夜不停,168小時持續寫代碼。
結果?
300萬行代碼。數千個文件。
AI完全從零構建出一個全新瀏覽器。
![]()
而且,還是Chrome那種瀏覽器。
HTML解析、CSS布局、文本渲染、還有一個自研的JavaScript虛擬機——全是AI自己寫的。
Michael Truell輕描淡寫地發了條推文:它基本能跑!簡單的網頁能快速且正確地渲染出來。
![]()
一個模型究竟能跑多久
傳統的AI編程工具,比如Github Copilot和早期的其他IDE,都是一問一答模式。
對話長度有限,上下文有限,任務復雜度有限。
后來出現了所謂的Agentic編程——Claude Code、Cursor Agent、Windsurf等工具讓AI可以自主執行多步任務,讀取文件、運行命令、修復錯誤。
這已經是很大的進步,但大多數情況下,任務仍然以分鐘計算,最多幾小時。
AI完成一個功能,人類review,然后繼續下一個任務。
但沒有人嘗試過讓一個模型連續跑一周。
直到GPT-5.2。
Cursor團隊讓GPT-5.2持續運行了整整一周,不是斷斷續續,而是連續工作。
![]()
在這一周里,它:
寫下了超過300萬行代碼
創建了數千個文件
執行了數萬億個token
從零構建了一個完整的瀏覽器渲染引擎
一個模型究竟能運行多久?
答案是:理論上,可以無限。
只要基礎設施穩定,只要任務足夠明確,AI就能持續工作——不眠不休,不吃不喝,7×24小時全年無休。
就像澳洲的放羊大叔的「賽博黑工」。
但實際上,不同模型的「耐力」差異巨大。
上下文窗口是第一道門檻。
早期的GPT-3.5只有4K token上下文,意味著對話稍長就會失憶。
Claude 3推出了200K上下文,GPT-4 Turbo跟進128K,Gemini 1.5 Pro更是號稱支持100萬token。
但上下文長度只是理論值——真正考驗的是模型在長任務中能否保持一致性、專注度和執行力。
Cursor團隊在實驗中發現了關鍵差異。
![]()
在Cursor這篇官方博客中,團隊在實驗中發現了關鍵差異:
GPT-5.2能長時間自主工作,遵循指令精準,保持專注不偏離;
Claude Opus 4.5傾向盡早結束,走捷徑,頻繁把控制權交還給用戶;
GPT-5.1-Codex雖專為編碼訓練,但規劃能力不如GPT-5.2,所以容易中斷。
用更直白的話說:Opus像個急躁的實習生,干一會就想問「這樣行不行?我先交了哈」;
![]()
而GPT-5.2像個老練的高級工程師,交代清楚任務就埋頭干到底。
這也是為什么Cursor官方宣稱:GPT-5.2是處理長期運行任務的前沿模型。
不止瀏覽器。
Cursor還透露了其他正在運行的實驗項目:JavaLSP、Windows 7模擬器和Excel克隆。
數據都很夸張,AI自己不停地寫了55萬行代碼、120萬行代碼和160萬行代碼。(話說,Excel代碼比Windows還多點,因吹斯汀)
![]()
多智能體系統協作
一個模型在一周內寫300萬行代碼,注意是不停的寫,沒有人類干預!
這顯然不是一個模型「單打獨斗」,怎么做到的?
Cursor團隊透露了他們的秘密武器:多智能體系統(Multi-Agent System)。
![]()
最初,他們嘗試讓所有Agent平等協作,通過共享文件來同步狀態。結果發現:
Agent會持有鎖太久,或者干脆忘記釋放鎖。二十個Agent的速度下降到相當于兩三個Agent的有效吞吐量。
![]()
這像極了人類團隊中常見的問題:會議太多、溝通成本高、責任邊界不清。
最終有效的方案是分層架構:
規劃者(Planners):持續探索代碼庫,創建任務,進行高層決策
執行者(Workers):專注于完成具體任務,不關心全局,提交后繼續下一個
評審(Agent):判斷每輪迭代是否合格,決定是否進入下一階段
這幾乎是人類軟件公司的組織架構:產品經理/架構師負責規劃,程序員負責執行,QA負責評審。
但區別在于——這是成百上千個Agent同時工作。
Cursor團隊實現了上百個Agent可以在同一個代碼庫上協同工作數周,幾乎沒有代碼沖突。
這意味著AI已經學會了人類團隊需要多年才能磨合出的協作默契。
瀏覽器的「護城河」
比你想象的要深得多
如果聽到「不就是個顯示網頁的軟件嗎」這種評價,所有做過瀏覽器內核的工程師大概都會苦笑。
在計算機科學的鄙視鏈里,手寫瀏覽器內核的難度,僅次于手寫一個操作系統。
為了讓你對這300萬行代碼有個概念,我們需要看一眼谷歌的Chromium(Chrome的開源母體)。
作為人類軟件工程的巔峰之一,Chromium的代碼量早已突破3500萬行。
它不僅僅是一個軟件,本質上已經是一個「偽裝成應用程序的操作系統」。
GPT-5.2挑戰的究竟是什么?
首先是CSS的「混沌理論」。
網頁排版從來不是簡單的堆積木。
CSS標準里充滿了各種歷史遺留的怪癖、層疊規則(Cascade)和復雜的繼承邏輯。
一位前火狐瀏覽器工程師曾打過比方:實現一個完美的CSS引擎,就像是在模擬一個物理法則隨心所欲變化的宇宙。你改動一個父元素的屬性,可能導致幾千個子元素的布局瞬間崩塌。
其次是「虛擬機里的虛擬機」。
這次AI不僅寫了界面,還寫了一個JS虛擬機。
現代網頁跑的JavaScript代碼需要內存管理、垃圾回收(GC)和安全沙箱。
稍微處理不好,網頁就會吃光你的內存,或者直接讓黑客穿透瀏覽器接管電腦。
最要命的是,它選了Rust。
Rust這門語言以「絕不妥協的安全」著稱,它的編譯器就像一位極度神經質的考官。
人類工程師在寫業務邏輯時,往往要花一半的時間和編譯器「吵架」,處理借用檢查(BorrowChecker)和生命周期問題。
AI不僅要懂業務,還得在幾百萬行代碼的規模下,讓這位「考官」挑不出毛病。
能在七天內把這些硬骨頭啃下來,并且讓它們協同工作,這已經不是簡單的「寫得快」了,這意味機器開始具備了頂級的架構掌控力。
當AI能夠「忍受孤獨」
但這則新聞真正的炸點,其實不在于瀏覽器本身,而在于那個「Uninterrupted」(無中斷)。
這是AI進化的分水嶺。
在此之前,我們熟悉的AI編程工具(比如早期的Copilot)的情況是:你寫個函數頭,它補全五行代碼;你發個指令,它生成一個腳本。
它們的記憶是碎片化的,注意力是短暫的。
一旦任務稍微復雜一點,比如「重構這個模塊」,它們往往會顧頭不顧尾,改了這頭壞了那頭,最后還得人來擦屁股。
但這次不一樣。這是一次「長時任務」的勝利。
這300萬行代碼分布在數千個文件里。
當AI寫到第300萬行時,它必須依然「記得」第1行代碼里定下的架構規矩;
當渲染引擎和JS虛擬機打架時,它必須能回溯幾萬行代碼去尋找Bug的源頭。
這168個小時里,GPT-5.2肯定寫出過Bug。
但它沒有停下來報錯等待人類投喂答案,而是自己讀取錯誤日志,自己調試,自己重構,然后繼續前行。
這種「編寫-運行-修復」的自主閉環,曾經是我們人類工程師最引以為傲的護城河。
現在,這條護城河被填平了。
我們正在目睹AI從「聊天伴侶」向「數字勞工」的質變。
以前我們指揮AI做「任務」,比如「寫個貪吃蛇」;
現在我們指揮AI做「項目」,比如「造個瀏覽器」。
沉默的螺旋
雖然這個AI版瀏覽器的成熟度距離Chrome還有很長的路要走,但它證明了路徑的可行性。
當算力可以轉化為極其復雜的工程實施能力時,軟件開發的邊際成本將趨近于零。
這場實驗最令人震撼的,其實不是屏幕上那個渲染出的網頁,而是那個在后臺沉默運行了整整七天的進度條。
它不眠不休,不急不躁,以每秒數千字符的速度構建著數字世界的基石。
也許我們該重新審視「創造」的定義了。
只有當工具開始獨自在深夜里解決問題時,我們才明白,它不再只是工具,而是我們的同行者。
從澳洲大叔的「賽博黑工」
到AI長時任務
用5行代碼逼瘋硅谷的澳洲放羊大叔,其實只做了一件事情,就是讓AI不達目標不能停止。
![]()
至于Prompt.md寫了什么命令,并不是重點。
就像今天Cursor CEO搞的這個極限壓力測試一樣,目標就是造一個Chrome、造一個Windows、開發一個Excel,只要沒完成目標,AI就要一直運行下去。 回到最開始那個問題:
一個AI究竟能自己干多久?
物理上的答案是無窮。只要你有足夠的算力、穩定的基礎設施、清晰的任務定義,AI可以無限運行下去。
但更重要的是,這改變了軟件開發的經濟學。
傳統軟件開發的主要成本是人力和時間。
一個10人團隊開發一個復雜項目,可能需要6個月到數年。每個月的人力成本可能是幾十萬到上百萬。
現在,AI可以在一周內完成原本需要數月的工作。
成本可能只是一些token費用,Emad Mostaque(Stability AI前CEO)猜測Cursor瀏覽器項目可能消耗了約30億個token。
他還有一個想法:用多少token能夠重寫一套Windows級別的操作系統?成本如何?
![]()
Token是越來越便宜的,就像之前的水和電,最終基于token的算力也會變得極其廉價。
于是,軟件經濟學就被徹底顛覆。比如,軟件按照授權付費的方式恐怕要消失了。
在2026年的今天,軟件開發正在經歷一場基因級別的變異。
從前,代碼是人類一行一行敲出來的產物。
未來,代碼可能只是人類意圖的自動展開:你描述你想要什么,AI就能把它變成現實。
一個模型能跑多久?
只要你需要,它就能跑下去。
參考資料:
https://x.com/mntruell/status/2011562190286045552
https://x.com/leerob/status/2011565729838166269
https://cursor.com/cn/blog/scaling-agents
為偉大思想而生!
AI+時代,互聯網思想(wanging0123),
第一必讀自媒體
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.