內(nèi)容提要:
本文通過實測五款主流AI工具制作“中國對歐美出口曲線圖”,對比了豆包、DeepSeek、Grok、Gemini及ChatGPT的優(yōu)劣。作者發(fā)現(xiàn)海外模型在數(shù)據(jù)準(zhǔn)確性、響應(yīng)速度及交互體驗上更勝一籌,而國內(nèi)的豆包、DeepSeek 存在明顯不足,國內(nèi) AI 或被高估,創(chuàng)新與實用性仍有差距。
![]()
在地緣政治變局與全球產(chǎn)業(yè)鏈重構(gòu)的背景下,歐盟產(chǎn)業(yè)政策正經(jīng)歷從“防御型監(jiān)管”向“安全優(yōu)先干預(yù)型治理”的深刻轉(zhuǎn)型。2026年3月,歐盟委員會發(fā)布《工業(yè)加速器法案》(Industrial Accelerator Act,以下簡稱IAA)立法提案草案。雖然IAA仍處于立法初期階段,但該立法條款已經(jīng)清晰釋放出歐盟以戰(zhàn)略自主、經(jīng)濟安全為核心的產(chǎn)業(yè)治理新邏輯。在IAA中,歐盟計劃通過公共采購傾斜、外資準(zhǔn)入限制、技術(shù)轉(zhuǎn)讓強制等政策工具,旨在重塑市場競爭秩序、規(guī)避外部風(fēng)險并推動本土制造能力重建。
三郎在研究IAA對中國出口的影響時,需要制作一張2010年以后中國對美國、歐盟商品出口的曲線圖,作為文章配圖,以便讀者能夠非常直觀地觀察到:在特朗普重返白宮后,通過關(guān)稅和非關(guān)稅措施,非常顯著地壓縮了從中國進口的成本。與此同時,較為緩和的歐盟,成為我們成功轉(zhuǎn)移美國市場損失的重要市場。
![]()
美國是全球最大的商品消費市場,歐盟的消費市場是僅次于美國的全球第二大市場。毫無疑問,如果我們的商品出口在全球兩大市場中皆失去市場份額,對中國的出口經(jīng)濟、制造業(yè)發(fā)展將構(gòu)成極大的利空。
為了尋找一張靠譜的曲線圖,三郎分別向五個人工智能工具的網(wǎng)頁版發(fā)出了指令。我對它們說:“2025年,中國對美出口大幅下降,對歐盟出口增長。請制作一張1280*768像素的2010-2025年中國對美國商品出口額和中國對歐盟商品出口額曲線圖。謝謝!”
下面是這五個人工智能工具給出的回饋,很有地域特色的回饋。
一、豆包生成了四張未搜索實際數(shù)據(jù)的毫無意義的趨勢圖。
![]()
為什么我認(rèn)為豆包壓根沒有搜索數(shù)據(jù)?大家看這四張曲線圖,除了趨勢是我們對美國出口下降,對歐盟出口增長外,每張圖的曲線都不一致。顯然是沒有數(shù)據(jù)支撐的示意圖,而非依靠數(shù)據(jù)制作的曲線圖。因為依靠數(shù)據(jù)制作曲線圖,曲線圖的樣式可以有變化,曲線的高低起伏,絕對應(yīng)該一致。
二、deepseek回饋了最多的漢字、數(shù)據(jù)和程序指令,但始終不能輸出一張曲線圖。
![]()
Deepseek輸出的內(nèi)容截圖,有較大篇幅的刪減。因為其中包含了太多它搜索網(wǎng)頁的過程內(nèi)容。它未能給出一張曲線圖,但給出了中國分別對美國、歐盟出口的數(shù)據(jù),經(jīng)比對數(shù)據(jù)來自國家統(tǒng)計局。同時給了一串代碼,還有詳細的EXCEL制表指南。
![]()
我提醒deepseek,我需要一張曲線圖,它很有意思地首先道歉,它說:“抱歉,我理解您的意思了——您要的是平滑的曲線圖,而不是帶有直線連接的折線圖。下面我改用三次樣條插值,生成真正平滑的曲線,并嚴(yán)格保持1280×768像素”。然后重新給了一段有所修改的python代碼。
![]()
Deepseek還非常貼心地告訴我,如果不愿意用這段代碼生成曲線圖,也可以使用EXCEL制圖。
三、Grok快速地給出了最近15年中國對歐盟和美國的商品出口額曲線圖,并按我的要求快速修改了曲線圖。
![]()
應(yīng)該是,馬斯克出品的Grok與其星鏈和特斯拉汽車一樣,還是比較優(yōu)秀的。Grok在收到我的要求后,沒有像deep seek那么故作神秘地給出很多后臺的搜索和思考信息,通過其后臺的調(diào)用過程,讓人覺得它很了不起,很高大上,似乎超越其他人工智能工具了。
deep seek在給出結(jié)果前先給出很多其后臺信息,是不是存在誘導(dǎo)人們覺得它很先進的嫌疑?三郎在想,其實一個人工智能工具的先進與否,使用者關(guān)心的不是過程,而是結(jié)果。與deep seek相比,Grok的過程非常簡潔,但結(jié)果令人滿意。因為三郎分別復(fù)核了Grok的制圖數(shù)據(jù),與美國商務(wù)部和歐盟統(tǒng)計局的數(shù)據(jù)相差無幾。
四、Gmini的響應(yīng)和準(zhǔn)確性令我非常滿意。
![]()
我向Gmini提出要求后,不到30秒即為我提供了基本符合我的要求的中對美、中對歐雙曲線圖。與豆包的大約110秒、deepseek的超過200秒、Grok的58秒相比,響應(yīng)速度最快。這可能與其數(shù)據(jù)中心、人工智能模型結(jié)構(gòu)有關(guān)。
Gmini令我滿意的第二點,是界面非常簡潔,只輸出結(jié)果,不提示中間過程。說實話,客戶使用人工智能工具,需要的便是準(zhǔn)確快捷的結(jié)果,只有人工智能從業(yè)者才需要從客戶需要到輸出結(jié)果的那些過程。畢竟在屏幕顯示過程,需要耗費時間,當(dāng)然,或許是模型運行速度較慢,用顯示過程來掩飾并營造一種低級的“高級感”也是一種技巧。
![]()
第三點是Gmini給出了簡明扼要的圖表說明,從尺寸與格式、數(shù)據(jù)趨勢到視覺設(shè)計。通過這些說明,用戶可以精準(zhǔn)地用Gmini的語言風(fēng)格與其對話,進一步修改、優(yōu)化曲線圖。
第四點是Gmini對其制作曲線圖表的數(shù)據(jù)來源進行了簡單的說明。他告訴我,2025年數(shù)據(jù)為基于海關(guān)前三季度及年度初步統(tǒng)計數(shù)據(jù)的估算值。這個數(shù)值在若干時間后可能會有變化。
第五點也是最有特色的一點,Gmini在對話框中提醒我,“您可以點擊預(yù)覽按鈕來查看這張交互式趨勢圖。如果您需要調(diào)整數(shù)據(jù)或顏色,請隨時告訴我”。Gmini與用戶的互動,非常友好。
五、ChatGPT給出的回應(yīng),包括了deepseek的全部,但它在python代碼框的右上角,給出了直接生成曲線圖的按鈕。
![]()
在與ChatGPT對話后,ChatGPT大約用55秒左右給出了回復(fù)。看到ChatGPT回應(yīng)的前半部,有一種與deepseek莫名的熟悉感。但仔細閱讀,發(fā)現(xiàn)又有巨大區(qū)別:
一是在其給出的回應(yīng)中,也如deepseek一樣沒有直接給出曲線圖,而是給出了制作曲線圖的python代碼。但在代碼框的右上角,deepseek給出的是“復(fù)制”、“下載”按鈕,而ChatGPT在代碼框的右上角,給出了直接生成曲線圖的“運行”按鈕。
![]()
這樣的結(jié)果意味著,我點擊ChatGPT的運行按鈕后,幾秒鐘便得到了我需要的曲線圖。但使用deepseek,不僅需要下載其python代碼,還需要使用scipy.interpolate.make_interp_spline生成曲線圖,如果不是程序員的用戶,得先安裝scipy。
我不知道坊間傳聞的關(guān)于deepseek來源的真實性。但管中窺豹,ChatGPT與deepseek大概率具有血緣關(guān)系,后者不僅有蒸餾其他大模型輸出結(jié)果的事實,大模型的代碼也給人一種有血緣關(guān)系,但遺傳基因沒有到位的感覺。
![]()
最近兩年,特別是去年deepseek推出后,中國的人工智能至少在國內(nèi)聲名鵲起,不少人認(rèn)為中國在人工智能硬件方面雖然弱于美國,但在人工智能軟件方面、電力供應(yīng)方面、人工智能人才方面、應(yīng)用場景方面,接近甚至領(lǐng)先美國。許多讀者應(yīng)該還記得,去年deep seek面世之后,我們的媒體和自媒體將中文中最厲害的溢美之詞都給予了它,認(rèn)為這是我國人工智能接近甚至超越美國的證據(jù)。
但有趣的是,最近發(fā)布的中國人期待已久的DeepSeek V4,在發(fā)布前討論熱度非常高,大家的期待非常多。但發(fā)布后很多人表示很失望,資本市場也反應(yīng)平平。到底是V4不行,還是有什么我們沒看明白的地方?
三郎認(rèn)為,可能是我們從一開始,就高估了國內(nèi)人工智能產(chǎn)品的先進性。可能在真實的人工智能世界中,我們作為模仿者、蒸餾者,一直在借鑒,但在創(chuàng)新和超越方面,話說得很大,實際效果可能差強人意。
【作者:徐三郎】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.