<ruby id="9ue20"></ruby>

国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线

<blockquote id="b9wrt"><i id="b9wrt"><noscript id="b9wrt"></noscript></i></blockquote>

<cite id="b9wrt"></cite>

<legend id="b9wrt"><track id="b9wrt"></track></legend>

<samp id="b9wrt"></samp>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權(quán)郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應(yīng)用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

大模型搞運籌，推理型栽了跟頭

2026-06-23 02:45:14　來源: 閃存獵手

北京舉報

0

分享至

周三晚，一個評測結(jié)果在運籌學圈炸了鍋。測試人員把優(yōu)化建模題目分別丟給推理大模型和普通大模型，等來的答案讓人大跌眼鏡：那些擅長解數(shù)學題的推理型選手，這回反而被普通模型甩在了身后。

這個“揭短”的評測工具叫ORGEval，一篇ICML workshop論文。它不直接看模型生成的模型能不能解出最優(yōu)值——因為傳統(tǒng)做法里，求解器評價存在三個坑：偶然正確、不可行問題、速度瓶頸。ORGEval換了個思路，用圖論來給大模型的建模能力“驗明正身”。

核心方法是這樣的：把模型輸出的優(yōu)化模型和標準答案都轉(zhuǎn)化成二分圖，然后用WL-test（Weisfeiler-Lehman同構(gòu)測試）和SD條件比較圖結(jié)構(gòu)。簡單說，不看模型算出來的數(shù)字對不對，而是看它“構(gòu)建問題”的結(jié)構(gòu)是否與標準一致。這就繞過了求解器偶然蒙對、或模型生成的約束自相矛盾導致不可行的干擾。

這個設(shè)計點破了之前的盲區(qū)：大模型做運籌學建模，強的未必是“推理”，而是對問題結(jié)構(gòu)的理解。論文發(fā)現(xiàn)，非推理模型在這個任務(wù)上整體表現(xiàn)更穩(wěn)，推理模型反而因過度發(fā)散、產(chǎn)生不合邏輯的約束，在圖結(jié)構(gòu)比對中漏洞百出。

結(jié)果雖然有點反直覺，但邏輯很直白。運籌建模需要先把現(xiàn)實問題抽象成變量與約束，這一步更多依賴對關(guān)系的把握，而非逐步推演。推理模型習慣給出長鏈條答案，在需要“快準狠”的結(jié)構(gòu)生成環(huán)節(jié)反而容易跑偏。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

清華微軟聯(lián)合提出STAR-PólyaMath，Apex基準超GPT-5.5 13.5%

機器之心Pro 2026-06-24 19:43:36
0 跟貼 0
SIGGRAPH 2026 | 無需訓練，一段單目視頻解鎖任意運鏡與子彈時間

機器之心Pro 2026-06-25 13:23:35
0 跟貼 0

目標1.7萬億美元市場！高通多元化戰(zhàn)略官宣，攥緊Agent時代算力“鑰匙”

智東西 2026-06-25 18:16:31
0 跟貼 0

讓大模型邊想邊說：這篇文章把「何時開口」變成可學習策略

機器之心Pro 2026-05-18 14:49:11
0 跟貼 0
爸爸覺得題目很簡單，可女兒卻不知道怎么做，網(wǎng)友：以為考歷史實則考語文

星沙時報 2026-06-23 17:54:28
0 跟貼 0

投資600萬元的加油站，建成即被“責令限期拆除”？河南淮濱縣發(fā)布情況通報

環(huán)球網(wǎng)資訊 2026-06-25 14:21:30
7576 跟貼 7576

謝寒冰批梁文杰邏輯錯亂：是民進黨改變兩岸現(xiàn)狀不是大陸

海峽導報社 2026-06-24 17:44:17
0 跟貼 0
頂級推理這一塊，過程全錯答案全對

墨水影視 2026-06-25 08:25:47
1 跟貼 1

DeepMind老兵，正在離開倫敦

機器之心Pro 2026-06-25 13:29:31
0 跟貼 0
這也太真實了，你們說對不對？

四川強哥 2026-06-24 19:19:15
0 跟貼 0
男生查分看到屏幕顯示不敢信，媽媽也蒙了，爸爸直呼“怎么可能”

星視頻 2026-06-25 11:45:00
106 跟貼 106
女子駕駛電動自行車橫穿馬路，進入盲區(qū)車輛被大貨車碾壓，幸好人沒事

鄭州新聞廣播 2026-06-25 07:58:11
0 跟貼 0
80%代碼由Claude合并，Anthropic內(nèi)部人員點破Agent真相

機器之心Pro 2026-06-25 10:52:57
0 跟貼 0
RoboScience機器科學發(fā)布Visics通用具身大模型，實現(xiàn)跨本體、跨物體、跨任務(wù)｜最前線

36氪 2026-06-25 15:47:30
0 跟貼 0
這道題目，早就忘記怎么做了吧

公考客棧店小二 2026-06-24 17:00:00
0 跟貼 0
郭春林 2026教育大變局！人才選拔邏輯已經(jīng)發(fā)生了改變

安安折紙 2026-06-24 02:57:06
1 跟貼 1
550數(shù)學聯(lián)賽：2012-9 對稱式和輪換對稱式題目簡單但難度很大

我服子佩 2026-06-22 12:24:33
1 跟貼 1
張維為：中國哲學從不信奉所謂的“絕對真理”

看看新聞Knews 2026-06-24 23:22:23
3925 跟貼 3925
王平河：江湖自有分寸（2/10）

金昔 2026-06-25 20:10:21
0 跟貼 0
答案會過期，問題不會 | 善友教授大課手記

混沌學園官方 2026-06-24 21:09:47
0 跟貼 0
「找視頻」到「產(chǎn)視頻」：快手RaG推動推薦系統(tǒng)邁向完全生成時代

機器之心Pro 2026-06-25 18:18:29
0 跟貼 0
俄境內(nèi)唯一氦氣廠不到一年再遭烏軍打擊

三湘都市報 2026-06-25 14:39:10
48 跟貼 48
插混vs增程，聊透邏輯，選購干貨，幫你少虧20萬！

X基地 2026-06-24 14:05:51
0 跟貼 0
特斯拉車機終于“換腦”：豆包管車，DeepSeek管聊

51qc我要汽車網(wǎng) 2026-06-25 18:12:16
4 跟貼 4
天天這樣子小朋友，都沒信心做題目了

公考客棧店小二 2026-06-21 10:00:00
0 跟貼 0
微信有77萬條未讀！多名老人被微信群“轟炸”，家屬稱投訴無門，律師解讀

瀟湘晨報 2026-06-25 21:31:17
373 跟貼 373
他們從四家頂尖AI實驗室辭職，要打造能自己跑實驗的AI系統(tǒng)

DeepTech深科技 2026-06-25 18:37:34
0 跟貼 0
不要小看題目啦，自己沒有做，老是逼我做題目

公考客棧店小二 2026-06-22 16:00:00
0 跟貼 0
多模態(tài)大模型視覺定位難題怎么解？

機器之心Pro 2026-06-10 11:31:45
0 跟貼 0
初中競賽幾何題目，求面積，答不對去復讀

大力小學數(shù)學 2026-06-24 06:59:00
0 跟貼 0
男子網(wǎng)購銀條，行情一跌就7天無理由退貨，商家：已反復退貨3次，銀價漲了他就要留，銀價跌了他就要退

揚子晚報 2026-06-25 07:14:44
2469 跟貼 2469
mRNA技術(shù)的6條療法新路線，誰將成為破局者？

醫(yī)學新視點 2026-06-25 21:08:46
0 跟貼 0
兒科其實是一個接近動物學的專科！來看看大家的經(jīng)歷吧！

另子維愛讀史 2026-06-25 21:49:20
8 跟貼 8
剛買的奔馳，只能停在車庫“吃灰”，類似情況的車主還不止1個人……浙江這家老牌奔馳4S店怎么了？

都市快報橙柿互動 2026-06-25 09:50:28
2624 跟貼 2624
老胡看了《抓特務(wù)》，冒昧說幾句真心話吧

新浪財經(jīng) 2026-06-25 23:18:50
3 跟貼 3
瑞士2-1加拿大兩隊攜手出線

財聯(lián)社 2026-06-25 05:12:50
222 跟貼 222
IBM開創(chuàng)“亞1納米”芯片時代：指甲蓋大小塞進千億晶體管

財聯(lián)社 2026-06-25 20:39:04
1 跟貼 1
莫氏雞煲流量退去以前一天賣200多只現(xiàn)在不到20只

極目新聞 2026-06-25 13:38:50
701 跟貼 701
韓紅老師的“走個面”，與馮導二十幾年的交情，估計從此分道揚鑣

吳學華看天下 2026-06-25 21:03:45
2 跟貼 2
男子開車時看到野生大熊貓，爬了半天沒爬上去后轉(zhuǎn)身就跑，熊貓：就知道拍，能不能過來搭把手

氧氣周末 2026-06-24 15:46:44
0 跟貼 0

選秀結(jié)束，費城完成補強，潛力后衛(wèi)加盟！76人離隊第一人確定了？

選秀結(jié)束，費城完成補強，潛力后衛(wèi)加盟！76人離隊第一人確定了？

體育大朋說

2026-06-25 12:12:46

突發(fā)！600759，副總經(jīng)理被調(diào)查

突發(fā)！600759，副總經(jīng)理被調(diào)查

大眾證券報

2026-06-25 23:21:40

俄軍高層向普京保證：人手夠就拿下烏四州

俄軍高層向普京保證：人手夠就拿下烏四州

桂系007

2026-06-26 00:00:29

月之暗面黃震昕：Kimi的目標是和海外那三家模型掰手腕

月之暗面黃震昕：Kimi的目標是和海外那三家模型掰手腕

IT之家

2026-06-25 17:08:08

警報拉響！菲律賓全面反華，連開3槍逼中國認栽，中國絕不退讓

警報拉響！菲律賓全面反華，連開3槍逼中國認栽，中國絕不退讓

陌上桃花開的

2026-06-25 03:37:01

宇樹機器人大降價

第一財經(jīng)資訊

2026-06-25 14:01:07

3換1！活塞達成交易！曝下一步梭哈詹姆斯

3換1！活塞達成交易！曝下一步梭哈詹姆斯

籃球?qū)崙?zhàn)寶典

2026-06-25 19:23:21

高中成績好不好，初中就能看出來！初中越吃力，高中越有可能掉隊

高中成績好不好，初中就能看出來！初中越吃力，高中越有可能掉隊

好爸育兒

2026-04-07 17:07:54

庫尼亞：內(nèi)馬爾回歸意義重大，他是隊內(nèi)很多球員的偶像

庫尼亞：內(nèi)馬爾回歸意義重大，他是隊內(nèi)很多球員的偶像

懂球帝

2026-06-25 11:19:51

世界杯出線形勢：32強定13席 6隊鎖定頭名+7隊出局首組對陣出爐

世界杯出線形勢：32強定13席 6隊鎖定頭名+7隊出局首組對陣出爐

我愛英超

2026-06-25 11:07:13

33歲女研究生被配冥婚，警方趕到時女子已合葬，開棺后眾人都愣了

33歲女研究生被配冥婚，警方趕到時女子已合葬，開棺后眾人都愣了

千秋文化

2026-06-25 20:19:47

霍爾木茲海峽，最新消息！特朗普發(fā)聲，伊朗回應(yīng)！黃金、白銀突變！

霍爾木茲海峽，最新消息！特朗普發(fā)聲，伊朗回應(yīng)！黃金、白銀突變！

證券時報e公司

2026-06-25 08:12:37

女兒罵父親沒本事別生孩子，父親砍掉2000生活費：錢教比人教管用

女兒罵父親沒本事別生孩子，父親砍掉2000生活費：錢教比人教管用

喵咪文化

2026-06-15 22:50:25

存儲成本飆升，蘋果上調(diào)MacBook和iPad售價、10家機構(gòu)大幅上調(diào)美光目標價

存儲成本飆升，蘋果上調(diào)MacBook和iPad售價、10家機構(gòu)大幅上調(diào)美光目標價

財聞

2026-06-25 21:15:48

終于說了實話，美國著急結(jié)束戰(zhàn)爭，是害怕成為第二個俄羅斯

終于說了實話，美國著急結(jié)束戰(zhàn)爭，是害怕成為第二個俄羅斯

農(nóng)夫史記

2026-06-24 21:15:11

曝多名好萊塢明星爭奪成龍新片《飛鷹計劃4》角色

曝多名好萊塢明星爭奪成龍新片《飛鷹計劃4》角色

3DM游戲

2026-06-23 11:09:05

馬超，半獸人一個

奧卡姆剃歷史

2026-06-24 15:34:01

李源潮母親呂繼英的傳奇人生：18歲光榮入黨投身革命事業(yè)

李源潮母親呂繼英的傳奇人生：18歲光榮入黨投身革命事業(yè)

磊子講史

2026-06-25 12:56:37

163的王祖藍和175的老婆換褲子穿，一個成人行拖把，一個成7分褲

163的王祖藍和175的老婆換褲子穿，一個成人行拖把，一個成7分褲

木子愛娛樂大號

2026-06-22 10:21:23

39歲父母給我添了小弟弟，我不吵不鬧，八套房產(chǎn)全過戶給12歲兒子

39歲父母給我添了小弟弟，我不吵不鬧，八套房產(chǎn)全過戶給12歲兒子

觀觀說事

2026-06-25 22:25:03

全網(wǎng)蹲好價的野生捕手，算力與羊毛都不可辜負。

240文章數(shù) 49關(guān)注度

往期回顧全部

科技要聞

存儲成本壓力山大！蘋果罕見全球提價

頭條要聞

男子徒手抓蛇被咬還淡定合影結(jié)果歷經(jīng)4次搶救兩進ICU

頭條要聞

男子徒手抓蛇被咬還淡定合影結(jié)果歷經(jīng)4次搶救兩進ICU

體育要聞

世界杯最動人一吻：我若離世你就改嫁吧

娛樂要聞

這國產(chǎn)劇太裝了，居然還熱播第一？

財經(jīng)要聞

又有紙尿褲送檢后被檢測出甲酰胺！

汽車要聞

老板們的新座駕！65萬元起，尊界V800/V680開啟預訂

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

時尚

游戲

旅游

房產(chǎn)

手機要聞

安卓首個液態(tài)玻璃！榮耀MagicOS 11上手實拍：效果可自由調(diào)節(jié)

女人不管多大年紀，夏天都要準備一兩條過膝裙，舒適又提氣質(zhì)

R星官方確認《GTA6》沒光盤！且實體版數(shù)量有限

旅游要聞

人生第一次去巴黎，最難忘的竟然是掃墓

房產(chǎn)要聞

城市精英集體出手！科學城這一現(xiàn)象級熱銷紅盤，憑何成為共識之選？

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權(quán)投訴

無障礙瀏覽進入關(guān)懷版主站蜘蛛池模板： 2021精品国产自在现线看| 熟女在线国产| 天天做夜夜做狠狠做| 亚洲国产午夜福利精品| 99精品久久毛片a片| 亚洲无码精品一区二区三区| 国产三级在线观看播放| 国产精品高清一区二区三区| 国产XXXX| 午夜免费视频国产在线| 国产在线乱码一区二区三区 | 色啪视频| 久久99精品久久水蜜桃| 亚洲国产欧美中日韩成人综合视频 | 中文字幕人成无码免费视频| 亚洲日韩精品无码一区二区三区| 五月丁香综合激情六月久久| 精品3P| 激情伊人五月天久久综合| 亚洲综合区小说区激情区噜噜| 欧美xxxx新一区二区三区| 国内夫妻自拍激情视频| 亚洲一区成人av在线| 亚洲黄色一区二区| 色综合天天综合天天综| 2021国内精品久久久久精免费| 俺去啦中文网| 蜜臀av日韩精品一区二区| 伊人精品成人久久综合欧美 | 精品1卡二卡三卡四卡老狼| 久久精品夜夜夜夜夜久久| 国产精品???A片在线观看| 在线观看人成视频免费| 一本色道久久88亚洲精品| 精品成a人无码| 国内揄拍国内精品人妻| 免费观看羞羞视频网站| 日韩精品在线国产丝袜| 岛国中文字幕一区二区| 亚洲激情视频久久精品| 99热6这里只有精品|

<sub id="uigz0"><p id="uigz0"></p></sub>