<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      半壁華人!GPT Image 2團(tuán)隊(duì)曝光:無錫才俊帶隊(duì),13人4個(gè)月封神

      0
      分享至

      GPT Image2全網(wǎng)刷屏,但效果究竟為什么這么好?

      研究負(fù)責(zé)人陳博遠(yuǎn)揭秘:底層架構(gòu)已徹底重構(gòu)。


      但他又拒絕回答是否采用擴(kuò)散模型或自回歸技術(shù),只是神秘的將其描述為“通用模型”或“圖像領(lǐng)域的GPT”。


      陳博遠(yuǎn)的一條推文還透露,從去年12月底的GPT Image 1.5算起,只用了四個(gè)月就有如此大的改進(jìn)。


      這樣突破性的成果,核心團(tuán)隊(duì)只有13人

      整個(gè)團(tuán)隊(duì)的負(fù)責(zé)人Gabriel Goh曬出了的團(tuán)隊(duì)成員AI全家福。


      評論區(qū)有網(wǎng)友感嘆:怎么全是亞洲人?


      陳博遠(yuǎn):從不懂Python到Research Lead

      GPT Image 2究竟是什么架構(gòu)?

      OpenAI恐怕很長一段時(shí)間都不會公布了,但從核心團(tuán)隊(duì)成員的學(xué)術(shù)經(jīng)歷可以看出一些痕跡。

      陳博遠(yuǎn)是團(tuán)隊(duì)的Research Lead,他和另一位成員Kiwhan Song在MIT讀博時(shí)有同一位導(dǎo)師Vincent Sitzmann。


      他博士期間的代表作Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion入選了NeurIPS 2024。

      這項(xiàng)研究提出Diffusion Forcing這一全新序列生成訓(xùn)練范式,將逐token獨(dú)立噪聲級擴(kuò)散與因果下一個(gè)token預(yù)測結(jié)合,融合自回歸模型的可變長度生成與全序列擴(kuò)散模型的長程引導(dǎo)優(yōu)勢。


      他在谷歌實(shí)習(xí)期間還以共同一作身份發(fā)表了SpatialVLM

      通過過自動構(gòu)建互聯(lián)網(wǎng)規(guī)模的3D空間推理 VQA 數(shù)據(jù)集(1000 萬圖像、20 億 QA 對),為視覺語言模型賦予定量 / 定性空間推理能力,可從單張 2D 圖像輸出米制距離、尺寸、方位等精確數(shù)值。

      這項(xiàng)研究把思維鏈空間推理應(yīng)用到了具身智能領(lǐng)域。


      在谷歌實(shí)習(xí)期間,他開發(fā)的指令微調(diào)技術(shù)后續(xù)還被Gemini 2.0采用。

      他在高中參加科研夏令營時(shí),還不懂Python的基本語法,那時(shí)結(jié)識的谷歌DeepMind資深研究員夏斐把他引入了AI世界。

      夏斐兩次邀請他到DeepMind完成高質(zhì)量實(shí)習(xí),這些經(jīng)歷使陳博遠(yuǎn)積累了大規(guī)模模型訓(xùn)練的工程經(jīng)驗(yàn),也為他理解多模態(tài)系統(tǒng)的數(shù)據(jù)需求提供了寶貴視角。

      博士畢業(yè)后,陳博遠(yuǎn)于2025年6月加入OpenAI,迅速成為GPT圖片生成五人核心成員之一,負(fù)責(zé)GPT圖像生成模型的所有訓(xùn)練,同時(shí)也是Sora視頻生成團(tuán)隊(duì)的一員。

      在演示中,他給家鄉(xiāng)無錫做了一張海報(bào)。然后為來自首爾的隊(duì)友做韓文海報(bào),為來自Bangladesh的隊(duì)友做孟加拉語海報(bào)。每一張中的文字渲染都精準(zhǔn)無誤。


      中科大Jianfeng Wang:讓生圖AI理解世界知識

      中科大博士畢業(yè)的Jianfeng Wang,在GPT Image 2團(tuán)隊(duì)負(fù)責(zé)的是另一個(gè)讓人驚嘆的能力:指令遵循和理解世界。


      舊模型畫的永遠(yuǎn)時(shí)鐘永遠(yuǎn)指向10:10,源于網(wǎng)絡(luò)上的鐘表廣告圖,幾乎清一色都是10:10。

      這是因?yàn)殓姳韽S商找心理學(xué)家做過實(shí)驗(yàn),認(rèn)為這有助于刺激消費(fèi)者買表的意愿。


      他讓新模型畫2:25、3:30、9:10、7:45,基本精準(zhǔn)。


      這只是開胃菜。

      更多復(fù)雜的空間布局,蘋果在中心、杯子在右邊、書在上面、相機(jī)在左邊、籃球在下面。模型全部精準(zhǔn)執(zhí)行。


      在加入OpenAI 之前,他在微軟工作近9年。在微軟期間就與OpenAI團(tuán)隊(duì)在DALLE-3上有合作。

      他在計(jì)算機(jī)視覺領(lǐng)域發(fā)表了多篇學(xué)術(shù)論文,研究內(nèi)容可能涵蓋 圖像分類、目標(biāo)檢測、語義分割、以及視覺表征學(xué)習(xí) 等方向

      世界知識理解能力的大幅提升,對象的語義內(nèi)容和功能結(jié)構(gòu) 有正確的理解

      JianFeng Wang在演示視頻結(jié)尾說到:GPT Image 2正在消除你的意圖和模型產(chǎn)出之間的差距。

      真正做到你想要什么,模型就給你什么。

      Yuguang Yang:生成高精度復(fù)雜信息圖表

      Yuguang Yang在GPT Image 2的發(fā)布活動中演示了生成信息圖和PPT。


      整整75頁的GPT-3論文拖進(jìn)ChatGPT,自動生成7張幻燈片。


      他的經(jīng)歷可以說是團(tuán)隊(duì)成員中最豐富的,每換一個(gè)工作都是跨界,但都聚焦機(jī)器學(xué)習(xí)。

      他本科在浙大竺可楨學(xué)院學(xué)的工程,博士在約翰斯霍普金斯大學(xué)期間學(xué)的是計(jì)算化學(xué)物理與機(jī)器學(xué)習(xí)。

      他第一份全職工作是量化分析師,在清華做訪問研究員期間研究的是用于納米機(jī)器人的強(qiáng)化學(xué)習(xí)和控制算法。

      后來他在亞馬遜做過Alexa語音研究。

      又在微軟做過Bing搜索的查詢理解和檢索、文檔理解。

      2025年初加入OpenAI后,除了圖像生成還參與過ChatGPT智能體項(xiàng)目。


      他在個(gè)人賬號上介紹GPT Image 2的信息圖生成能力,可以為科研人員節(jié)省大量時(shí)間。


      還反復(fù)提醒大家,要做信息圖不要忘記選擇思考模式。


      從DALL-E到GPT Image 2.0

      從團(tuán)隊(duì)成員Kenji Hata的自我介紹中得知,GPT Image 1.0也就是GPT-4o的圖像生成部分。


      有一個(gè)人從DALL-E開始參與了OpenAI多模態(tài)系列研究的全程。

      他就是GPT Image 2.0團(tuán)隊(duì)負(fù)責(zé)人Gabriel Goh

      從2019年加入OpenAI,他的早期研究更篇理論,專注于可解釋性和凸優(yōu)化等等。

      從DALL-E開始慢慢轉(zhuǎn)向了圖像生成。


      看到另一位團(tuán)隊(duì)成員Weixin Liang的研究履歷,GPT Image 2的技術(shù)底色又揭開了一角。

      他在Meta實(shí)習(xí)期間的代表作Mixture-of-Transformers,引入模態(tài)解耦的MoE和解耦注意力,顯著降低多模態(tài)模型預(yù)訓(xùn)練的計(jì)算成本。


      他博士畢業(yè)自斯坦福,本科也畢業(yè)自浙大竺可楨學(xué)院,不過比Yuguang Yang要晚好幾年。

      Weixin Liang與陳博遠(yuǎn)一樣都是25年博士剛畢業(yè)就加入OpenAI,迅速成為團(tuán)隊(duì)的核心成員。


      其他GPT Image 2.0團(tuán)隊(duì)成員還包括:

      Ayaan Haque,之前在Luma AI 工作,參與過Luma的視頻生成基礎(chǔ)模型Dream Machine的訓(xùn)練。

      Bing Liang,在Google干了5年多,參與Imagen3、Veo、Gemini Multimodal,2025年跳到OpenAI做圖像生成研究。

      Mengchao Zhong,本科上海交通大學(xué)校友,碩士畢業(yè)于得克薩斯農(nóng)工大學(xué),在Pinterest和Airtable做過軟件工程師,在OpenAI負(fù)責(zé)多模態(tài)產(chǎn)品的工程。

      Dibya Bhattacharjee,耶魯大學(xué),2015年IPhO銅牌,CIE A-Level數(shù)學(xué)和生物全球最高分。

      Kiwhan Song是25年10月最晚加入的,除了做研究之外,他還是團(tuán)隊(duì)里的提示詞大師,大家看到的官方演示圖很多都出自他手。
      ……

      從最早的DALL-E到今天的GPT Image 2.0,這只團(tuán)團(tuán)隊(duì)先后解決了。畫得出來、畫得清楚、畫得好看、畫得準(zhǔn)。


      盡管近年來OpenAI的人才流動很大,但OpenAI還是那個(gè)能不斷吸引各種有個(gè)性的人才,不限制專業(yè)、歡迎跨界,信奉自下而上涌現(xiàn)式研究的公司。

      從一個(gè)小團(tuán)隊(duì)開始,有了突破后公司傾斜更多資源,直到改變世界。

      One More Thing

      曾經(jīng),GPT-4o圖像生成模仿吉卜力風(fēng)格生成的頭像席卷了全世界。

      如今GPT Image 2.0的團(tuán)隊(duì)成員,都把自己頭像換成了這種奇脖子畫風(fēng)。


      那么這種畫風(fēng)的提示詞是什么?團(tuán)隊(duì)成員也公布了出來

      Use my photo only for identity. Redraw me as a very simple surreal Japanese sticker-style caricature: long thin neck, small deadpan face, minimal black outline, flat light coloring, almost no shading, very few facial details, simplified hair shape, lots of white space, plain white background, slightly awkward and funny. Ultratall 1:3 image.

      參考鏈接:
      [1]https://x.com/gabeeegoooh/status/2046674385407512687?s=20
      [2]https://venturebeat.com/technology/openais-chatgpt-images-2-0-is-here-and-it-does-multilingual-text-full-infographics-slides-maps-even-manga-seemingly-flawlessly

      文章來源:量子位。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      突發(fā)!張本智和帶全家逃離日本,簽約德國,竟然要和樊振東當(dāng)隊(duì)友了?

      突發(fā)!張本智和帶全家逃離日本,簽約德國,竟然要和樊振東當(dāng)隊(duì)友了?

      最愛乒乓球
      2026-05-18 06:06:08
      哈馬斯絕密信曝光:10月7日,他們真正想引爆的,是整個(gè)中東

      哈馬斯絕密信曝光:10月7日,他們真正想引爆的,是整個(gè)中東

      以色列計(jì)劃Pro
      2026-05-18 22:01:10
      中南大學(xué)男生錄高考加油視頻,帥得被質(zhì)疑是AI,本人回應(yīng):只是普通帥哥,目前單身,被要聯(lián)系方式出于禮貌都會同意

      中南大學(xué)男生錄高考加油視頻,帥得被質(zhì)疑是AI,本人回應(yīng):只是普通帥哥,目前單身,被要聯(lián)系方式出于禮貌都會同意

      揚(yáng)子晚報(bào)
      2026-05-16 08:47:38
      日媒放話:給中國50年追不上日本汽車!馬斯克:中國車企太能打

      日媒放話:給中國50年追不上日本汽車!馬斯克:中國車企太能打

      南宗歷史
      2026-05-18 12:37:52
      黃仁勛回?fù)簦河薮乐翗O,毫無道理

      黃仁勛回?fù)簦河薮乐翗O,毫無道理

      半導(dǎo)體行業(yè)觀察
      2026-05-18 09:28:40
      國際上有個(gè)新趨勢:整個(gè)歐美圈子,都在對印度人群失去耐心,反感

      國際上有個(gè)新趨勢:整個(gè)歐美圈子,都在對印度人群失去耐心,反感

      魔都姐姐雜談
      2026-05-17 10:09:07
      “摸奶子”再惹爭議,OPPO的流量反噬開始了

      “摸奶子”再惹爭議,OPPO的流量反噬開始了

      品牌頭版
      2026-05-13 10:18:15
      貝森特想擺譜,進(jìn)大會堂時(shí),不戴胸標(biāo),結(jié)果被攔下,現(xiàn)場略顯窘迫

      貝森特想擺譜,進(jìn)大會堂時(shí),不戴胸標(biāo),結(jié)果被攔下,現(xiàn)場略顯窘迫

      魔都姐姐雜談
      2026-05-18 12:34:03
      加油單親媽媽!47歲吳佩慈顴骨突出法令紋明顯,獨(dú)自帶四娃老成60歲

      加油單親媽媽!47歲吳佩慈顴骨突出法令紋明顯,獨(dú)自帶四娃老成60歲

      八卦王者
      2026-05-18 13:51:36
      27年前在香港謀殺“霞姐”的連某終于找到了,原來這么多年他都在內(nèi)地坐牢!

      27年前在香港謀殺“霞姐”的連某終于找到了,原來這么多年他都在內(nèi)地坐牢!

      新浪財(cái)經(jīng)
      2026-05-18 23:06:45
      孩子展廳誤踩電視賠五百,家長堅(jiān)稱無責(zé)是小米故意埋雷

      孩子展廳誤踩電視賠五百,家長堅(jiān)稱無責(zé)是小米故意埋雷

      映射生活的身影
      2026-05-17 21:17:42
      5244人全扒完!黑龍江26年公務(wù)員錄取名單曝光,發(fā)現(xiàn)三個(gè)讓家長失眠真相

      5244人全扒完!黑龍江26年公務(wù)員錄取名單曝光,發(fā)現(xiàn)三個(gè)讓家長失眠真相

      老滿說高考
      2026-05-18 20:54:36
      美媒集體震驚:這次訪華,才真正見識到中國溫度!

      美媒集體震驚:這次訪華,才真正見識到中國溫度!

      福建睿平
      2026-05-18 11:56:20
      諾蘭新片被比《阿拉伯的勞倫斯》,期待值拉滿過分嗎?

      諾蘭新片被比《阿拉伯的勞倫斯》,期待值拉滿過分嗎?

      影視情報(bào)室
      2026-05-18 00:19:09
      智能手表退燒:五年老用戶為什么摘下了腕上屏幕

      智能手表退燒:五年老用戶為什么摘下了腕上屏幕

      Ping值焦慮
      2026-05-18 02:03:48
      廣西柳州部分地區(qū)出現(xiàn)塌陷坑,專家:系地震誘發(fā)巖溶次生地質(zhì)災(zāi)害

      廣西柳州部分地區(qū)出現(xiàn)塌陷坑,專家:系地震誘發(fā)巖溶次生地質(zhì)災(zāi)害

      界面新聞
      2026-05-18 22:45:26
      5名中國人在泰國遭4名警察伙同平民綁架,5人被捕,嫌疑人持槍勒索每人1萬美元,警方繳獲數(shù)支手槍、兩輛皮卡車和大量彈藥

      5名中國人在泰國遭4名警察伙同平民綁架,5人被捕,嫌疑人持槍勒索每人1萬美元,警方繳獲數(shù)支手槍、兩輛皮卡車和大量彈藥

      揚(yáng)子晚報(bào)
      2026-05-18 12:18:59
      后續(xù)!新娘換裝拖46分鐘賓客散場,監(jiān)控曝光,她竟無視多次提醒

      后續(xù)!新娘換裝拖46分鐘賓客散場,監(jiān)控曝光,她竟無視多次提醒

      寶哥精彩賽事
      2026-05-18 07:00:43
      黃一鳴再迎大麻煩!剛出月子就找男人,“快樂” 照片曝光

      黃一鳴再迎大麻煩!剛出月子就找男人,“快樂” 照片曝光

      橙星文娛
      2026-05-18 17:10:05
      深圳輸G2揪出頭號罪人!2罰不中+連續(xù)犯規(guī)送分,球迷:戰(zhàn)犯表現(xiàn)

      深圳輸G2揪出頭號罪人!2罰不中+連續(xù)犯規(guī)送分,球迷:戰(zhàn)犯表現(xiàn)

      弄月公子
      2026-05-18 22:27:20
      2026-05-19 02:07:00
      算法與數(shù)學(xué)之美 incentive-icons
      算法與數(shù)學(xué)之美
      分享知識,交流思想
      5547文章數(shù) 64624關(guān)注度
      往期回顧 全部

      科技要聞

      同一公司,有人獎(jiǎng)金是6年工資,我卻只有半年

      頭條要聞

      賴清德要求美國繼續(xù)向臺出售武器 外交部表態(tài)

      頭條要聞

      賴清德要求美國繼續(xù)向臺出售武器 外交部表態(tài)

      體育要聞

      58順位的保羅,最強(qiáng)第三中鋒

      娛樂要聞

      票房會破14億!口碑第一電影出現(xiàn)了

      財(cái)經(jīng)要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      40.98萬起!充電5分鐘純電續(xù)航420km 騰勢N9閃充版勝算有多少?

      態(tài)度原創(chuàng)

      家居
      本地
      健康
      藝術(shù)
      軍事航空

      家居要聞

      觀山隱秀 心靈沉淀

      本地新聞

      用蘇繡的方式,打開江西婺源

      專家揭秘干細(xì)胞回輸?shù)陌踩L(fēng)險(xiǎn)

      藝術(shù)要聞

      震驚!日本80后畫家畫少女,超寫實(shí)美到窒息!

      軍事要聞

      莫斯科遭一年多來最大規(guī)模無人機(jī)襲擊 3死18傷

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美一区二区三区国产精品| 天天干夜夜撸| 伊人一伊人色综合网| 日韩有码精品中文字幕| 中文字幕在线视频不卡一区二区| 丰满大爆乳波霸奶| 亚洲精品爆乳一区二区H| 日本熟妇浓毛hdsex| 美女又黄又免费的视频| 成人午夜视频一区二区无码 | 小伙无套内射老熟女精品| 欧美一级aaa| 西西444WWW无码精品| 欧美色欧美亚洲高清在线观看| 美女自卫慰黄网站| 久久国产精品无码hdav| 日本高清中文字幕免费一区二区| 久久se精品一区二区三区| 日日a.v拍夜夜添久久免费| 国产在线午夜不卡精品影院| 久久精品国产亚洲Av无码偷窍 | 国产一区综合| 熟女性饥渴一区二区三区| 娇小另类XXXHD| 一区二区丝袜美腿视频| 国产日韩av在线播放| 中文字幕日韩精品有码| 日本污视频在线观看| 一本成人网站| 成年av福利永久免费观看| 色偷偷无码| 精品人妻伦一二三区久久aaa片| 亚洲中文字幕第一页在线| 国产综合精品久久一线二线三线| 人妻少妇精品久久久久久| 日日碰狠狠添天天爽五月婷| 黄色www| 会同县| 免费观看的AV毛片的网站不卡| 少妇激情a∨一区二区三区| 中文字幕乱码无遮挡精品视频|