<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      大語言模型:從注意力機制到智能體時代丨面向復雜系統(tǒng)的人工智能第六講

      0
      分享至


      導語

      集智俱樂部、集智學園創(chuàng)始人,北京師范大學張江教授開設(shè)了,致力于打破學科壁壘,將復雜系統(tǒng)與人工智能深度融合。從神經(jīng)網(wǎng)絡(luò)到因果推斷,從世界模型到多尺度建模,甚至包含最前沿的“氛圍編程(Vibe Coding)”實戰(zhàn),帶你親手落地AI項目。

      作為系列課程的第六講,張江教授將以「大語言模型:從注意力機制到智能體時代」為題,講解Transformer模型,大語言模型預訓練與微調(diào),以及現(xiàn)在新的技術(shù)趨勢。正式分享將于4月13日(周一)13:30-16:15騰訊會議線上直播,北師大海淀區(qū)線下授課(助教可協(xié)助入校)。

      課程簡介

      ChatGPT背后的核心機制,Transformer注意力已成為當代AI基礎(chǔ)設(shè)施的核心組件,這套架構(gòu)在過去七年里驅(qū)動了整個領(lǐng)域的能力跳躍。理解它,就是理解當前大模型能力的物理邊界在哪里。

      本節(jié)課程從語言模型三十年的演進史出發(fā),系統(tǒng)拆解大語言模型的運作原理。課程沿兩條主線推進:一條是機制主線,從注意力機制的幾何直覺(如何用Query-Key-Value構(gòu)造有向信息網(wǎng)絡(luò)),到Transformer編解碼器的完整架構(gòu),再到GPT系列的訓練流程(預訓練→指令微調(diào)→RLHF);另一條是前沿主線,大模型的涌現(xiàn)能力、思維鏈推理、推理時計算擴展規(guī)律,以及DeepSeek-R1用GRPO替代PPO的技術(shù)路線。

      學完這門課,你能讀懂“Attention is All You Need”的推導,能解釋ChatGPT與DeepSeek的技術(shù)異同,能區(qū)分Prompt Engineering、Context Engineering與Harness Engineering三個工程層次,并具備從Prompt到API調(diào)用搭建LLM應(yīng)用的基礎(chǔ)能力。

      課程大綱

      1. 認識大語言模型

        1. 語言模型三十年演進:n-gram統(tǒng)計模型→Word2Vec神經(jīng)語言模型→預訓練LM(BERT/GPT)→LLM→多模態(tài)智能體

        2. LLM的六種使用方式:Prompt、應(yīng)用集成、私有知識庫、AI Agent、Fine-tune、Train的適用場景與難度對比

        3. 上下文學習(In-context Learning)與指令學習(Instruction Learning)

        4. Prompt Engineering、Context Engineering及GPT API調(diào)用實踐

      2. Transformer架構(gòu)

        1. 信息聚合視角:全連接、卷積(局域聚合)、圖神經(jīng)網(wǎng)絡(luò)的對比

        2. Query-Key-Value注意力

        3. 多頭注意力(Multi-head Attention)、Layer Norm、Position-wise Feedforward

        4. 正弦余弦位置編碼(Positional Encoding)及其設(shè)計動機

        5. Transformer編碼器-解碼器完整架構(gòu)與PyTorch源碼解析

        6. In-context learning的數(shù)學本質(zhì):注意力機制等價于隱式梯度下降

      3. GPT與DeepSeek

        1. GPT-1到GPT-4的技術(shù)演進:Decoder-only架構(gòu)、參數(shù)規(guī)模爆增、in-context learning、多模態(tài)能力

        2. ChatGPT訓練流程:預訓練(Base Model)→監(jiān)督微調(diào)(SFT)→獎勵建模→RLHF/PPO對齊

        3. 指令微調(diào)(Instruct Tuning)與人類反饋強化學習(RLHF)

        4. DeepSeek-V3:MATH-500達90.2分,極低推理成本的性能-價格帕累托最優(yōu)

        5. DeepSeek-R1與GRPO:以組策略優(yōu)化替代PPO,無需獨立價值網(wǎng)絡(luò)

      4. 新趨勢

        1. 大模型涌現(xiàn)能力:規(guī)模突破臨界值后的能力突現(xiàn)

        2. 思維鏈(Chain of Thought)推理與推理時計算擴展定律(Inference Scaling Laws)

        3. AI Agents:自主性、任務(wù)特定性、反應(yīng)性三要素

        4. Harness Engineering:Prompt→Context→Harness的工程范式演進,信息層/執(zhí)行層/反饋層三層架構(gòu)



      關(guān)鍵術(shù)語

      1. Transformer:基于多頭自注意力的序列建模架構(gòu),摒棄RNN的遞歸結(jié)構(gòu),當前主流LLM的核心組件

      2. 自注意力(Self-attention):序列每個位置對所有位置計算注意力權(quán)重,實現(xiàn)全局信息聚合;公式:Attention=softmax(QK^T/√d?)V

      3. RLHF:基于人類反饋的強化學習,通過人工偏好標注訓練獎勵模型,再用PPO優(yōu)化LLM輸出

      4. GRPO:DeepSeek-R1采用的強化學習算法,以組策略優(yōu)化替代PPO,省去獨立價值網(wǎng)絡(luò)

      5. In-context Learning(ICL):無需更新參數(shù),僅在提示中提供少量示例引導LLM完成任務(wù);數(shù)學上等價于注意力層的隱式梯度下降

      6. 涌現(xiàn)能力(Emergent Abilities):LLM參數(shù)規(guī)模突破閾值后突然具備的新能力

      7. Positional Encoding:將位置信息注入詞嵌入,彌補注意力機制對序列順序不敏感的缺陷

      8. Harness Engineering:2026年興起的智能體系統(tǒng)工程范式,整合Memory、Tools、Orchestration、Guardrails、Evaluation等組件于Prompt之上

      9. 幻覺(Hallucination):LLM生成與事實不符內(nèi)容的現(xiàn)象,研究顯示約64%的LLM錯誤由此引發(fā)


      課程信息

      課程主題:大語言模型:從注意力機制到智能體時代

      課程時間:2026年4月13日(周一) 13:30-16:15

      課程形式:騰訊會議(會議信息見群內(nèi)通知)/北師大海淀區(qū)線下授課(助教可協(xié)助入校);集智學園網(wǎng)站錄播(3個工作日內(nèi)上線)

      課程主講人

      張江,北京師范大學系統(tǒng)科學學院教授,集智俱樂部、集智學園創(chuàng)始人,集智科學研究中心理事長,曾任騰訊研究院、華為戰(zhàn)略研究院等特聘顧問。主要研究領(lǐng)域包括因果涌現(xiàn)、復雜系統(tǒng)分析與建模、規(guī)模理論等。

      個人主頁:https://jake.swarma.org/

      課程適用對象

      1. 理工科背景高年級本科生

      2. 理工科背景碩士、博士研究生


      報名須知

      1. 課程形式:

      1. 參與方式:付費學員可參與騰訊會議直播/北師大海淀區(qū)線下授課(助教可協(xié)助入校)

      2. 授課形式:

      1. 平時:課堂討論與內(nèi)容共創(chuàng)

      2. 結(jié)課:項目匯報

      2. 課程周期:2026年3月2日-2026年6月22日,每周一 13:30-16:15進行。

      3. 課程定價:399元

      課程鏈接:https://campus.swarma.org/v3/course/5684?from=wechat

      付費流程:

      1. 課程頁面添加學員登記表,添加助教微信入群;

      2. 課程可開發(fā)票。

      課程共創(chuàng)任務(wù):課程字幕

      為鼓勵學員深度參與、積極探索,我們致力于形成系列化知識傳播成果,并構(gòu)建課程知識共建社群。為此,我們特別設(shè)立激勵機制,讓您的學習之旅滿載收獲與成就感。

      課程以老師講授為主,每期結(jié)束后,助教會于課程群內(nèi)發(fā)布字幕共創(chuàng)任務(wù)。學員通過參與這些任務(wù),不僅能加深對內(nèi)容的理解,還可獲得積分獎勵。積分可兌換其他讀書會課程或?qū)嵨铼勂罚δ某掷m(xù)成長。

      推薦課程

      參考課程

      1. 吳恩達:Build with Andrew https://www.deeplearning.ai/courses/build-with-andrew/

      2. Jure Leskovec: Machine Learning with Graphs, StanfordCS224W.https://www.youtube.com/playlist?list=PLoROMvodv4rPLKxIpqhjhPgdQy7imNkDn

      3. Steve Brunton: Data Driven Science and Engineering, University of Washingtonhttps://www.youtube.com/playlist?list=PLMrJAkhIeNNRpsRhXTMt8uJdIGz9-X_1-

      4. Karthik Duraisamy: DATA-DRIVEN ANALYSIS AND MODELING OF COMPLEX SYSTEMS, Michigen institute for computational discovery and engineering, Michigen University.https://micde.umich.edu/academic-programs-old/data-driven-course/

      5. Sergey Levine: Deep Reinforcement Learning, CS 285 at UC Berkeley.http://rail.eecs.berkeley.edu/deeprlcourse/

      【集智學園網(wǎng)站資源】

      1. 對復雜系統(tǒng)連續(xù)變化自動建模——Neural Ordinary Differential Equations解讀https://campus.swarma.org/course/2046

      2. 復雜網(wǎng)絡(luò)自動建模在大氣污染中的應(yīng)用https://campus.swarma.org/course/1998

      3. 兩套因果框架深度剖析:潛在結(jié)果模型與結(jié)構(gòu)因果模型https://campus.swarma.org/course/2526

      4. 穩(wěn)定學習:發(fā)掘因果推理和機器學習的共同基礎(chǔ)https://campus.swarma.org/course/2323

      5. 因果強化學習https://campus.swarma.org/course/2156

      6. 張江:因果與機器學習能夠破解涌現(xiàn)之謎嗎https://campus.swarma.org/course/4540

      7. 因果涌現(xiàn)理論提出者:Erik Hoel主題報告https://campus.swarma.org/course/4317

      8. 如何從數(shù)據(jù)中發(fā)現(xiàn)因果涌現(xiàn)——神經(jīng)信息壓縮器https://campus.swarma.org/course/4874

      9. 標準化流技術(shù)簡介https://campus.swarma.org/course/1999

      10. 帶隱狀態(tài)的強化學習世界模型https://campus.swarma.org/course/4848

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      2026年調(diào)整退休人員基本養(yǎng)老金的通知正式公布了嗎?

      2026年調(diào)整退休人員基本養(yǎng)老金的通知正式公布了嗎?

      白晝說故事
      2026-05-09 11:31:21
      于丹被北師大免職,跌落神壇后竟活成這樣!人人都該警醒...

      于丹被北師大免職,跌落神壇后竟活成這樣!人人都該警醒...

      華人星光
      2024-11-07 13:39:41
      比亞迪、特斯拉、小鵬、理想、蔚來、廣汽埃安,集中辟謠

      比亞迪、特斯拉、小鵬、理想、蔚來、廣汽埃安,集中辟謠

      觀察者網(wǎng)
      2026-05-09 15:39:10
      炸穿樂壇!地球最強流行天后空降《歌手》,網(wǎng)友:這局直接認輸

      炸穿樂壇!地球最強流行天后空降《歌手》,網(wǎng)友:這局直接認輸

      FUFASHION
      2026-05-08 12:40:15
      吳宜澤奪冠后,姐姐吳宜然顏值火出圈!蘭州女神,那些年為家兜底

      吳宜澤奪冠后,姐姐吳宜然顏值火出圈!蘭州女神,那些年為家兜底

      吳锎旅行ing
      2026-05-07 17:00:02
      比薩卡還強!阿森納瞄準世界最佳球員,阿爾特塔欽點

      比薩卡還強!阿森納瞄準世界最佳球員,阿爾特塔欽點

      瀾歸序
      2026-05-10 01:40:34
      太可怕!印度女局長深夜便衣上街,3小時被40名男性輪番冒犯

      太可怕!印度女局長深夜便衣上街,3小時被40名男性輪番冒犯

      混沌錄
      2026-05-09 16:18:12
      法國總統(tǒng)候選人直言:敢介入臺海就等著吃核彈,法國一顆都扛不住

      法國總統(tǒng)候選人直言:敢介入臺海就等著吃核彈,法國一顆都扛不住

      影孖看世界
      2026-05-09 17:37:37
      蒂特:莫德里奇私下也說過,他也搞不懂在世界杯怎么贏的巴西

      蒂特:莫德里奇私下也說過,他也搞不懂在世界杯怎么贏的巴西

      懂球帝
      2026-05-09 06:48:09
      允許一切,自在隨心

      允許一切,自在隨心

      青蘋果sht
      2026-05-04 05:03:52
      調(diào)整!央視直播世乒賽有變,孫穎莎大戰(zhàn)小妖精,王楚欽硬鋼勒布倫

      調(diào)整!央視直播世乒賽有變,孫穎莎大戰(zhàn)小妖精,王楚欽硬鋼勒布倫

      曹說體育
      2026-05-09 15:58:04
      足協(xié)做出重要決定!將接受國際足聯(lián)邀請出戰(zhàn)大賽,跟泰國印尼交手

      足協(xié)做出重要決定!將接受國際足聯(lián)邀請出戰(zhàn)大賽,跟泰國印尼交手

      懂個球
      2026-05-10 00:30:59
      值得珍藏:未來科技七大賽道+衛(wèi)星互聯(lián)網(wǎng)+存儲芯片+機器人+半導體

      值得珍藏:未來科技七大賽道+衛(wèi)星互聯(lián)網(wǎng)+存儲芯片+機器人+半導體

      林子說事
      2026-05-08 08:40:31
      鬧大了!女孩首次登門男方家,被安排與男友同床,顧慮聲譽要分房

      鬧大了!女孩首次登門男方家,被安排與男友同床,顧慮聲譽要分房

      火山詩話
      2026-05-09 08:11:39
      中國“撿錢”時代可能要來了:若手中只有10萬,試試死啃這兩條線

      中國“撿錢”時代可能要來了:若手中只有10萬,試試死啃這兩條線

      世界圈
      2026-04-20 13:02:44
      王思聰洛杉磯近照曝光!一身LV卻白發(fā)駝背,原來錢真買不回心氣兒

      王思聰洛杉磯近照曝光!一身LV卻白發(fā)駝背,原來錢真買不回心氣兒

      老吳教育課堂
      2026-05-07 18:00:58
      央視軍事官宣:中國首艘核動力航母正式確認

      央視軍事官宣:中國首艘核動力航母正式確認

      武器鑒賞
      2026-05-08 13:23:34
      韋世豪:戰(zhàn)勝河南不是很重要,我們這個賽季要一直贏下去

      韋世豪:戰(zhàn)勝河南不是很重要,我們這個賽季要一直贏下去

      懂球帝
      2026-05-09 22:22:18
      緊急!停招電氣工程專業(yè)!

      緊急!停招電氣工程專業(yè)!

      新浪財經(jīng)
      2026-05-08 16:42:06
      勞塔羅:我們展現(xiàn)了應(yīng)有的職業(yè)素養(yǎng);姆希塔良是所有人的榜樣

      勞塔羅:我們展現(xiàn)了應(yīng)有的職業(yè)素養(yǎng);姆希塔良是所有人的榜樣

      懂球帝
      2026-05-10 03:19:50
      2026-05-10 03:36:49
      集智俱樂部 incentive-icons
      集智俱樂部
      科普人工智能相關(guān)知識技能
      5809文章數(shù) 4674關(guān)注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協(xié)議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯(lián)賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經(jīng)要聞

      多地號召,公職人員帶頭繳納物業(yè)費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態(tài)度原創(chuàng)

      手機
      旅游
      本地
      公開課
      軍事航空

      手機要聞

      華為Mate 90首發(fā)!鴻蒙7定檔6月:和iOS安卓三分天下

      旅游要聞

      不用長途奔波!北京城區(qū)隨處是治愈人心的初夏花海

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美伊突然再次交火 伊朗外長:戰(zhàn)爭準備程度是1000%

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产精品久久久| 日本深夜福利在线观看| 少妇大叫太大太爽受不了| 国产 日韩 欧美 第二页| 久久亚洲精品三级影片| 97精品人妻系列无码人妻| 亚洲一区二区约美女探花| 亚洲欧美另类久久久精品| 国产精品不卡一二三区| 国产成AV人片久青草影院| 少妇人妻综合久久中文字幕| 99福利| 日韩,变态,另类,中文,人妻| 精品人妻一区无码视频| 日本免费一区二区三区中文| 精品国产欧美一区二区五十路| 日韩精品一区二区三区蜜臀| 天堂AV免费| 深夜福利在线观看视频| 国产成人亚洲综合无码精品 | 粉嫩一区二区三区国产精品| 亚洲国产精品日韩在线| 老色99久久九九爱精品| 苍山县| 爆乳网站| 草莓日逼| 免费国产一区二区不卡| 一区二区三区放荡人妻| 婷婷精品国产亚洲AV麻豆不片| 人妻无码中文久久久久专区| 六月婷婷五月丁香| 一级爱一级做a性视频| 精品国产乱码久久久久久婷婷 | 亚洲成人第一网站| 日韩精品亚洲精品第一页| 蜜桃AV抽搐高潮一区二区| 国产成人精品综合久久久久| 日本公妇乱偷中文字幕| 国产91精品一区二区麻豆 | 欧美日韩变态| 国产精品国产午夜免费看福利|