<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      小模型,也是嵌入式的未來

      0
      分享至

      這兩天,英偉達一個最新研究結論讓業界備受關注——小型語言模型(SLM)才是智能體的未來。緊接著,英偉達又拋出了自己的全新小型語言模型:Nemotron-Nano-9B-V2,該模型在部分基準測試中達到了同類產品中的最高性能。

      事實上,小型語言模型(SLM)的風,也刮到了MCU和MPU領域。

      小模型,就是“壓小”的大模型

      小型語言模型(SLM)也許我們早有所接觸。SLM 的參數范圍從幾百萬到幾十億不等,而 LLM 則具有數千億甚至數萬億參數。

      SLM是由LLM壓縮而來,壓縮模型需要在縮小模型的同時,盡可能保留模型的準確性。常見方法如下:

      • 知識蒸餾:利用從大型“教師”模型轉移的知識來訓練一個較小的“學生”模型;

      • 剪枝:移除神經網絡架構中冗余或不那么重要的參數;

      • 量化:降低計算中使用的數值精度(例如,將浮點數轉換為整數)。

      小型語言模型比大型模型更緊湊、更高效。因此,SLM需要較少的內存和計算能力,非常適合資源受限的邊緣或者嵌入式設備。

      許多小而強大的語言模型已經出現,證明大小并非一切。常見的10億到40億的SLM包括Llama3.2-1B(Meta開發的10億參數變體)、Qwen2.5-1.5B(阿里巴巴的15億參數模型)、DeepSeeek-R1-1.5B(DeepSeek的15億參數模型)、SmolLM2-1.7B(HuggingFaceTB,的17億參數模型)、Phi-3.5-Mini-3.8B(微軟的38億參數模型)、Gemma3-4B(Google DeepMind的40億參數模型)。

      跑SLM,靠得不光是算力

      對MPU來說,跑SLM,似乎不是什么難題。但對開發人員來說,如何知道MCU支持是否支持運行生成式AI?

      這個問題沒有單一、直接的答案——不過有一個硬性要求,即MCU的神經處理單元(NPU)必須能夠加速Transformer運行。

      除此之外,跑生成式AI,對于MCU的帶寬系統總線以及以及大容量、高速、緊密耦合的內存配置有要求。

      其實,現在很多人都去只用GOPS(十億次運算每秒)或TOPS(萬億次運算每秒)來比較微控制器的原始吞吐量,目前性能最佳的MCU能提供高達250GOPS的算力,而用于生成式AI的MCU將至少提供兩倍于此的性能。但原始吞吐量并非衡量實際系統性能的理想指標。

      因為成功的生成式AI應用程序需要支持Transformer運算,會在系統內部、內存、神經處理單元、中央處理器以及圖像信號處理器等外圍功能之間傳輸大量數據。因此,一個具有高原始吞吐量的系統理論上或許能快速處理大量數據,但如果系統無法將數據快速傳輸給神經處理單元,實際性能就會十分緩慢,令人失望。

      當然,對MPU來說,大帶寬、內存、總線之間的緊密耦合也至關重要。

      Aizip與Renesas合作的SLM項目

      早在去年8月,Aizip就與Renesas攜手合作,在MPU上展示了用于邊緣系統應用的超高效SLM和緊湊型AI Agents,這些小巧而高效的模型已經集成到基于 Arm Cortex-A55的Renesas RZ/G2L和RZ/G3S主板中。

      Aizip創建了一系列超高效的小型語言模型(SLM)和人工智能代理(AI Agents),名為 Gizmo,規模從3億到20億個參數不等。這些型號支持多種平臺,包括適用于廣泛應用的 MPU和應用處理器。

      SLM使設備邊緣應用程序上的AI代理能夠提供與大型語言模型(LLM)相同的功能,但在邊緣占用空間上。設備上模型具有增強的隱私保護、彈性作和節省成本等優勢。雖然一些公司已經成功地減小了手機語言模型的大小,但確保在低成本邊緣設備上為自動化應用提供準確的工具調用仍然是這些 SLM 面臨的重大挑戰。

      據介紹,在運行頻率為1.2 GHz的單個A55內核的RZ/G2L上,這些SLM可以實現不到3秒的響應時間。

      MCU,也在加大對SLM投入

      Alif Semiconductor最近發布了最新系列的MCU和融合處理器——Ensemble E4、E6和E8,便主要針對支持SLM在內的生成式AI模型的運行。與此同時,Alif是首家使用 Arm Ethos-U85 NPU(神經處理單元)的芯片供應商,該芯片支持基于Transformer的機器學習網絡。

      根據基準測試結果顯示,該系列在不到2毫秒的時間內進行高能效物體檢測、圖像分類時間不到8毫秒、在E4設備上執行的SLM在生成文本以根據用戶提供的提示構建故事時僅消耗36mW的功率。

      Ensemble E4(MCU)采用雙Arm Cortex-M55內核,Ensemble E6和E8融合處理器分別基于Arm Cortex-A32內核和雙Cortex-M55內核,值得注意的是E4/E6/E8均搭載雙Ethos-U55+Ethos-U85,算力非常強大。


      Alif認為,相比其他制造商,他們布局更早,因為第一代Ensemble MCU系列早在2021年就發布了,從那時起我們就一直在批量出貨E1、E3、E5 和 E7設備。而在其他MCU廠商還停留在第一代AI MCU時,Alif就發布了第二代產品,同時是業界首款支持基于Transformer的網絡的MCU,是LLM和其他生成式AI模型的基礎。

      SLM會是嵌入式的未來

      SLM在大幅壓縮模型體積的同時,盡可能保留了模型的準確性。這種高效、緊湊的特性,使其完美契合了資源受限的邊緣和嵌入式設備,為這些設備帶來了前所未有的智能能力。

      事實上,邊緣AI的未來圖景正在徐徐展開,SLM也會是MCU和MPU廠商會布局的關鍵領域之一。

      比如,意法半導體的STM32N6、英飛凌PSoC Edge最新一代MCU、TI的AM62A和TMS320F28P55x、恩智浦的i.MX RT700和i.MX 95、ADI的MAX7800X都開始重視NPU。

      嵌入式AI最初主要是在Linux系統上運行的相對昂貴的基于微處理器的產品的一項功能。但很快,市場意識到邊緣和端點設備中也有AI的空間——其中許多設備都是基于MCU。所以,在2025年下半年,先進的MCU廠商都將提供AI功能的產品納入其產品組合中。這些廠商的NPU分為Arm Ethos IP一派和自研一派。目前來看,最新的Ethos-U85開始支持Transformer,并且在半年前展示了搭載SLM的效果,其他廠商也在不斷跟進。在未來,相信SLM也會徹底改變MCU和MPU的格局。

      參考文獻

      [1]IBM:https://www.ibm.com/cn-zh/think/topics/small-language-models

      [2]Hugging-Face:https://hugging-face.cn/blog/jjokah/small-language-model

      [3]Alif:https://alifsemi.com/comparing-mcus-for-generative-ai-its-not-just-about-the-gops/

      [4]Alif:https://alifsemi.com/who-wins-in-the-race-to-make-ai-mcus/

      [5]Arm:https://newsroom.arm.com/blog/small-language-model-generative-ai-edge

      歡迎將我們設為“星標”,這樣才能第一時間收到推送消息。

      關注EEWorld旗下訂閱號:“機器人開發圈”

      回復“DS”領取《DeepSeek:從入門到精通》完整版

      掃碼添加小助手回復“機器人”

      進群和電子工程師們面對面交流經驗


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      日本航空拿下宇樹科技,轟動全球!

      日本航空拿下宇樹科技,轟動全球!

      新零售參考Pro
      2026-05-07 17:31:09
      文班39+15+5帽創7紀錄:神跡歷史首人 被華子拉拽球衣也攔不住

      文班39+15+5帽創7紀錄:神跡歷史首人 被華子拉拽球衣也攔不住

      醉臥浮生
      2026-05-09 12:33:41
      同樣“糊弄消費者”的套路,在國外直接挨捶了

      同樣“糊弄消費者”的套路,在國外直接挨捶了

      走讀新生
      2026-05-09 11:21:16
      大快人心!中國民航新規出爐:日本航空過境中國好日子即將到頭!

      大快人心!中國民航新規出爐:日本航空過境中國好日子即將到頭!

      影像溫度
      2026-05-09 10:27:26
      凌晨咳到吐!全國多地中招“干咳毒株”,患者猜疑新冠病毒新變種

      凌晨咳到吐!全國多地中招“干咳毒株”,患者猜疑新冠病毒新變種

      譚談社會
      2026-05-08 23:19:21
      我國5600余個姓中只有8個姓從未衰落,看一下有你的姓嗎?

      我國5600余個姓中只有8個姓從未衰落,看一下有你的姓嗎?

      心中的麥田
      2026-05-06 19:24:47
      中方沒想到,盧拉赴美求和,給特朗普送上稀土資源,動機不簡單

      中方沒想到,盧拉赴美求和,給特朗普送上稀土資源,動機不簡單

      書紀文譚
      2026-05-09 14:19:43
      捷途汽車:把「方盒子」做成冠軍,把「旅行」做成生態

      捷途汽車:把「方盒子」做成冠軍,把「旅行」做成生態

      汽車預言家
      2026-05-09 11:32:23
      馬斯克:每年只休息兩三天,試過睡不到6小時結果腦子很痛效率很低

      馬斯克:每年只休息兩三天,試過睡不到6小時結果腦子很痛效率很低

      頂級大佬思維
      2026-05-09 14:23:20
      我穿便裝到妻子家過年,被廳長大舅哥使喚,警衛員送來文件他愣了

      我穿便裝到妻子家過年,被廳長大舅哥使喚,警衛員送來文件他愣了

      千秋文化
      2026-05-08 10:29:06
      鎖死海峽!阿聯酋突襲伊朗,埃及陣風戰機馳援:伊朗遭遇兇險包圍

      鎖死海峽!阿聯酋突襲伊朗,埃及陣風戰機馳援:伊朗遭遇兇險包圍

      知法而形
      2026-05-08 16:39:04
      以游客身份入境,未經許可拍攝!8名中國人在泰國拍短劇被捕

      以游客身份入境,未經許可拍攝!8名中國人在泰國拍短劇被捕

      大象新聞
      2026-05-09 13:54:19
      喜訊!徐昕收到馬刺試訓邀請函 想給文班亞馬尋找替補內線

      喜訊!徐昕收到馬刺試訓邀請函 想給文班亞馬尋找替補內線

      醉臥浮生
      2026-05-09 14:26:05
      文班亞馬:我和波波教練每天都會溝通 馬刺有能力一路沖到最頂峰

      文班亞馬:我和波波教練每天都會溝通 馬刺有能力一路沖到最頂峰

      羅說NBA
      2026-05-09 13:21:57
      皮皮蝦事件博主陳女士相關信息被扒,網友又開始網暴她了

      皮皮蝦事件博主陳女士相關信息被扒,網友又開始網暴她了

      映射生活的身影
      2026-05-09 10:45:43
      “4只皮皮蝦1035元”當事人否認想吃白食,刪除評論;隔壁海鮮店發聲

      “4只皮皮蝦1035元”當事人否認想吃白食,刪除評論;隔壁海鮮店發聲

      上觀新聞
      2026-05-09 09:58:08
      海參崴的街頭,誰在出賣我們的歷史尊嚴?

      海參崴的街頭,誰在出賣我們的歷史尊嚴?

      迷世書童H9527
      2026-05-07 14:55:09
      外資家電大撤退,但中國品牌還沒贏

      外資家電大撤退,但中國品牌還沒贏

      螺旋實驗室
      2026-05-08 18:30:22
      京東方又丟iPhone大單,蘋果為何甩不掉它?

      京東方又丟iPhone大單,蘋果為何甩不掉它?

      Ping值焦慮
      2026-05-06 21:39:22
      外賣小哥冒死沖進火場救火 被物業收取50元“滅火器使用費”

      外賣小哥冒死沖進火場救火 被物業收取50元“滅火器使用費”

      閃電新聞
      2026-05-09 09:31:06
      2026-05-09 16:19:00
      EEWorld電子工程世界 incentive-icons
      EEWorld電子工程世界
      即時參與討論電子工程世界最火話題,搶先知曉電子工程業界資訊。
      288文章數 22關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      香港富豪孫女被綁架 綁匪拿到2800萬后逃跑8人花11萬

      頭條要聞

      香港富豪孫女被綁架 綁匪拿到2800萬后逃跑8人花11萬

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      Meta瘋狂擁抱人工智能:員工苦不堪言

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      旅游
      親子
      健康
      教育
      軍事航空

      旅游要聞

      滿目青翠入畫來 棗莊楊峪初夏景致美不勝收

      親子要聞

      什么牌子的奶粉好?君樂寶奶粉以靠譜品質回應寶媽牽掛

      干細胞能讓人“返老還童”嗎

      教育要聞

      “你管這面相叫聰慧明理?”寶媽寫小作文偏袒小兒子,被網友群嘲

      軍事要聞

      美伊突然再次交火 伊朗外長:戰爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻人人干| 精品国产AV| 中文毛片无遮挡播放免费 | 国产精品视频午夜福利| 一本色道无码DVD色诱| 亚洲精彩视频在线观看| 四虎成人精品永久网站| 超碰人人人| 亚洲天堂2018av| 国产亚洲美女精品久久久久| 四虎成人在线观看免费| 麻豆aⅴ精品无码一区二区| 久久精品国产亚洲av高清蜜臀| 99精品久久久久久久婷婷| 国产精品国产亚洲看不卡| 亚洲无码AAA| 秋霞电影院午夜无码免费视频| 中文字幕乱码在线播放| 人伦片无码中文字幕| 日韩精品中文女同在线播放| 一本一道波多野结衣一区二区 | 欧美天堂少妇| 91啪免费网站在线观看| 婷婷六月在线精品免费视频观看| 国产成人精品18| 久久青草精品A片狠狠来| 天堂人妻在线| 欧美bbbbxxxx性欧美在线| 午夜成人无码免费看网站| A片入口| 乱人伦人妻中文字幕无码久久网 | 99久久精品国产一区二区暴力 | 久久碰国产一区二区三区| 91人妻人人澡人人爽人人精品| 91a'v| 精品人妻少妇| 久久夜色国产噜噜亚洲av| 最近中文字幕在线中文视频 | 99精品国产成人一区二区| 2021国产成人精品久久| 亚洲AV成人精品一区二区三区在线播放 |