7月25日,WAIC 2025前夕,后摩智能正式發(fā)布全新端邊大模型 AI 芯片——后摩漫界?M50,同步推出力擎?系列M.2卡、力謀?系列加速卡及計算盒子等硬件組合,形成覆蓋移動終端與邊緣場景的完整產(chǎn)品矩陣。M50芯片實現(xiàn)了160TOPS@INT8、100TFLOPS@bFP16的物理算力,搭配最大48GB內(nèi)存與153.6 GB/s 的超高帶寬,典型功耗僅10W,相當于手機快充的功率,就能讓PC、智能語音設(shè)備、機器人等智能移動終端高效運行1.5B 到 70B 參數(shù)的本地大模型,真正實現(xiàn)了“高算力、低功耗、即插即用”。
當前大模型行業(yè)正經(jīng)歷深刻變革,ChatGPT 僅用 2年便達成 Google 11年積累的年搜索量規(guī)模,超級應(yīng)用用戶破億的時間從手機時代的16年壓縮至 ChatGPT 的2周。行業(yè)已進入“推理密度”與“能耗密度”雙重敏感階段,未來5年推理成本將占大模型全生命周期80%以上。在端邊大模型部署“最后一公里”的競爭,或?qū)⒊蔀闆Q定未來產(chǎn)業(yè)格局的重要拐點。
高算力、高帶寬、低功耗,這3項看似互斥的指標,正是存算一體技術(shù)大顯身手的主場,后摩智能從2020年就開始深耕這一領(lǐng)域。存算一體通過把計算和存儲單元集成在一起,讓數(shù)據(jù)就近處理,從根本上解決了傳統(tǒng)芯片“數(shù)據(jù)傳輸慢、功耗高”的問題。M50芯片作為這項技術(shù)的集大成之作,其第二代SRAM-CIM雙端口存算架構(gòu)能讓權(quán)重加載和矩陣計算同時進行,支持多精度混合運算,可兼顧模型部署的各項需求;后摩智能自主研發(fā)的第二代 IPU 架構(gòu)——天璇,通過壓縮自適應(yīng)計算周期實現(xiàn)彈性計算(Elastic Computing),最高可提供160%的加速效果;通過內(nèi)建的高速多芯互聯(lián)技術(shù),可實現(xiàn)算力與帶寬擴展;同時適配后摩智能新一代編譯器后摩大道?,可根據(jù)芯片架構(gòu)自動選擇最優(yōu)算子,無需開發(fā)者手動嘗試;支持浮點運算,無需量化參數(shù)和精度調(diào)優(yōu)。和傳統(tǒng)架構(gòu)相比,M50的能效提升5-10倍,完美適配了端邊設(shè)備“算得快又吃得少”的需求。
除了 M50芯片,后摩智能此次發(fā)布的產(chǎn)品矩陣形成了覆蓋端側(cè)到邊緣的多元算力方案。力擎??LQ50 M.2卡以口香糖大小的標準 M.2 規(guī)格,為 AI PC、AI Stick、陪伴機器人等移動終端提供 “即插即用”的端側(cè) AI 能力,支持 7B/8B 模型推理超 25tokens/s;力擎??LQ50 Duo M.2卡集成雙 M50芯片,以 320TOPS 算力突破 14B/32B 大模型端側(cè)部署瓶頸;力謀?LM5050加速卡與力謀?LM5070加速卡分別集成2顆、4顆 M50芯片,為單機及超大模型推理提供高密度算力,最高達 640TOPS;BX50計算盒子則以緊湊機適配邊緣場景,支持32路視頻分析與本地大模型運行。
這些產(chǎn)品可廣泛應(yīng)用于消費終端、智能辦公、智能工業(yè)等多元領(lǐng)域,且均能在離線狀態(tài)下實現(xiàn)全流程本地處理,從源頭杜絕數(shù)據(jù)聯(lián)網(wǎng)傳輸風(fēng)險。例如在消費終端,賦能筆記本、平板電腦、學(xué)習(xí)機等設(shè)備本地大模型推理能力,無需聯(lián)網(wǎng)即可完成智能交互、內(nèi)容生成等任務(wù),用戶隱私數(shù)據(jù)全程閉環(huán)留存;智能辦公場景中,智能會議系統(tǒng)在斷網(wǎng)環(huán)境下仍能實現(xiàn)多語種翻譯、紀要生成,會議內(nèi)容不觸云、不泄露;智能工業(yè)領(lǐng)域,產(chǎn)線質(zhì)檢與車路云協(xié)同通過本地算力完成實時分析決策,生產(chǎn)數(shù)據(jù)與運營信息在設(shè)備端閉環(huán)處理,避免云端傳輸隱患。后摩智能通過存算一體技術(shù)與大模型的深度融合,推動 AI 大模型在端邊側(cè)實現(xiàn) “離線可用、數(shù)據(jù)留痕不外露”,構(gòu)建起 “低功耗、高安全、好體驗” 的端邊智能新生態(tài)。
面向未來,后摩智能已啟動下一代 DRAM-PIM 技術(shù)研發(fā),通過將計算單元直接嵌入 DRAM 陣列,使計算與存儲的協(xié)同更加緊密高效。該技術(shù)將突破 1TB/s 片內(nèi)帶寬,能效較現(xiàn)有水平再提升三倍,推動百億參數(shù)大模型在終端設(shè)備實現(xiàn)普及,讓更強大的 AI 算力能夠融入 PC、平板等日常設(shè)備。
這樣的技術(shù)方向和發(fā)展愿景也得到了重量級產(chǎn)業(yè)方和國有資本的認可,近兩年以來,后摩智能已經(jīng)獲得了中國移動產(chǎn)業(yè)鏈發(fā)展基金、北京市人工智能基金,北京市亦莊產(chǎn)業(yè)升級基金、中國國有企業(yè)混改基金等多家機構(gòu)的投資,為在端邊大模型芯片領(lǐng)域的持續(xù)創(chuàng)新提供了有力支撐。后摩智能CEO吳強博士表示:“M50的發(fā)布只是一個開始,我們的目標是讓大模型算力像電力一樣隨處可得、隨取隨用,真正走進每一條產(chǎn)線、每一臺設(shè)備、每一個人的指尖?!?/p>
(企業(yè)供圖)
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2025 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報》社有限責(zé)任公司