產品

RecAccel™ N3000

創鑫智慧RecAccel™ N3000 通過結合專利 FFP8 技術與先進硬體架構,革新深度學習推薦系統。這款 PCIe Gen5 解決方案可在 20 瓦功耗下實現每秒超過 2000 萬次推理,準確率達 >99.95%,並提供 1.7 倍的能效優勢。基於台積電7奈米製程,並搭配完整的軟體生態系統,RecAccel™ N3000為現代數據中心的 AI 加速樹立了新標準。


概述
革命性 AI 加速技術
專為 DLRM 設計
創鑫智慧RecAccel™ N3000 是一款專為深度學習推薦模型 (DLRM) 設計的 AI 加速解決方案,提供卓越的性能與效率。該解決方案的核心技術優勢來自其先進的 FFP8 技術,採用專利 FFP8 量化技術,在提高效率的同時保持 >99.95% 的 FP32 準確度。該系統展現出卓越的性能指標,每秒可進行超過 2000 萬次推理,且功耗僅 20 瓦,這一切均得益於其台積電7奈米製程技術。
從硬體架構來看,RecAccel™ N3000採用雙插槽 PCI Express Gen5 介面,專為推薦推理工作負載量身打造。其最顯著的特點之一是能夠透過多張卡片實現近線性性能擴展,並在能效表現上比競品提升 1.7 倍。
N3000 擁有強大的軟體生態系統,配備完整的 SDK,內建自動化工具以簡化網路部署。開發者可使用 FFP 量化工具、位元真實模擬器與性能預估器進行開發,並透過內建的偵錯與校準工具輕鬆進行整合。此外,專有推薦運算元與可配置的資源分配確保系統的最佳化表現。
透過 MLPerf v3.0 基準測試,RecAccel™ N3000已經展現業界領先的性能表現。該系統在專有 INT8 校準技術的支持下,維持 99.9% 的準確度,並且在測試中達到了接近 100% 的線性擴展能力。
在可持續性與商業影響方面,RecAccel™ N3000的優化架構確保了最低的功耗,進而透過提高能效來降低總擁有成本 (TCO)。該系統專為彈性數據中心環境設計,並支持超大規模數據中心 (Hyperscaler) 和雲端服務供應商 (CSP) 之間的可持續發展計劃。
隨著企業對推薦系統的依賴日益加深,RecAccel™ N3000代表了 AI 推薦加速技術的重大突破。它成功結合了高準確度、卓越性能與節能特性,為現代數據中心部署提供可擴展的解決方案,以滿足不斷增長的需求。

規格
RecAccel N3000 規格
內建 ARC HS48 處理器
  • CPUt - 雙核心,具備記憶管理功能
  • CPU1 - 雙核心
內建 ARC EV72 處理器
  • 向量 DSP
  • 浮點運算單元 (FPU)
通訊介面PCIe Gen 5x8
記憶體
  • 16 組 LPDDR5-6400 控制器
  • 512KB 共享記憶體
AI 加速器
  • 矩陣運算引擎 × 10
    (動態 MLP 引擎, DME)
  • 向量運算引擎 × 2 (特徵交叉, FX)
  • 嵌入式運算引擎

產品特色

為AI推薦系統加速提供最先進的硬體解決方案

使用RecAccel™ N3000 PCIe卡提升您的AI推薦系統效能。這款雙槽PCI Express Gen5卡提供卓越的性能和可靠性,非常適合需求最嚴苛的彈性數據中心。由創鑫智慧RecAccel™ N3000系列AI晶片驅動,該卡提供強大的加速能力,將您的AI推薦系統提升到新高度。體驗極致的速度、性能和可靠性,並釋放加速AI對您的業務的全部潛力。


lpddr5.png (397 KB)

深入理解雲端推薦技術

雲端推薦的革命性領域專用架構設計,源於對計算、延遲、記憶體、能效和準確性等需求之間複雜相互作用的深刻洞察。通過卓越的算法優化、硬體加速、數據快取和電源管理,這一設計承諾提供無與倫比的性能和效率,為雲端推薦系統樹立了新的標準。


MLPerf™ DLRM推理基準測試的業界領先結果

RecAccel™ N3000已證明在業界中無論在性能還是能效方面均為領先。在MLPerf™ v3.0中,RecAccel™ N3000系統在推理DLRM方面的每瓦性能提高了1.7倍,同時借助其專有的INT8校準器,維持99.9%的準確度。


軟硬體協同設計實現線性多卡擴展性

在MLPerf™ v3.0的系統測試中,RecAccel™ N3000展現了卓越的性能,並在每張卡片上實現了接近100%的擴展性。這意味著,隨著更多卡片的加入,該卡的性能線性增長,實現了無縫的可擴展性和性能提升。

 

關鍵優勢
卓越的能效
  • 僅需20瓦便可達到每秒2000萬次推理
  • 將外部記憶體訪問減少50%
  • 帶寬利用率提高30%
  • DLRM工作負載的業界領先能效
卓越的準確性
  • 使用INT8達到99.97%的FP32準確度
  • 使用FFP8提升至99.996%的準確度
  • 在減少功耗的同時保持高準確性
  • 為生產級推薦模型進行優化
靈活的部署選項
  • 提供雙M.2模塊
  • 支持PCIe Gen 5卡
  • 可擴展至各種數據中心配置
簡化的實施過程
  • 自動化優化路徑
  • 輕鬆與現有系統集成
  • 全面的開發工具和支持
Top