IBM NorthPole AI 晶片整合记忆体架构,称 12 奈米超越 4 奈米 GPU

IBM NorthPole AI 晶片整合记忆体架构,称 12 奈米超越 4 奈米 GPU

IBM 日前宣布开发出 NorthPole AI 晶片,号称具备人类大脑运作,推论性能据称超越 4 奈米制程的 GPU,适用于边缘运算等领域。

NorthPole 晶片IBM 曾在 2014 年模拟人脑运作的 TrueNorth 晶片后继款,晶片开发同样由 TrueNorth 负责人 Dharmendra Modha 主导。

IBM 指出,传统半导体产业,晶片遵循相同基本架构,处理单元与储存资讯是相互分开的。这样的架构虽然简化晶片设计模式,却也因传输速度赶不上处理速度出现 von Neumann 瓶颈。Dharmendra Modha 认为人脑是最节能处理器,所以研究持续寻找以数位复制人脑的方法。

IBM NorthPole 晶片相对传统晶片最大不同点是晶片内建记忆体,没有 von Neumann 瓶颈,NorthPole 晶片 AI 推论能力优于竞争对手。NorthPole 晶片虽然采 12 奈米制程,但能 800mm 上放置 220 亿个电晶体,拥有 256 个核心,于 8-bit 环境每核心运算周期可执行 2,048 次操作,若 4-bit 或 2-bit 环境,执行次数翻倍。

IBM 指出,NorthPole 晶片号称模糊运算与储存界线,让 NorthPole 晶片容易整合至系统,减少搭载晶片设备负荷,让 NorthPole 晶片在 ResNet-50 模型测试后,结果较同样采 12 奈米制程对手 GPU 产品来说,NorthPole 晶片每秒辨识能效是对手 25 倍,且不管延迟或运算空间要求,表现都优于所有主流架构,甚至凌驾基于 4 奈米制程的 GPU

不过 NorthPole 的优势也是弱点。NorthPole 只能轻松读取整合至晶片的终端数据,读取外界数据时,便没有计算速度优势。Dharmendra Modha 表示,虽然 NorthPole 无法执行类 GPT-4 训练,但可满足许多企业模型的推论要求。

IBM 仍在研究 NorthPole 晶片适用领域,但研究员发现,许多需即时处理大量资料的边缘计算领域将可能非常适合采用 NorthPole 晶片,如自动驾驶、远端通讯等领域,NorthPole 均是擅长处。

(首图来源:Flickr/Adrian Scottow CC BY 2.0)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。