极低功耗运行 GPT 2!韩国开发全球首款“类似人脑”超高效 AI 半导体

▼
韩国研究人员根据模仿人脑结构和功能的原理,开发世界上首款人工智慧(AI)半导体,能以超高速、极低功耗运行,用于处理大型语言模型(LLM)。该半导体成功运行 GPT 2,功耗仅 Nvidia A100 的 1/625,大小仅 A100 的 1/41,韩媒认为这是全球 AI 半导体大战升级的关键进展。
韩国科学技术情报通信部(MSIT)2 月 6 日宣布,由 Yu Hoi-jun 教授领导的研究团队利用三星 28 奈米制程开发出超低功耗的“互补变压器”半导体。该团队包括韩国科学技术院(KAIST)PIM 半导体研究中心和 AI 半导体研究生院。
传统上,运行 GPT 2 需要多个 GPU,消耗 250 瓦的功率。然而,研究团队使用单个 AI 半导体(尺寸为 4.5×4.5 毫米),在短短 0.4 秒内成功处理 GPT 2,功率仅 400 毫瓦。这项研究成果在 2 月 19-23 日于旧金山举行的国际固态电路会议(ISSCC)上进行介绍和演示。
互补变压器是种可有选择性地使用 “尖峰神经网络”(SNN,spiking neural networks)和“深度神经网络”(DNN,deep neural networks)的技术。前者模仿大脑神经元处理资讯方式,后者则辨识复杂模式并透过多层神经网络进行学习的 AI 模型。
互补变压器类比人脑的运行原理,即能耗随着认知负荷变化而变化。该技术透过对大输入值使用 DNN,对小输入值使用 SNN 来最大限度降低功耗。
韩国科学技术院教授 Yu Hoi-jun 表示,神经形态运算模仿大脑功能,是 IBM 和英特尔等大公司尚未真正实现的技术。很自豪能成为世界上第一个使用超高效神经形态加速器(互补变压器)运行 LLM 的公司。
- KAIST Develops World’s First Super-efficient AI Semiconductor Resembling Human Brain
(首图来源:pixabay)
延伸阅读:
- 彭博:华为 7 奈米晶片突破,是中芯采用应材、科林设备
- 又一大咖开讲!英特尔 Pat Gelsinger 将于 COMPUTEX 2024 发表主题演讲
▼

特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。