训练时间有望缩短至几分钟!台积电或将生产 Cerebras 的“超级”AI 晶片

训练时间有望缩短至几分钟!台积电或将生产 Cerebras 的“超级”AI 晶片

根据报道,台积电推出 3D SoIC 后端服务后,还开发主要用于超级计算 AI 晶片的 InFO SoW(晶圆系统)技术,并有望在两年内以 InFO(整合式扇出封装技术)衍生制程开始量产。

之前台积电已与 Cerebras 合作,InFO 衍生制程开始量产意味着台积电可能 2 年内开始商业化生产专属超级电脑的 AI 晶片。这款从去年推出就备受瞩目的超级 AI 晶片若商业化,机器学习或将迈入新阶段。

制造“超级”AI 晶片,面临互连难题

此次台积电计划生产的 AI 晶片,就是新创人工智慧公司 Cerebras Systems 去年推出的世界最大半导体晶片,拥有 1.2 兆颗电晶体,40 万颗核心,面积为 46,225 平方公釐,晶片上记忆体 18G,是目前面积最大晶片 NVIDIA GPU 的 56.7 倍,并多了 78 颗计算核心。

据 Cerebras 说法,这是目前唯一百万级电晶体晶圆级处理器,基于此晶片推出的 CS-1 系统可提供比其他系统更少空间和功耗计算效能,相当于标准资料中心机架三分之一,同时取代数十万个 GPU 的需求。

训练时间有望缩短至几分钟!台积电或将生产 Cerebras 的“超级”AI 晶片 AI与大数据 图2张

(Source:Cerebras)

Cerebras 之所以推出这款 AI 晶片,主要是针对深度学习的工作负载。当今人工智慧发展受训练模型花费时间的限制,如何缩短训练时间是整个产业共同的问题。目前大多数晶片都是在 12 英吋硅晶圆上制成的晶片集合,并在晶片工厂批量加工,但 Cerebras 晶片却是采用互连法,将所有核心放在同一块硅晶圆上,使资料移动快速且低功耗。

另一方面,Cerebras 将所需资料储存在处理器晶片而非单独储存晶片,意味着晶片能将原本需几个月的训练缩短到几分钟,推理能力也更强。

所有改进都指向制造的晶片越大越好,但晶片越大,可能出现的缺陷也就越多,就要求制造晶片的过程中,尽可能解决难题。例如,光刻工具旨在将特定图案一遍又一遍投射到较小的矩形框内,由于在晶圆的不同位置刻蚀不同图案的成本和难度,限制了在同一晶圆构建不同的系统。

对于超级计算晶片而言,最大的挑战在于晶片互连。这要求晶片制造商在每个晶片周围留下空白硅窄边,称为划线。基于这难题,Cerebras 与台积电合作。

台积电先进封装技术有望达成“超级”AI 晶片量产

台积电与 Cerebras 的合作,整合式扇出型封装技术(InFO)发挥了重要作用。

而整合式扇出封装技术是什么?

从技术特点来看,先进晶圆封装技术分为扇入型(Fat-in)和扇出型(Fan-out)两种,传统晶圆级封装多采扇入型架构,完成再布线并形成与外部互连的焊球,主要应用于 I/O 引脚数量较少的积体电路晶片。但随着终端机用户对产品效能要求日趋增多,摩尔定律下制程节点不断推进,满足要求的晶片需要更多 I/O 引脚,传统扇入型封装已不符合要求,扇出型晶圆级封装方式应运而生。

扇出型封装突破 I/O 引出端数目的限制,透过晶圆重构增加单个封装体面积,之后应用晶圆级封装的先进制程完成多层再布线和凸点制备,切割分离后得到能与外部效能互连的封装体。

训练时间有望缩短至几分钟!台积电或将生产 Cerebras 的“超级”AI 晶片 AI与大数据 图3张

(Source:台积电)

不同厂商的技术各有差异,就台积电而言,扇出型晶圆封装领域开发出整合式扇出封装技术(InFO),并于 2014 年宣布量产。台积电采用的扇出型封装技术,舍弃了原本扇入型封装使用的印刷电路版,直接将 NAND、逻辑 IC、RF 射频等元件嵌入晶圆,意味着靠扇出型封装技术得到的晶片厚度和成本都减少。

根据台积电的说法,扇出型封装技术使晶片厚度减少 20%,成本降低 30%,同时互连功耗降低 15%。以较小功耗达成高连线性,这正是超级计算 AI 晶片所需解决的问题。

尽管扇出型封装技术比扇入型封装先进,但考虑到安全性等因素,目前市场只有手机应用处理器使用扇出型封装,CPU 和逻辑 IC 等依然使用扇入型封装。基于成本与厚度优势,未来可能有越来越多晶片采用扇出型封装技术。此次台积电与 Cerebras 合作,也为扇出型封装技术开拓新市场。

价高但值得付出

预计 Cerebras 晶圆的成本为 200 万美元,价格昂贵,就算量产也无法短时间内大量普及,但学习能力和推理能力确实值得期待,这似乎是 cyber 时代机器走向人类的一大步,如同我们对 5G 世界的想像。当机器学习更普及,我们的世界将会变成什么样子?

  • Cerebras’s Giant Chip Will Smash Deep Learning’s Speed Barrier

(本文由 雷锋网 授权转载;首图来源:Cerebras)

延伸阅读:

  • 这台电脑只有 66 公分高,但内部装有 40 万核心
  • 新创独角兽 Cerebras 推出 AI 单晶片超级电脑,大型 AI 学习训练可从数月降至数分钟

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。