晶圆级晶片可用于训练 AI,Cerebras 推人工智慧开源码模型抢市

▼
大家应该记忆犹新,推出全世界最大晶圆级晶片 CS2 的人工智慧晶片新创 Cerebras Systems 日前表示,发表类似 ChatGPT 的开放原始码模型,提供研究和商业社群免费使用,以促进更多合作。
总部位于美国加州硅谷的 Cerebras 发表 7 个模型,都在名为 Andromeda 的 AI 超级电脑训练,包括 1.11 亿个到 130 亿个参数模型。Cerebras 创办人兼执行长 Andrew Feldman 表示关闭 AI 开放原始码模型,但并不奇怪,因投资 AI 模型科技大厂须投入大量资金,我们建构开放原始码模型造成社群兴奋,使我们更进步,很大程度就是受惠于开放原始码。
有更多参数的模型,就能执行越复杂的生成性 AI。如 OpenAI ChatGPT 就有 1,750 亿个参数,可创作诗歌和研究,有助吸引更多人的兴趣和资金。Cerebras 表示,较小模型可部署手机或智慧助理,较大模型可于 PC 或服务器执行,适合个性应用。
对越多参数就能执行越复杂 AI 应用这点,Cambrian AI 晶片顾问 Karl Freund 指越大不代表越好,据一些有趣论文,如果 AI 模型充分训练,小模型也颇为准确,大与训练有素需要平衡。
Andrew Feldman 强调,最大模型花了一个多星期训练,通常这需要几个月,时间缩短要归功于 Cerebras 系统架构,包括一个晶圆级大小晶片,可训练人工智慧模型。目前多数 AI 模型都是用辉达 (NVIDIA) GPU 训练执行,不过越来越多 Cerebras 等新创公司试图抢占一席之地。
(首图来源:Cerebras)
▼

特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。