阿里云开源通义千问 14B 模型,拟共建大模型市场
▼
上证报报道,阿里巴巴集团的数位技术和智慧骨干业务阿里云 25 日开源通义千问 140 亿参数模型 Qwen-14B 及其对话模型 Qwen-14B-Chat,可免费商用。
阿里云副总裁、公众与客户沟通部总经理张启表示,不管是闭源还是开源大模型,自研还是第三方大模型,大规模或小规模参数模型,以及通用或行业、企业专属大模型,阿里云全部欢迎和支援,共同建设一个最大的大模型自由市场;希望所有大模型都能跑在阿里云上,跑得更快、更便宜、更安全。也因如此,阿里云率先开源7B、14B模型,并将持续开源开放。
据了解,大规模预训练模型参数量大、训练成本高,开源大模型可帮助用户简化模型训练和部署过程,使得使用者不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速建构高品质的模型或进行相应的应用开发。目前,7B(70亿)参数是开源大模型中最常见的规模,此外,较常见的开源模型尺寸还有13B(130亿)、20B(200亿)、70B(700亿)等。
在此之前,今年8月阿里云开源通义千问70亿参数基座模型Qwen-7B,一个多月下载量突破100万。此次最新开源的Qwen-14B是一款支援多种语言的高性能开源模型,相较同类模型使用了更多的高品质数据,整体训练数据超过3兆Token,使得模型具备更强大的推理、认知、规划和记忆能力;用户可从魔搭社区直接下载模型、体验模型,也可透过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。
(本文由 MoneyDJ新闻 授权转载;首图来源:通义大模型)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。