法国独角兽新创Mistral AI,用“开源”挑战OpenAI!模型速度还比Llama 2快6倍
▼
生成式AI新创的吸金能力仍然不减。成立仅7个月的法国新创Mistral AI于11日宣布,完成由a16z领投4.15亿美元(新台币129.54亿元)的A轮募资,估值达到20亿美元(新台币627.2亿元)。
事实上,由Google DeepMind和Meta的前员工所成立的Mistral AI,才在今年6月的种子轮获得1.13 亿美元(新台币35.44亿元)的资金,究竟为何被那么多人看好?
有人看准欧洲的Mistral AI会在LLM(大型语言模型)的训练、生成式AI的建构与OpenAI、Meta等人展开竞争,而Mistral AI的关键就是“开源”。
Google DeepMind、Meta前员工认为开源是AI的核心,创立Mistral AI
“开源是我们的核心。”Mistral AI执行长Arthur Mensch说。
Arthur Mensch和共同创办人Timothe Lacroi、Guillaume Lample从学生时期就认识了,当Arthur Mensch在DeepMind工作时,Timothe Lacroi和Guillaume Lample则在巴黎的Meta AI研究中心工作。
Mistral AI执行长Arthur Mensch。
图/ Arthur Mensch linked in
2022年他们看到OpenAI的GPT模型让AI进入人们的生活,有了更多应用场景和机会。出于对OpenAI“闭源”的作法不认同,决定成立Mistral AI,以完全授权的Apache 2.0授权方式开源新的LLM模型。
说到开源模型,首先会想到的是Meta的Llama 2,但是Llama 2会根据使用者的规模和目的而有对应的限制规范,例如月活跃用户超过7亿则要Meta申请特殊授权。
在Apache 2.0授权下发布的模型是一种开源许可证,除了版权外,对用户的修改、使用、复制程式码没有任何限制。尽管交给开发者完全的开发能力,从资讯安全角度看待或许并不乐观,但Mistral AI认为开源的重点也保障了作者的版权和利益,克服潜在的滥用。
Mistral AI的模型Mixtral 8x7B,与同为开源的Llama 2相抗衡
Mistral AI的产品与其他LLM相似,希望能协助企业部署聊天机器人、搜寻引擎、线上辅导等AI驱动的产品。Mistral AI目前在Apache 2.0授权下发布的有两款产品,提供使用者免费使用:
-
Mistral 7B
Mistral AI首款产品只有70亿个参数的“小”资料库。运用了群组查询注意力(GQA)加快推理速度,减少重复运算。 -
Mixtral 8x7B
属于稀疏混合专家模型(Sparse Mixture of Experts Model,SMoE):网络中的每个子模组都擅长处理特定类型的资料,经过训练能够根据输入资料的特性分配任务给2个最合适的“专家”,再将个别的输出整合成最终的输出。根据官方的资料,相比同为开源的Llama 2 70B模型,Mixtral 8x7B推理速度是Llama 2 70B的6倍。
Misrtral AI的官方资料显示:Mixtral 8x7B在大多数基准测试中,均符合或优于竞争对手Llama 2 70B以及GPT3.5。
图/ Mistral AI官网
Mistral AI近期也开放其他公司透过额外付费,使用Mistral AI当前的最佳模型:Mistral-medium。虽然没透露更多细节,不过Mistral AI表示,未来将为企业开发托管解决方案和专用系统会是其主要获利来源。
参考资料:TechCrunch、Reuters、NYTimes
本文授权转载自:创业小聚
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。