OpenAI攻企业AI最大敌手、辉达也投资!独角兽新创Cohere靠“小而精”模型取胜
▼
谈起AI新创,OpenAI无疑是最大的一只独角兽,但在企业AI的领域,正面临一个规模较小却强大的敌人──Cohere。
2022年底开始,生成式AI让市场开始摆脱“新创寒冬”的阴霾,孵出13只预估市值超过10亿美元的独角兽,其中估值前三名的公司OpenAI、Anthropic、Inflection,竞争的都是大型语言模型和聊天机器人产品的领域,但紧追在后的Cohere,锁定的不是一般2C用户,而是更窄的2B企业领域。
靠着独特的商业模式,Cohere快速获得市场的关注,在今年6月宣布取得2.7亿美元的C轮融资,估值达到22亿美元,其中投资人阵容一字排开,包括辉达(NVIDIA)、甲骨文(Oracle)、Salesforce等硅谷巨头。今年8月,美国科技媒体《The Information》又报道Cohere正准备启动新一轮融资的消息,估值可望冲上30亿美元。
Cohere锁定企业AI的赛道。
图/ Cohere
Cohere在做什么? 优势是什么?
虽然目前居于AI新创估值第四,Cohere仍然被视为OpenAI的强劲对手,因为Cohere锁定了OpenAI虎视眈眈的“企业AI”这条相对狭窄的赛道,并且和OpenAI庞大的模型相反,采用更小的参数、更大的客制化弹性来打天下。
Cohere v.s OpenAI
这种模式更容易取得企业客户的信任,例如和企业深度合作的顾问谘询公司麦肯锡(McKinsey)就选择Cohere做为首家合作的LLM厂商。“客户在AI领域考虑的是成本、智慧财产权保护和消费者隐私,我们发现Cohere是最好的解决方案之一”麦肯锡高级合伙人班.艾伦维格(Ben Ellencweig)在《路透社》的采访中提起关键优势,也是Cohere锁定的企业痛点。
优势1:更小的模型,导入弹性高
在成本方面,Cohere的优势在于“小而精”的模型,供企业挑选使用,代表模型不需要什么都懂,只要在至少一个专门领域变成专家就可以。比起其他LLM动辄千亿以上的参数量和万张GPU的资源,成本效益更高,让资源有限的企业选择自己想要的应用购买服务。
Cohere锁定企业三大领域AI应用
◆文本生成:摘要文件内容的Summarize、生成文字叙述的Generate、能加入数据客制化训练的Command Model
◆文本检索:快速评估文件品质的Embed、可以用文字含意查询的搜寻工具Semantic Sea问字rch、用语义搜寻并为搜寻结果排名的Rerank
◆文本分类:自动标记并分类不同文字内容的Classify
只专精在三大领域,就像只卖三种料理的餐厅,出菜快速又好吃。
丹佛大学的HELM语言模型评估就显示,Cohere旗下规模最大的文本生成模型Command,只用520亿个参数训练,准确性表现却比3倍大参数的知名模型都更好,其中也包括OpenAI用了1750亿个参数训练的GPT-3。
因为模型小,就算部署在企业内部的资料中心也不用消耗太多资源,Cohere甚至直接在官网标题写下“可扩充、可负担的AI价格”(Scalable, affordable AI Pricing),让便宜和弹性成为吸客优势。最低价的Embed模型每百万个Token(文本最小单位)只要40美分,最高价的自定义模型Command Model则是每百万Token 30美元。至于OpenAI在价格调降后,GPT-4每百万Token输入加输出整套服务是40美元。
Cohere官网有完整的价格计算机,方便客户导入前试算成本。
图/ Cohere官网
优势2:安全性和隐私保护
在资料保护方面,Cohere的优势在于多元的部署环境,除了大型云端厂商AWS、Google等选项,也可以选择放在Cohere的资料中心,但若是资料太机密,无法经手其他公司,也可以选择放在私有云或地端,也就是企业自家的资料中心或服务器中运行。
能够提供企业多种选项,Cohere自诩为一家“中立的服务提供者”,因为比起OpenAI和微软深度绑定的模式,Cohere的客户有更多弹性根据需要选择部署环境,拥有完全数据控制权,即使是不信任AI,或者不愿意让自家产业秘密被喂给AI模型的公司,都有机会选用Cohere的服务。
企业在导入生成式AI时往往会面临成本和安全性的双重挑战。
图/ NicoElNino via shutterstock
小参数模型、大厂人脉支援,解决GPU难题
身为新创,Cohere在创立初期的GPU等基础建设资源,都难以和微软等大厂相抗衡,于是靠着小参数模型策略,不只降低前期GPU用量,同时也解决企业导入AI时GPU消耗量的问题。
锁定企业级AI的策略也让Cohere获得志同道合的科技大厂支持,包括商用软件巨头甲骨文和Salesforce,以及几乎独霸市场的AI GPU提供商辉达都下手支援。
其中辉达在AI崛起后,开始大手笔在新创领域“下注”,紧跟市场最创新的服务和最热门的应用,自2018年以来,辉达参与的前5大创投交易都发生在今年,而Cohere是这波最大动作的投资,一年内投注两次。
获得辉达的奥援,等于具备在AI时代最需要的“人脉”Cohere有机会比同期新创更容易获得AI时代最必要的资源,例如Cohere在10月就宣布导入NVIDIA推理服务器Triton,指出“能最大限度地发挥NVIDIA GPU的潜力”,降低模型推理的延迟度,也能提高整体资料处理量。
在不断攀升的GPU成本下,AI几乎已经变成资本密集的产业,中国台湾AI新创满拓科技创办人吴昕益更形容这是一场“大公司才能玩得起的游戏”。Cohere锁定小而精的商业模式,让资源有限的中小企业、新创,也有机会掌握AI力量。
延伸阅读:GPU太难买,又想导入AI怎么办?软件技术助攻AI商机,三招优化GPU!
责任编辑:林美欣
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。