OpenAI 紧张?对手 Mistral 开源模型效能直逼 GPT-4
▼
法国新创商 Mistral 近来外泄的开源 AI 模型刚刚获得高层认证,而根据网友测试,其效能直逼 OpenAI 目前最强大的大型语言模型(LLM)“GPT-4”。
VentureBeat 1月31日报道,1月28日左右,一位代号“Miqu Dev”的网友在开源AI模型与编码分享平台Hugging Face张贴了一组档案,组合起来后便成为全新LLM“miqu-1-70b”。该名网友并提到,这款LLM的提示模板(Prompt format,指使用者与之互动的方式)跟Mistral一样。
有人随即透过社交平台X分享了上述讯息。网友N8 Programs 1月31日在X指出,不管“Miqu”是甚么,这款LLM在情感智慧评分标竿软件“EQ-Bench”的跑分高达83.5分,击败世界上几乎每一款LLM,仅落后GPT-4。
Whatever Miqu is, it has some sort of special sauce. It gets an 83.5 on EQ-Bench (evaluated locally), surpassing *every other LLM in the world except GPT-4*. EQ-Bench has a 0.97 correlation w/ MMLU, and a 0.94 correlation w/ Arena Elo. It *beats* Mistral Medium – at Q4_K_M. I… pic.twitter.com/0gOOPjxjPD
— N8 Programs (@N8Programs) January 30, 2024
机器学习(ML)研究人员也注意到Miqu。摩根大通(JP Morgan & Chase)机器学习科学家Maxime Labonne 1月31日透过LinkedIn网站指出,Miqu是不是“MIstral QUantized”的缩写,目前还无法确定,但Miqu已快速成为最佳的开源LLM之一。调查虽仍在进行中,但估计大家很快就能看到表现超越GPT-4的Miqu微调版本。
在机器学习界,Quantization(中文称做量化)是一种以短数字序列取代特定长数字序列的技术,可让AI模型在功能较不强大的电脑、晶片上执行。
消息延烧几天后,Mistral执行长Arthur Mensch终于在2月1日透过X证实,“提前获得存取权的客户中,一名过度热情的员工外泄了我们训练并公开发送过的旧模型,且是经过量化(并打上水印)的版本。”
An over-enthusiastic employee of one of our early access customers leaked a quantised (and watermarked) version of an old model we trained and distributed quite openly.
To quickly start working with a few selected customers, we retrained this model from Llama 2 the minute we got…
— Arthur Mensch (@arthurmensch) January 31, 2024
Mensch说,“为了赶快跟特定客户展开合作,我们在取得整个丛集后立刻重新训练了这款源自Llama 2的模型──预训练(pretraining)在Mistral 7B释出当天就已完成。”他还说,自此之后公司进展良好,敬请期待!(stay tuned!)
VentureBeat报道指出,Mensch说“敬请期待”,似乎暗示Mistral训练的“Miqu”模型不但效能已经逼近GPT-4,现在还可能追平、甚至超越GPT-4。
这对整个生成式AI及电脑科学界而言,将是关键的分水岭。GPT-4自2023年3月释出以来,就一直是全球最强大、效能最高的LLM,连Google目前的“Gemini”模型都比不上。一个效能媲美GPT-4的开源AI模型(理论上可免费使用),势必会对OpenAI造成极大竞争压力,尤其是在愈来愈多企业都开始检视开源AI模型的情况下。
(本文由 MoneyDJ新闻 授权转载;首图来源:pixabay)
延伸阅读:
- AI 独角兽 Mistral:辉达成策略伙伴,美国用量高
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。