OpenAI 紧张？对手 Mistral 开源模型效能直逼 GPT-4

AI与大数据 25分钟前 0

▼

法国新创商 Mistral 近来外泄的开源 AI 模型刚刚获得高层认证，而根据网友测试，其效能直逼 OpenAI 目前最强大的大型语言模型（LLM）“GPT-4”。

VentureBeat 1月31日报道，1月28日左右，一位代号“Miqu Dev”的网友在开源AI模型与编码分享平台Hugging Face张贴了一组档案，组合起来后便成为全新LLM“miqu-1-70b”。该名网友并提到，这款LLM的提示模板（Prompt format，指使用者与之互动的方式）跟Mistral一样。

有人随即透过社交平台X分享了上述讯息。网友N8 Programs 1月31日在X指出，不管“Miqu”是甚么，这款LLM在情感智慧评分标竿软件“EQ-Bench”的跑分高达83.5分，击败世界上几乎每一款LLM，仅落后GPT-4。

Whatever Miqu is, it has some sort of special sauce. It gets an 83.5 on EQ-Bench (evaluated locally), surpassing *every other LLM in the world except GPT-4*. EQ-Bench has a 0.97 correlation w/ MMLU, and a 0.94 correlation w/ Arena Elo. It *beats* Mistral Medium – at Q4_K_M. I… pic.twitter.com/0gOOPjxjPD

— N8 Programs (@N8Programs) January 30, 2024

机器学习（ML）研究人员也注意到Miqu。摩根大通（JP Morgan & Chase）机器学习科学家Maxime Labonne 1月31日透过LinkedIn网站指出，Miqu是不是“MIstral QUantized”的缩写，目前还无法确定，但Miqu已快速成为最佳的开源LLM之一。调查虽仍在进行中，但估计大家很快就能看到表现超越GPT-4的Miqu微调版本。

在机器学习界，Quantization（中文称做量化）是一种以短数字序列取代特定长数字序列的技术，可让AI模型在功能较不强大的电脑、晶片上执行。

消息延烧几天后，Mistral执行长Arthur Mensch终于在2月1日透过X证实，“提前获得存取权的客户中，一名过度热情的员工外泄了我们训练并公开发送过的旧模型，且是经过量化（并打上水印）的版本。”

An over-enthusiastic employee of one of our early access customers leaked a quantised (and watermarked) version of an old model we trained and distributed quite openly.

To quickly start working with a few selected customers, we retrained this model from Llama 2 the minute we got…

— Arthur Mensch (@arthurmensch) January 31, 2024

Mensch说，“为了赶快跟特定客户展开合作，我们在取得整个丛集后立刻重新训练了这款源自Llama 2的模型──预训练（pretraining）在Mistral 7B释出当天就已完成。”他还说，自此之后公司进展良好，敬请期待！（stay tuned!）

VentureBeat报道指出，Mensch说“敬请期待”，似乎暗示Mistral训练的“Miqu”模型不但效能已经逼近GPT-4，现在还可能追平、甚至超越GPT-4。

这对整个生成式AI及电脑科学界而言，将是关键的分水岭。GPT-4自2023年3月释出以来，就一直是全球最强大、效能最高的LLM，连Google目前的“Gemini”模型都比不上。一个效能媲美GPT-4的开源AI模型（理论上可免费使用），势必会对OpenAI造成极大竞争压力，尤其是在愈来愈多企业都开始检视开源AI模型的情况下。

（本文由 MoneyDJ新闻授权转载；首图来源：pixabay）

延伸阅读：

AI 独角兽 Mistral：辉达成策略伙伴，美国用量高

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

延伸阅读：

相关文章