百度文心大模型 3.5 版,评测得分超越 ChatGPT
▼
新浪财经报道,据内部人士透露,百度文心大模型 3.5 版本已内测可用,在公开测试集上进行的基础模型少样本(Few-Shot)评测显示,文心大模型 3.5(ERNIE 3.5)在多个测试集的得分已超过 ChatGPT。
为验证主流大模型的各项综合能力,评测在AGIEval、C-Eval和MMLU三个权威评测基准上进行综合评估。除文心大模型3.5,评测的模型还有ChatGPT、GPT-4、ChatGLM、LLaMa系列大模型,评测可看出大模型在能力上的优劣,同时对模型的迭代发展也有着很强的指导作用。
从评测得分来看,文心大模型3.5版中文能力突出,甚至有超出GPT-4的表现;综合能力稍逊于GPT-4,但已经在评测中超过了ChatGPT,远远领先于其他开源大模型。
内地工程院院士邬贺铨曾表示,内地企业在获得中文语料和对内地文化的理解方面比外国企业有天然的优势,内地制造业类别最全,具有面向实体产业训练产业AIGC的有利条件,在算力方面内地已具有较好的基础;以百度文心大模型3.5版为例,与3.0版本相比,透过各项演算法和数据的优化,尤其是百度首创的知识增强和检索增强技术的优化,新版本文心大模型在各项能力上均有明显提升。
据了解,百度人工智慧四层架构的端到端优化,尤其是框架和模型层的协同优化,让文心大模型训练速度、模型效果加速提升。
(本文由MoneyDJ新闻授权转载;首图来源:影片截图)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。