开源版 ChatGPT 要来了？AI 做图神器团队想让每人都能做出大模型

AI与大数据 6小时前 0

▼

Stability.ai 开源模型 Stable Diffusion 可说是现在最主流也最重要的 AI 绘画模型。基于开源的 Stable Diffusion，开发者社群创作出许多有趣外挂和模型，如控制形状的 Control Net 等，相关专案超过千个。

现在这家热中开源的AI公司又想搞事了──发表类似ChatGPT的开源大语言模型。

人人都有LLM

2023年到目前可说是大语言模型年，几个月以来，几乎每周都有新大语言模型面世。大模型、小模型、文本生成、多模组、闭源、开源……现在是大语言模型的春天，各家百花齐放。这热闹不仅属微软、Google、百度、阿里等科技公司，也属于所有与AI相关的科技公司。和现在大模型相比，Stability.ai的StableLM大语言模型有什么特别？

Stability.ai介绍，StableLM是开源透明模型，允许研究人员和开发者自由检查、使用和修改原始码。就像Stable Diffusion，用户可自由使用Stable LM，打造量身订做的大语言模型。

Stable LM Alpha版模型参数大小为30亿和70亿，将来Stability.ai还会提供150亿和650亿参数版。尽管和GPT-3的1,750亿参数相比，StableLM小得多，但Stability.ai表示，StableLM是基于比The Pile资料库还大3倍的扩展资料库训练而成，编码和自然语言对话都有不错表现。

The Pile资料库已包括大量书籍、Github知识库、网页、聊天纪录等，还收集医学、物理、数学、计算机科学和哲学学科论文，可为通用大语言模型、跨领域文本生成训练提供不错基准。实际使用时，StableLM与GPT-3的差距并不像纸面参数差异那么明显。

开源版 ChatGPT 要来了？AI 做图神器团队想让每人都能做出大模型 AI与大数据图2张

开源版 ChatGPT 要来了？AI 做图神器团队想让每人都能做出大模型 AI与大数据图3张

开源版 ChatGPT 要来了？AI 做图神器团队想让每人都能做出大模型 AI与大数据图4张

Stability.ai公告展示StableLM处理三个任务的实际表现，写信、写Rap词（问题：写一首深度学习网络与符号人工智慧互呛的史诗级Battle）和写原始码。

Stability.ai还把StableLM托管在HuggingFace社群网站，想抢先体验的读者可到这里看看。但从简单测试看来，StableLM中文程度还不如犹太裔美籍的内地网红郭杰瑞（Gerald S. Kowal），更不用说和ChatGPT这优等生比较，故与它对话时尽量选英语较好。

开源还是闭源之争

和史丹佛大学Alpaca等众多开源大语言模型一样，StableLM给很多开发者用终端或服务器就能客制大语言模型的机会，不用再担心数据外泄。ChatGPT爆红后，AI模型隐私外泄事件层出不穷，不久前三星爆出有多名员工外泄公司机密给ChatGPT，导致三星半导体部门决定自己开发AI工具，避免问题再发生。

开源模型除了高透明度，开发者也更容易开发更具创造力的应用。如可客制StableLM，让它变成不会停的网络作家，或是非常熟悉公司计划的资深程式设计师或文案写手，甚至变成网络星座大师。

开源模型给开发者更多想像空间，但同时也让坏人手段更多更进步。对别有用心者来说，开源大语言模型就是做电信诈骗的神器，可用逼真对话把人们骗得团团转。开源总会伴随争议，这点Stability.ai有预料到。之前因开源Stable Diffusion，Stability.ai已卷入多起涉嫌侵犯艺术家权利的官司，以及用户使用其工具产生色X内容等争议。

CEO Emad Mostaque受访时提到，大模型需要接受更多监督，而不是被公司锁在小黑盒里，因此大模型社群开放性非常重要。Stability.ai坚持开源，是想让更多人使用新技术，启发更多思考。StableLM就是Stability.ai承诺的证明，人人都有专属语言模型的未来或许就要展开。

（本文由爱范儿授权转载；首图来源：Stability.ai）

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

AI AI 绘画 ChatGPT Google gpt

人人都有LLM

开源还是闭源之争

相关文章