开源版 ChatGPT 要来了?AI 做图神器团队想让每人都能做出大模型

开源版 ChatGPT 要来了?AI 做图神器团队想让每人都能做出大模型

Stability.ai 开源模型 Stable Diffusion 可说是现在最主流也最重要的 AI 绘画模型。基于开源的 Stable Diffusion,开发者社群创作出许多有趣外挂和模型,如控制形状的 Control Net 等,相关专案超过千个。

现在这家热中开源的AI公司又想搞事了──发表类似ChatGPT的开源大语言模型。

人人都有LLM

2023年到目前可说是大语言模型年,几个月以来,几乎每周都有新大语言模型面世。大模型、小模型、文本生成、多模组、闭源、开源……现在是大语言模型的春天,各家百花齐放。这热闹不仅属微软、Google、百度、阿里等科技公司,也属于所有与AI相关的科技公司。和现在大模型相比,Stability.ai的StableLM大语言模型有什么特别?

Stability.ai介绍,StableLM是开源透明模型,允许研究人员和开发者自由检查、使用和修改原始码。就像Stable Diffusion,用户可自由使用Stable LM,打造量身订做的大语言模型。

Stable LM Alpha版模型参数大小为30亿和70亿,将来Stability.ai还会提供150亿和650亿参数版。尽管和GPT-3的1,750亿参数相比,StableLM小得多,但Stability.ai表示,StableLM是基于比The Pile资料库还大3倍的扩展资料库训练而成,编码和自然语言对话都有不错表现。

The Pile资料库已包括大量书籍、Github知识库、网页、聊天纪录等,还收集医学、物理、数学、计算机科学和哲学学科论文,可为通用大语言模型、跨领域文本生成训练提供不错基准。实际使用时,StableLM与GPT-3的差距并不像纸面参数差异那么明显。

开源版 ChatGPT 要来了?AI 做图神器团队想让每人都能做出大模型 AI与大数据 图2张
开源版 ChatGPT 要来了?AI 做图神器团队想让每人都能做出大模型 AI与大数据 图3张
开源版 ChatGPT 要来了?AI 做图神器团队想让每人都能做出大模型 AI与大数据 图4张

Stability.ai公告展示StableLM处理三个任务的实际表现,写信、写Rap词(问题:写一首深度学习网络与符号人工智慧互呛的史诗级Battle)和写原始码。

Stability.ai还把StableLM托管在HuggingFace社群网站,想抢先体验的读者可到这里看看。但从简单测试看来,StableLM中文程度还不如犹太裔美籍的内地网红郭杰瑞(Gerald S. Kowal),更不用说和ChatGPT这优等生比较,故与它对话时尽量选英语较好。

开源还是闭源之争

和史丹佛大学Alpaca等众多开源大语言模型一样,StableLM给很多开发者用终端或服务器就能客制大语言模型的机会,不用再担心数据外泄。ChatGPT爆红后,AI模型隐私外泄事件层出不穷,不久前三星爆出有多名员工外泄公司机密给ChatGPT,导致三星半导体部门决定自己开发AI工具,避免问题再发生。

开源模型除了高透明度,开发者也更容易开发更具创造力的应用。如可客制StableLM,让它变成不会停的网络作家,或是非常熟悉公司计划的资深程式设计师或文案写手,甚至变成网络星座大师。

开源模型给开发者更多想像空间,但同时也让坏人手段更多更进步。对别有用心者来说,开源大语言模型就是做电信诈骗的神器,可用逼真对话把人们骗得团团转。开源总会伴随争议,这点Stability.ai有预料到。之前因开源Stable Diffusion,Stability.ai已卷入多起涉嫌侵犯艺术家权利的官司,以及用户使用其工具产生色X内容等争议。

CEO Emad Mostaque受访时提到,大模型需要接受更多监督,而不是被公司锁在小黑盒里,因此大模型社群开放性非常重要。Stability.ai坚持开源,是想让更多人使用新技术,启发更多思考。StableLM就是Stability.ai承诺的证明,人人都有专属语言模型的未来或许就要展开。

(本文由 爱范儿 授权转载;首图来源:Stability.ai)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。