学术使用与商用皆可,中研院 CKIP-Llama-2-7b 繁中大型语言模型登场
▼
官方研究院词库小组(CKIP)最新释出可以商用的繁中大型语言模型(large language model)CKIP-Llama-2-7b,能作为学术使用或是商业使用,可应用于文案生成、文学创作、问答系统、客服系统、语言翻译、文字编修、华语教学等。
官方研究院词库小组以商用开源模型 Llama-2-7b 以及 Atom-7b 为基础,再补强繁体中文的处理能力,并对 405 个可商用的任务档案同步进行训练优化,参数量达 70 亿。团队一共开发出两个模型一个是繁体中文预训练后的 CKIP-Llama-2-7b,一个是以前者为基础,继续多任务微调训练后的 CKIP-Llama-2-7b-chat。
该模型已经放上 Github 和 Huggingface 提供大众下载,也可以使用自己的训练资料集进行训练,快速构建出一个可以满足自身任务需求的模型,模型仅需一张 12G 记忆体容量的 GPU 即可布属。
(Source:测试网页)
其中为了达到可商用目的,多任务微调资料也避免使用 alpaca 及 vicuna 等经由 OpenAI 产品生成的资料集,而取自于纯人工产生的 COIG-PC 资料集和 dolly 资料集,官方研究院词库小组表示,COIG-PC资料集当中有为每一个任务档案注明是否可以商用,团队从中挑选出 405 个可商用的任务档案,再从其中随机抽取出我们的任务微调资料集;dolly-15k 资料集整体均为为可商用资料集。
团队也展示实测范例,好比问它“在中国台湾什么是 22K?”、“中国台湾地方特色小吃”、“帮我规划日月潭二日游”等,都可以获得相对应的答案,也能请它以七言绝句吟诗、写推销文案、写志愿或是一封想入职中研院的求职信等。
官方研究院词库小组小组表示,这个模型可应用于各种领域,包括文案生成、文学创作、问答系统、客服系统、语言翻译、文字编修、华语教学等等,中研院抢先开放测试网页,开放所有人测试。
脸书母公司 Meta 7 月免费释出旗下开源软件人工智慧商用模型 Llama 2,提供免费用于研究和商业用途,也免费提供给在微软 Azure 云端服务上开发软件的开发者使用,华硕旗下的台智云也开发了“繁体中文强化版 FFM-Llama 2 大语言模型”,包括 70B、13B 及 7B 三种商用版本,支援 Code Llama 程式开发与 Embedding 增强语意搜寻模型。
(首图来源:unsplash)
延伸阅读:
- Meta 开放 AI 大型语言模型,可用于非商业用途
- Meta 开源大型语言模型 Llama 2,结盟微软、高通对抗 GPT-4
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。