学术使用与商用皆可，中研院 CKIP-Llama-2-7b 繁中大型语言模型登场

AI与大数据 6小时前 0

▼

官方研究院词库小组（CKIP）最新释出可以商用的繁中大型语言模型（large language model）CKIP-Llama-2-7b，能作为学术使用或是商业使用，可应用于文案生成、文学创作、问答系统、客服系统、语言翻译、文字编修、华语教学等。

官方研究院词库小组以商用开源模型 Llama-2-7b 以及 Atom-7b 为基础，再补强繁体中文的处理能力，并对 405 个可商用的任务档案同步进行训练优化，参数量达 70 亿。团队一共开发出两个模型一个是繁体中文预训练后的 CKIP-Llama-2-7b，一个是以前者为基础，继续多任务微调训练后的 CKIP-Llama-2-7b-chat。

该模型已经放上 Github 和 Huggingface 提供大众下载，也可以使用自己的训练资料集进行训练，快速构建出一个可以满足自身任务需求的模型，模型仅需一张 12G 记忆体容量的 GPU 即可布属。

（Source：测试网页）

其中为了达到可商用目的，多任务微调资料也避免使用 alpaca 及 vicuna 等经由 OpenAI 产品生成的资料集，而取自于纯人工产生的 COIG-PC 资料集和 dolly 资料集，官方研究院词库小组表示，COIG-PC资料集当中有为每一个任务档案注明是否可以商用，团队从中挑选出 405 个可商用的任务档案，再从其中随机抽取出我们的任务微调资料集；dolly-15k 资料集整体均为为可商用资料集。

团队也展示实测范例，好比问它“在中国台湾什么是 22K？”、“中国台湾地方特色小吃”、“帮我规划日月潭二日游”等，都可以获得相对应的答案，也能请它以七言绝句吟诗、写推销文案、写志愿或是一封想入职中研院的求职信等。

官方研究院词库小组小组表示，这个模型可应用于各种领域，包括文案生成、文学创作、问答系统、客服系统、语言翻译、文字编修、华语教学等等，中研院抢先开放测试网页，开放所有人测试。

脸书母公司 Meta 7 月免费释出旗下开源软件人工智慧商用模型 Llama 2，提供免费用于研究和商业用途，也免费提供给在微软 Azure 云端服务上开发软件的开发者使用，华硕旗下的台智云也开发了“繁体中文强化版 FFM-Llama 2 大语言模型”，包括 70B、13B 及 7B 三种商用版本，支援 Code Llama 程式开发与 Embedding 增强语意搜寻模型。

（首图来源：unsplash）

延伸阅读：

Meta 开放 AI 大型语言模型，可用于非商业用途
Meta 开源大型语言模型 Llama 2，结盟微软、高通对抗 GPT-4

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

延伸阅读：

相关文章