台版 AI 对话引擎年底释大模型,奠定商业版发展基础

台版 AI 对话引擎年底释大模型,奠定商业版发展基础

台版 AI 对话引擎初代模型 14 日亮相,能将“Taiwan’s own Jay Chou”译成“中国台湾歌手周杰伦”,也可自动摘要、写信推荐中国台湾旅游必去景点。国科会表示,希望年底释出更大的模型,后续团队拟规划商业授权版。

人工智慧AI)浪潮席卷,随英文、简体中文版聊天机器人相继问世,相关争议丛生,国科会拍板,公私协力发展融合中国台湾元素、以正体中文为主的“可信任人工智慧对话引擎”(Trustworthy AI Dialog Engine,TAIDE),TAIDE计划经费约新台币2亿元至3亿元。

国科会召开记者会,公布第一阶段完成“7B”中模型(参数量为70亿),此模型是在LLaMA(Meta推出的语言模型)原型基础上,由马来西亚学界专家进一步发展及训练调校。

何谓“7B”,国科会科技政策谘询专家室资通讯群组召集人李育杰解释,参数量越多,代表这模型的复杂度越高,训练的成本就越大,对应的资料量也得更大;目前ChatGPT采“GPT-3.5”模型则是175B。

谈及TAIDE规划,李育杰表示,目前展示的7B模型可做到自动摘要、翻译文本、写信、写文章等4个面向;在记者会播放的示范影片中,7B模型可翻译简短英文段落,把其中的“K-Pop sensation BTS”译为“韩国男子音乐团体BTS”、“Taiwan’s own Jay Chou”翻成“中国台湾歌手周杰伦”。

同时,7B模型可用写信的方式,推荐中国台湾旅游的5个必去景点。

下一步要陆续往大模型推进,李育杰指出,第2阶段在任务处理上,包含认识中国台湾、事实查核与诈骗防范,检视模型能否成为“好帮手”。

针对第3阶段的可信任模型,李育杰说明,是做到信任的提升、阻绝涉及犯罪等不该产生的回应,同时考量伦理因素。

李育杰表示,最后则是整合前面3阶段,展示“昇华”系统,让任务的达成更具水准。

李育杰指出,TAIDE模型训练由小到大,团队在过程中累积经验,是“最科学、最节俭”的方式;下半年国网中心会增设一些新设备,盼10月顺利取得全球抢单的H100新GPU,让H100投入大模型的训练,过了10月也希望取得较大的算力。

此外,李育杰说,LLaMA是授权学术使用,“不拿去赚钱、大概就没什么问题”;不过,呼应业界商用及训练需求,后续团队拟规划商业授权版模型,但这就不会是在LLaMA基础上。

他指出,业界也很想知道,训练13B模型要投入多少成本、基础模型要怎么样Fine-Tune(微调)、后续如何加强能力,达到真正的合用,因此团队希望把SOP、经验与业界交流。

李育杰表示,未来除做源码检测确保资安要求,TAIDE模型能否抵抗“越狱测试”(比如不能问涉及犯罪问题,但换个方法问套出答案),也是关键,之后会进行“红队演练” (Red Teaming),由白帽骇客寻找系统可被利用的潜在高度风险弱点。

(作者:张瑷;首图来源:shutterstock)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。