生成式 AI 崛起,与 ChatGPT“聊出新未来”
▼
ChatGPT 的出现,显示原本需高度专业才能完成的任务,在生成式 AI 协助下变成人人可为。金融业必然是深受影响的产业之一,数位金融、财富管理、客户服务、行销销售、风险管理等工作态样与职能都可能改变。
ChatGPT为自然语言处理模型,可与人类对话(Chat)的人工智慧,如平地惊雷异峰突起,倏然攫取世人关注,一时间仿佛所有人都在谈论世界将因ChatGPT改变。不过这几个大写字母到底代表什么意思?
GPT说文解字
GPT是“生成式(Generative)预训练(Pretrained)转换器(Transformer)”的缩写。
“生成式”(G)意指AI可模拟人类创造力与想像力,自动产生新内容。内容表现形式包括文字、声音、图像与影片。如ChatGPT大型语言模型就具备产生文字的能力。Stable Diffusion、DALL‧E、Mid journey、Deep Dream Generator都是图像产生器,只需使用者输入简短描述性字句,就可几秒内产生图片。Amper Music则能产生适合广告或电子游戏等用途的音乐。
“预训练”(P)是指AI执行特定任务前,先接受大量资料训练的非监督式学习。ChatGPT就藉阅读庞大文本,学习使用文字语义和语境及通用语言规则,目标是让AI根据人类输入文字适当回应,并接续前文产生最适合文字,完成初步自然语言处理任务。为了有更精确的语言理解与运用能力,ChatGPT预训练后还需“微调”(Fine-Tuning)。微调会使用人工标记资料,让以预训练为基础的模型执行监督式学习。此外,微调还可针对任务具体需求,调整模型结构和参数,使模型适应特定任务的资料特性,提升AI执行成效。
“转换器”(T)为专有名词,代表深度学习模型之一,最早由Google团队2017年发表的论文〈Attention Is All You Need〉提出,此论文据Google Scholar数据引用超过6万次!论文标题的Attention是Transformer的关键架构,这种深度学习模型构造上可视为“卷积神经网络”(CNN)的推广,功能则是取代传统序列模型如“循环神经网络”(RNN),提升自然语言处理成效。
Transformer萃取文句字与字的关联,据相关性程度赋予重要词语较高权重,以利长文本仍能保留重要资讯。因Transformer更恰当捕捉长距离字词的相关性,并平行化训练,因此有效提高自然语言处理的精确度。Transformer模型用途广泛,不只限于人类产生文本,如近期已有生医企业使用Transformer模型,以处理文字字串方式处理胺基酸链,描述蛋白质折叠方式,更深入了解象征生命之源的蛋白质,以加速新药物开发。
ChatGPT的前世今生
OpenAI是位于美国加州的人工智慧研究实验室,创立于2015年。主业务有人工智慧研究与人工智慧产品开发,研究重点聚焦自然语言处理、机器学习、深度学习等领域。
2017年Google发表Transformer模型后,OpenAI团队开始研究将Transformer模型用于自然语言任务,2018年6月完成GPT-1。2019年初,OpenAI训练出GPT-2,在GPT-1的基础上提高性能,两代模型主要差异在参数量与预训练资料量多寡。GPT-2参数量约GPT-1的12倍,预训练资料量是8倍,训练资料取自社群网站Reddit文章,约800万篇。同年7月,微软宣布投资OpenAI 10亿美元,至2023年累计投资约110亿美元。
2020年5月GPT-3问世,算力与模型规模大幅升级,参数高达1,750亿个(GPT-2为15亿个),预训练资料量到45TB(GTP-2只有40GB),把能从网络取得的论文、书籍、新闻等各种资讯都加入训练资料库。模型将大量非监督式学习和监督式学习成果结合,再次提升自然语言产生和互动能力。之后OpenAI开始微调,以增强模型对话能力。
2022年11月30日OpenAI推出ChatGPT,是基于GPT-3的最佳化(GPT-3.5),旨在与人类更流畅自然的对话。
如何与新兴物种共存?
ChatGPT表现远超过以前傻头傻脑的聊天机器人,实际用过的人应都能体会。然而ChatGPT带来的启示,并不只把机器原本会做但做不好的事做得更好,而是神秘的盒子已打开,但从里面跑出什么东西,我们并不十分清楚。ChatGPT及生成式同类与快速演化的后代,的确是这个世界的新物种。
ChatGPT不仅能以高度成熟的方式产生各种语言,还可按文字指示写程式。程式码即使不是每次都立即可用,但虽不中亦不远,对专业程式设计师等于如虎添翼,可大幅提升工作效率,缩减时间成本。对门外汉而言,可有效降低入行门槛。甚至可说用AI学AI的时代已到来,这是过去未曾发生的情境。
上述功能只显示人机协作即将开启新篇章的例子之一,今后各类专家都有望找到与自己互补的AI,填补对方能力或资源空缺。如作家创作不再是孤独的心灵之旅,可请ChatGPT撰拟初稿,自己再校正修饰。除了必须提供原创故事构想(即使这点也可能大部分由AI代劳),作家其余工作更像编辑。又如投资分析师也不必再指挥助理收集数据,一字一句敲出投资分析报告,交给ChatGPT处理就好了,只是要记得检查结论是否正确。不过当然也有例外,例如投资分析师助理,或文字翻译者,与AI的关系可能是替代性大于互补性。
需搭配人类主观意志判断调整
新技术当然有令人担忧的一面。即使表面上与人类对答如流,ChatGPT也不是真正理解人类语言,终究只是产生看似有意义文句的演算法,本质上可能更接近极为高明的“鹦鹉学舌”。另一方面,ChatGPT容易沾染人类的坏习性,不太愿意承认无知,反倒振振有词提供想像、捏造、空泛答案;即使相同问题有不一样回复,照样面不改色。但目前看来还缺乏有效机制验证ChatGPT产生文本的真实性或正确性。因此ChatGPT使用还有限制,最好不要问它真假难辨的问题,但可请它设计行销文案或规划教学大纲,这类较没有客观标准答案的建议,再搭配人类主观意志调整。
此外,ChatGPT也有价值观或道德相关争议。我们并不知道训练资料库都有什么资讯,如何确信不让资料库偏见以某种方式潜伏于产生内容?又如作家要求ChatGPT协助撰稿时,会不会无意抄袭他人作品(因资料库有),侵犯他人着作权而不自知?虽然ChatGPT经微调会拒绝回答违反善良风俗的问题,但只要拐个弯再问一次,还是可能套出答案。如ChatGPT虽不肯传授如何诈骗,可是改成问如何防范诈骗,说明诈骗方法或举几个诈骗案例,它就欣然接受,且回答非常仔细。
无论如何,ChatGPT出现表示世界不知不觉又产生剧变,工作传统界限被迫重新定义。原本需高度专业才能完成的任务,生成式AI协助下变成人人可为。一些苦学有成的技能失去价值,被新技能取而代之。金融业必然是深受影响的产业之一,至少数位金融、财富管理、客户服务、行销销售、风险管理及其他许多业务工作模式与职能都极有可能改变。现在该是时候好好问自己,生成式AI会为你所在机构与工作带来什么变化;又会以什么形式整合至职场与生活,以及AI代表什么意义。
(作者:张凯君;本文由 中国台湾银行家 授权转载;首图来源:shutterstock)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。