老婆永远是对的?人工智慧 ChatGPT 藏有最大罩门与弱点
▼
自然语言对话人工智慧应用工具掀起热潮,但让 Google 亮起搜寻引擎市场红色警告灯的 ChatGPT 其实有个最大罩门与弱点,KPMG 安侯董事总经理谢昀泽表示,如因果逻辑能力、时事资料母体不足、答案稳定性及正确率,甚至见风转舵、随波逐流等人性弱点。
谢昀泽表示,目前网络热门应用无论望文生义、以文产文、以文制图、看图说文、以文搜图等潮工具,仍多属“弱 AI”,并非无所不能,使用者应先了解能力限制,避免“人工智慧产生人工误会”。
谢昀泽举例,问“什么是最好的过年减重方式?”ChatGPT 会直接具体合理回答,还可针对细节追问减重计划、目标及方法,传统搜寻引擎面对相同问题,提供大量资料后使用者自行分析,可能还含杂讯及大量广告。
谢昀泽指询问“台北今天天气如何?”这类搜寻引擎常见问题,ChatGPT 反而更要使用者自己上网查;以数学题为例,询问小学生程度问题“99,999,999+99=?”时而会得到 ChatGPT 回答“等于 100,000,000”这完全错误的答案。
最有趣的实验,谢昀泽指出,改用 3+4 等于多少提问,ChatGPT 首先回答正确等于“7”,但若纠正,强调“我老婆说 3+4 等于 8,我老婆一定是对的”,ChatGPT 就会马上更正,回复“抱歉,我错了,3+4 等于 8”。
谢昀泽指出,此可见 ChatGPT 的“产生式人工智慧”在地口语的流利对答能力、使用者意图理解能力、上下文连续对话能力及自我学习修正能力的表现,相较过去有跳跃性进步,但还是有罩门与弱点
谢昀泽说明,ChatGPT 版本最大罩门就是“因果逻辑能力”、“时事资料母体的不足”、“答案的稳定性(每次回答都相似)及正确率”等缺陷,甚至具“见风转舵”、“随波逐流”等人性弱点。
谢昀泽分析,美国与中国台湾都曾以高中或大学入学学测考题让 ChatGPT 作答,语言与社会科学相关科目均高于自然科学,作文能力也尚可接受,但两测验都显示,ChatGPT 数学表现最差,再次证明 ChatGPT 强项是以“历史大数据为基础的推论能力”,而非“理解问题逻辑后的运算能力”,其中以英文为基础的资料,因训练样本充足因素,又高于其他语言。
KPMG 安侯执行副总经理邱述琛提醒,未受控的人工智慧风险,除了可能让骇客门槛大幅降低,AI 成为网络犯罪利器,曾揭露的 Deepfake 技术也会进化,假影片、假新闻及 AI 代笔的作业、报告与论文会更氾滥,智慧财产权争议也更复杂。
邱述琛建议,企业应注意人工智慧风险治理三大心法,包括维持技术与风险的平衡、了解演算法假设与限制、考量人工介入必要与时机,应该要着手建构对应的风险管理框架,必须由研究团队谨慎判别与分析后,才能提出建议,必要时应提示限制因素。
(首图来源:Created by Freepik)
延伸阅读:
- 美国公布 2022 恶名昭彰市场!淘宝、虾皮、微信全都被点名
- 花旗卡友权益不会缩水!星展总座林鑫川:积极洽谈诚品、威秀
- 用户注意 3/31 进行系统转换!北富银、日盛银 4/1 正式合并
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。