参考社群网站方法,美企业采用人工审查方式监督生成式 AI 产品成果

参考社群网站方法,美企业采用人工审查方式监督生成式 AI 产品成果

由于生成式 AI 出现突破性发展,许多企业都导入这项技术产生许多新产品或服务,但基于大数据的训练过程很可能遭有心人士以假资讯污染,一美国税务软件公司参考社群网站方式,以人工审查监控。

目前大多社群网站,包括 X、Instagram、Facebook 和 TikTok 等,皆有专责团队负责审查网站上用户贴文或广告是否有违反使用规范,而这种做法对于目前越来越热门的生成式 AI 产品,也成为企业用来监管 AI 不会产出错误或违法的内容。

由于生成式 AI 在训练过程需要采用大量的网络内容,有心人士很容易训练期间塞入大量误导性或错误讯息,就有很高机率让 AI 产出有害内容,为了降低 AI 产品出错机率,采用人工审查也成为现阶段比较有效的因应方式。

以税务计算软件着名的美国企业 Intuit 为例,为旗下主力税额计算软件 TurboTax 推出生成式 AI 小助手 Intuit Assist,可在用户透过 TurboTax 规划和计算个人或企业年度缴税计划期间提供各种财务规划建议。

虽然 Intuit Assist 目前仅为试用阶段,仅开放给部分用户,但这项基于大量语言模型资料训练而来的生成式 AI 产品,若产出错误或有害的建议,让用户因此做出违法或是危害用户利益的决定,对企业会有严重影响。

因此 Intuit 资安长泰森(Atticus Tysen)表示,将成立以八名全职人员组成的监督小组,随时进入 Intuit Assist 的语言模型检查,降低模型出现错误或有害内容的机率。

目前 Intuit Assit 程式已有内建检测功能,若语言模型出现可能令人反感的内容,或发现有心人士进行指令注入攻击(Prompt Injection Attack)行为,就会标示出来并通知监督小组,再以人力审查或处置。

除了 Intuit,Open AI 和母公司微软推出 Azure AI 产品,也是采人工审查,避免语言模型出现有害或错误内容,毕竟对生成式 AI 产品来说,若企业无法有效检测问题,商誉、法律和营收冲击都无法承受。

  • Companies Look to Human Moderators to Keep AI Apps in Line

(首图来源:Unsplash)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。