苹果前员工打造、入选 YC 的 Intrinsic,要用大型语言模型解决 Facebook 都做不好的事

苹果前员工打造、入选 YC 的 Intrinsic,要用大型语言模型解决 Facebook 都做不好的事

社群平台上的内容都是由使用者制作(UGC),平台该不该为这些内容负责?

不管是仇恨性言论、色X内容、假新闻等,尽管平台方都强调透过AI协助审查,仍有许多漏网之鱼或误删内容的情况发生。

生成式AI背后的基础大型语言模型(LLM),有没有可能是解方?

曾在苹果(Apple)担任诈欺工程和演算法团队工程师的Karine Mellata和Michael Lin,在 2023 年创立Intrinsic正在尝试这个可能性,并入选国际知名加速器Y Combinator(YC)。

苹果前员工打造、入选 YC 的 Intrinsic,要用大型语言模型解决 Facebook 都做不好的事 AI与大数据 图2张

▲ 苹果前员工Karine Mellata和Michael Lin,解决企业在内容审查上花费的时间和人力成本,创办Intrinsic。(Source:Intrinsic)

AI成为审查员的救命稻草?

社群媒体大老Facebook曾在全球雇用几万名内容审查员,以人工的方式筛选平台贴文内容。

但人工审查不仅效率低、成本费用高,聘用的审查人员还需要承受巨大的精神压力,例如经常目睹到暴力、血腥或是色X等影像,而每则贴文也只有几秒钟的时间让他们决定是否符合发布规定。长时间来说,对这些审查员而言也是严重的工伤。

直到2017年,Facebook创办人祖克柏(Mark Zuckerberg)开始让AI过滤平台内容,自动检视每则贴文和言论是否违反平台规定。利用AI审查内容无疑加快分析速度,但避免不了误判或是遗漏的情况。

时至今日,不论是Facebook或是各媒体平台的AI分析功能仍不够全面,例如AI只能侦测出38%的敏感或是仇恨言论,同时又不断有新的违规发文出现在平台上,AI需要更多详细的训练才能做出更精确的判断。就连Facebook这么大的企业都难以做到完美了,这题该怎么办?

Intrinsic运用大量参数优势解决“语意判读”问题

Intrinsic认为还是得靠AI。虽然他们不是第一个利用AI做内容审查工具的团队,但可能是第一个把大型语言模型纳入规划的团队。

现在的AI审查大多采用NLP(自然语意处理)的技术,然而受限于喂给AI的资料有限,AI可能会不认得相同语意的关键字,例如“高清”、“4K”、“高画质”,AI可能只会认得“高画质”这个关键字。

但是大型语言模型可以从数据中找出关联和语意,能够以接近人类语言的逻辑处理言论审查,这也是Intrinsic所看好的。

Intrinsic用LLM审查除了更方便审核虚拟帐号、暴力言论等违反网络安全内容之外,也让企业依据需求画出审查的范围。例如只要告诉LLM不希望在网站上出现关于哪一类腥膻色的图片或是字眼,Intrinsic就会根据相同语意的字眼和讯息加以审核。

企业只需将Intrinsic的检测系统嵌入自家的内容审查系统中,便会自动分析社群平台中的正负面内容,或是检测每位用户的真实性,若检测出诈骗或骚扰讯息,会立即通知该企业的审查团队调查该名使用者,利用AI加速内容审查流程。

不可忽视AI审查的未来隐忧

目前Intrinsic于今(2024)年筹集310万美元(约新台币9,600万元)的资金,主要投资者包括Urban Innovation Fund、Y Combinator和645 Ventures等知名创投。创办人Karine Mellata表示,计划将这笔资金运用在继续研发大型语言模型,将审查内容扩大到影片和声音内容。

虽然LLM帮助加快内容审查的效率,但仍不可忽视AI可能随之而来的问题。AI无法受到监控,因此像是训练AI的共用数据,或许也包含许多使用者的个人资讯,容易造成资料外泄的情况发生,让AI把持大众的网络言论自由是否真能成为解方,仍有待商榷。

  • Connect your Trust & Safety team with world-class tooling
  • Intrinsic: Pioneering trust and security infrastructure for the modern digital landscape with 3 million investments and AI
  • Y Combinator-backed Intrinsic is building infrastructure for trust and safety teams
  • LLM是什么?跟AI的关联为何?大型语言模型要面对什么挑战?一文看懂
  • AI 维护社群和平?脸书办记者会解释 AI 如何左右内容审查
  • Intrinsic, une rvolution dans la modration de contenu?

(本文由 创业小聚 授权转载;首图来源:shutterstock)

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。