学术界超夯!研究人员最爱用《哈利波特》衡量 AI 技术理解成效

学术界超夯!研究人员最爱用《哈利波特》衡量 AI 技术理解成效

J.K. 罗琳的《哈利波特》在全球造成轰动,现在学术界正使用这套畅销书来测试生成式 AI 系统如何学习和提供资讯。

根据彭博社报道,越来越多研究人员利用《哈利波特》来试验生成式 AI 技术,因为该系列影响力深远,书中又有广泛的语言数据和复杂的文字游戏。透过回顾《哈利波特》一系列研究和学术论文,能了解 AI 前沿研究,以及该技术面临的最棘手问题。

最近在论文〈谁是哈利波特?LLMs 近似反学习〉(Who’s Harry Potter? Approximate Unlearning in LLMs)中揭露大型语言模型(LLM)选择性遗忘讯息的新技术。由于 AI 聊天机器人建立在大量线上数据上,可能包括受版权保护的资料和有误内容,导致 AI 公司面临侵权诉讼或大众监督问题。

因此这篇论文作者、微软 Azure 技术长 Mark Russinovich 和 Ronen Eldan 已证明,可对 AI 模型进行修改或编辑,删除任何有关《哈利波特》一书中存在的知识,包括人物和情节,而不会影响 AI 系统的整体决策和分析能力。

Russinovich 和 Eldan 表示,之所以选择《哈利波特》是因为他们耳熟能详。Russinovich 表示,“研究界会更容易评估我们的技术所产生的模型,并亲自确认内容确实已经被‘消除学习’”。

另项研究中,西雅图华盛顿大学、加州大学柏克莱分校和艾伦研究所的研究人员开发新语言模型“Silo”,可删除数据以降低法律风险。不过他们在稍早发布的论文中提到,如果只在版权过期书籍或官方档案等低风险文本上进行训练,模型性能会明显下降。

为深入研究,研究人员利用《哈利波特》来研究单篇文本是否影响 AI 系统性能。他们创建两个资料储存库,即网站和文档的集合。第一个资料储存库包括除了《哈利波特》第一部以外所有已出版书籍;另个资料库包括除第二部以外的所有系列书籍,以此类推。

研究人员发现衡量 AI 模型的准确性标准时,当《哈利波特》从资料储存库中移除,困惑度会变更加严重。

在开放存取的科学研究资料库 arXiv 上,与《哈利波特》有关的最新论文包括〈霍格华兹魔药开发的机器学习〉(Machine learning for potion development at Hogwarts)、〈大型语言模型与《哈利波特》的相遇〉(Large Language Models Meet Harry Potter)和〈用基于 Transformer 模型的人工智慧检测奇幻文学中的咒语〉(Detecting Spells in Fantasy Literature with a Transformer Based Artificial Intelligence)。

AI 研究引用《哈利波特》至少已有十年之久,但随着学术界和技术专家将重点放在能处理自然语言并给出相关答案的 AI 工具上,情况变得越来越普遍;即使不是研究的核心内容,《哈利波特》也是研究人员最喜欢参考的文学作品。

  • Researchers Have a Magic Tool to Understand AI: Harry Potter

(首图来源:pixabay)

延伸阅读:

  • 传联电 12 奈米技转英特尔!大摩维持联电正面评价,喊目标价 55 元
  • 三星 Micro LED 业务改三星半导体接手,SDC 负责 Micro OLED 技术

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。