AI Agent 的任务,是让人类一天只需工作四小时
▼
2024 年满城尽带 AI Agent。上个月还说在做 AI Copilot 的人,这个月就改做 Agent 了,现在流行 AI 骇客马拉松,一场至少能看见几十个“AI Agent”。
大语言模型爆发这年,我们在“概念陷阱”里鬼打墙,大谈各种新名词:Agent、Copilot、RAG、Reasoning、Grounded、Alignment……说实话有点腻了,嘴边不常挂着这些词,就不能做AI了?
如“AI Agent”,做了自动写IG发文的GPTs,说这是写作Agent;做基于大语言模型的RPG角色模拟器,说是游戏开发Agent……这时有人说:都是AI辅助工具,充其量只是Copilot(副驾驶),你看史丹佛大学和Google搞的“史丹佛小镇”,25个AI互相沟通和协作,那才是真正的AI Agent。究竟谁说的对?什么才是AI Agent?这其实是现状:当下讨论AI概念,人们却以缺乏共识的定义为前提,所以认知从没“对齐”(align)过。
很多人拿“AI Agent”当成大语言模型时代的新名词讨论,殊不知Agent是个骨灰级AI概念。Agent第一次成为AI术语,是1995年出版的经典AI教科书《人工智慧:现代方法》(Artificial Intelligence: A Modern Approach),定义AI是:“智慧代理的研究和设计”(study and design of intelligent agents),看来将Agent当成AI发展的终极目标,至少也是快30年前的事了,折射出人类发展AI的初衷,即寻找人类所有行为的“代理人”。
不少人还忽略Agent其实也是经济学和组织行为学概念,现代经济社会充斥各种Agent,如公关代理公司(PR Agency)、旅行社(Travel Agency)等,都具机构代表某方行动和交易的意思。AI定义的Agent,意义与经济学和组织行为学很接近,即AI为一人或组织代表,进行某种特定行为和交易,降低一人或组织的工作复杂程度,减少工作量和沟通成本。
AI真正成为Agent就是靠大语言模型。AI Agent这古老概念2023年翻红并不是巧合,OpenAI 安全团队负责人Lilian Weng知名文章〈LLM Powered Autonomous Agents〉,普遍视做OpenAI对AI Agent的官方定义,文章将Agent定义为大语言模型(LLM)、记忆(Memory)、任务规划(Planning Skills)和工具使用(Tool Use)集合,LLM是大脑,记忆、任务规划和工具使用是Agent三个核心元件。值得注意的是,文章强调Agent自动调取外部API工具,自动子目标分解任务,自动建立思维链(CoT)、自我批评和自我回馈能力,都指向文章标题的关键词“autonomous”,即Agent自动化。
AI革命普遍视作“第四次工业革命”,前三次是19世纪初蒸汽革命、19世纪末的电力革命、20世纪中叶的资讯技术革命。贯穿前三次人类工业革命的关键词当属“自动化”(automation)。蒸汽机和电力革命实现工业生产体力劳动的自动化,提高生产效率。资讯技术革命提高工业生产自动化程度同时,也可取代人类部分脑力劳动。第四次工业革命的AI革命,一方面将工业生产自动化执行更彻底(如机器人和满是感测器的无人工厂),另一方面前所未有开启脑力劳动自动化。脑力劳动自动化的载体,就是AI Agent。
从这个意义,什么是AI Agent争论有点无聊。史丹佛小镇是基于论文的先锋实验,当作评判AI应用是否Agent的座标,无助AI Agent提高智力密集型效率。笔者暴论:AI Agent本质就是automation of human action(人类行为自动化),只要它不是人类要求的完成任务,就像ChatGPT对话框输入prompt、启动Office 365的Copilot完成工作,而具备一定程度完成任务的自主性甚至不完全可控,就是AI Agent。
现在较尴尬的是:你可能读过不少AI Agent论文和社群讨论,却没真的用过顺手的Agent,这恐怕是Agent这新物种注定要经过的阶段。人们常提到AI Agent典范是接入GPT能力的AutoGPT,不过无论美国或内地,已有更好用AI Agent的雏形。
第一个是ChatGPT新升级付费版ChatGPT Team,提供小型企业用个人ChatGPT帐号协作的“私域空间”,ChatGPT Team用户数据不会用来反向训练GPT模型,使用者还可创建企业GPTs,让这些GPTs合作。笔者觉得ChatGPT Team比GPT Store更重要也更实用,GPT Store太乱,多数GPTs品质粗糙,对话框指令帮忙做什么,且不能用API。但私密环境ChatGPT Team,GPTs互相调用介面、合作顺利多了。ChatGPT Team是ChatGPT走向AI Agent的第一步,毕竟ChatGPT已有15万企业客户。
第二个是内地智谱AI的GLM模型智慧体(GLMs),是内地清华大学体系出身最像OpenAI的公司,刚推出的GLM-4一切向GPT-4看齐,许多评测基准达GPT-4 85%以上。GLMs是GLM-4的副产品,也是GLM-4模型能力的外溢。GLM-4的All Tools支援GLM-4依使用者需求决定是用绘图、搜寻、制表还是程式设计解决问题,本身就具AI Agent属性。与Open AI只追求通用性不同,智谱AI对金融、医疗和教育等都有系列客制服务,积累不少to B客户基础和业界know-how,让客户基于GLM-4部署GLMs智慧体更合理也更容易。
第三个也为内地清华大学背景的“面壁智慧”:有自己的“史丹佛小镇”,基于面壁智慧的ChatDev框架,但此小镇不是虚拟社会,而是AI版软件公司,不同AI智慧体设为工程师、产品经理、测试工程师和设计师等角色,可互相合作,还能站在自己立场互相博弈,就与人类上班会发生的事一样。面壁智慧ChatDev框架支援开发者搭建自己的AI Agent,结合单体和群体智慧,让AI Agent成为每个员工都能用的“逃避”很多狗屎工作的自动化工具。顺提ChatDev框架成形并不比史丹佛小镇论文发表晚,最大启示是原生AI应用开发可能性:AI Agent实现AI应用开发自动化。
第四、五为内地钉钉和飞书“智慧体”。AI Agent本质更接近产品而非技术,如果认为AI Agent是生产力工具,就不能忽略钉钉和飞书的上亿使用者,百万政企组织,大量文件、会议摘要、沟通记录、表格和自建工具,都让钉钉“智慧助理”和飞书“智能伙伴”更容易化身成每个使用者的助理,部分自动完成例行琐事,如工作总结、会议摘要、报帐和出差流程、关注回馈,甚至代理吵架。身为使用者,笔者得说钉钉智慧助理和飞书智能伙伴离好用还差得很远,恐怕是通义大模型和云雀大模型的锅,但场景丰富、数据真实、用户数量大,钉钉“智慧助理”和飞书“智能伙伴”更容易被用。Agent也是在使用过程有更佳理解能力,模型进步后,钉钉和飞书Agent化就会往前大步走。笔者再下暴论:钉钉和飞书会成为内地AI Agent的重要产品。
好用和好玩选一,笔者坚信对AI Agent好用比好玩重要,因首先是生产力工具,AI纸片男女友也有理解能力和情绪价值,但可叫成“智慧体”或“智慧玩偶”,却不是“智慧代理”,因不具代理人类完成某项任务或使命的功能。所以AI Agent翻成“智慧体”不适合,它就是“智慧代理”,“代理”属性是AI Agent的经济学和组织行为学,也是推动脑力劳动自动化的本质。
今年CES史丹佛大学知名AI学者李飞飞提出一个重要观点:应该确定AI Agent取代的是人类“任务”而不是“工作”。达沃斯论坛时,OpenAI CEO Sam Altman面对“AI让人失业”这老生常谈诘问时,只说:AI取代人们工作的方式,而不是工作本身。
笔者同意李飞飞和Sam Altman的观点,脑力劳动者的工作是由每个具体关键任务组成,但不是工作的全部,目标设定、创造性、资源取得和分配、设定更高目标、规划不同任务、判断力、说服力与表现力……我们工作有太多更有意义的元素,将流程、事务性和庶务性任务交给Agent,少写几行常规代码,少发几封吵架信,少做机器操作表格,少调几次PPT格式,少复制黏上,少亲自填写和审查出差和报帐流程,人类工作应该更愉快,也更有创意。
当然AI Agent普及,也许会让某些“白领工人”无所适从甚至失去工作,但也会提高很多职位,甚至基层聪明人的创造性、格局感、整体感和生产力,提高工作效率,创造更高生产力同时,更重要的是减少工时。
八小时工作制成为通用标准已是百年前的事了,人们之所以每天工作八小时,是工人抗争的结果,也是电力工业革命后生产力大爆发的产物。在更高生产效率面前,人们有底气争取更少工时、更高工资和更多学习、休闲、旅游消费时间。但计算机革命后,人类生产效率又前所未有地提高,为什么工时却没有减少,反而某些号称最高智力密集的科技和网络公司甚至更长?这里面一定出了问题。
笔者再来暴论:将来衡量AI Agent智慧化程度如何,可看是否让人类每天只需工作四小时,重复性、流程性、条件反射式性、经验主义可奏效、强化学习可理解,甚至表演性质工作,统统交给AI Agent:可能是钉钉和飞书,可能是面壁智慧的工作坊,也可能是GLM和GPT企业版,反正笔者只要结果,因真的只想每天工作四小时。
不久前和钉钉总裁叶军聊天,笔者问这玩意能让我们每天只上班四小时吗?他说:如果可能每天只需工作一小时。事后笔者觉得叶军夸张了,不过他还说AI Agent能让更多人当自己老板,笔者倒是同意这点。
(本文由 品玩 授权转载;首图来源:shutterstock)
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。