AI Agent 的任务，是让人类一天只需工作四小时

AI与大数据 1小时前 0

▼

2024 年满城尽带 AI Agent。上个月还说在做 AI Copilot 的人，这个月就改做 Agent 了，现在流行 AI 骇客马拉松，一场至少能看见几十个“AI Agent”。

大语言模型爆发这年，我们在“概念陷阱”里鬼打墙，大谈各种新名词：Agent、Copilot、RAG、Reasoning、Grounded、Alignment……说实话有点腻了，嘴边不常挂着这些词，就不能做AI了？

如“AI Agent”，做了自动写IG发文的GPTs，说这是写作Agent；做基于大语言模型的RPG角色模拟器，说是游戏开发Agent……这时有人说：都是AI辅助工具，充其量只是Copilot（副驾驶），你看史丹佛大学和Google搞的“史丹佛小镇”，25个AI互相沟通和协作，那才是真正的AI Agent。究竟谁说的对？什么才是AI Agent？这其实是现状：当下讨论AI概念，人们却以缺乏共识的定义为前提，所以认知从没“对齐”（align）过。

很多人拿“AI Agent”当成大语言模型时代的新名词讨论，殊不知Agent是个骨灰级AI概念。Agent第一次成为AI术语，是1995年出版的经典AI教科书《人工智慧：现代方法》（Artificial Intelligence: A Modern Approach），定义AI是：“智慧代理的研究和设计”（study and design of intelligent agents），看来将Agent当成AI发展的终极目标，至少也是快30年前的事了，折射出人类发展AI的初衷，即寻找人类所有行为的“代理人”。

不少人还忽略Agent其实也是经济学和组织行为学概念，现代经济社会充斥各种Agent，如公关代理公司（PR Agency）、旅行社（Travel Agency）等，都具机构代表某方行动和交易的意思。AI定义的Agent，意义与经济学和组织行为学很接近，即AI为一人或组织代表，进行某种特定行为和交易，降低一人或组织的工作复杂程度，减少工作量和沟通成本。

AI真正成为Agent就是靠大语言模型。AI Agent这古老概念2023年翻红并不是巧合，OpenAI 安全团队负责人Lilian Weng知名文章〈LLM Powered Autonomous Agents〉，普遍视做OpenAI对AI Agent的官方定义，文章将Agent定义为大语言模型（LLM）、记忆（Memory）、任务规划（Planning Skills）和工具使用（Tool Use）集合，LLM是大脑，记忆、任务规划和工具使用是Agent三个核心元件。值得注意的是，文章强调Agent自动调取外部API工具，自动子目标分解任务，自动建立思维链（CoT）、自我批评和自我回馈能力，都指向文章标题的关键词“autonomous”，即Agent自动化。

AI革命普遍视作“第四次工业革命”，前三次是19世纪初蒸汽革命、19世纪末的电力革命、20世纪中叶的资讯技术革命。贯穿前三次人类工业革命的关键词当属“自动化”（automation）。蒸汽机和电力革命实现工业生产体力劳动的自动化，提高生产效率。资讯技术革命提高工业生产自动化程度同时，也可取代人类部分脑力劳动。第四次工业革命的AI革命，一方面将工业生产自动化执行更彻底（如机器人和满是感测器的无人工厂），另一方面前所未有开启脑力劳动自动化。脑力劳动自动化的载体，就是AI Agent。

从这个意义，什么是AI Agent争论有点无聊。史丹佛小镇是基于论文的先锋实验，当作评判AI应用是否Agent的座标，无助AI Agent提高智力密集型效率。笔者暴论：AI Agent本质就是automation of human action（人类行为自动化），只要它不是人类要求的完成任务，就像ChatGPT对话框输入prompt、启动Office 365的Copilot完成工作，而具备一定程度完成任务的自主性甚至不完全可控，就是AI Agent。

现在较尴尬的是：你可能读过不少AI Agent论文和社群讨论，却没真的用过顺手的Agent，这恐怕是Agent这新物种注定要经过的阶段。人们常提到AI Agent典范是接入GPT能力的AutoGPT，不过无论美国或内地，已有更好用AI Agent的雏形。

第一个是ChatGPT新升级付费版ChatGPT Team，提供小型企业用个人ChatGPT帐号协作的“私域空间”，ChatGPT Team用户数据不会用来反向训练GPT模型，使用者还可创建企业GPTs，让这些GPTs合作。笔者觉得ChatGPT Team比GPT Store更重要也更实用，GPT Store太乱，多数GPTs品质粗糙，对话框指令帮忙做什么，且不能用API。但私密环境ChatGPT Team，GPTs互相调用介面、合作顺利多了。ChatGPT Team是ChatGPT走向AI Agent的第一步，毕竟ChatGPT已有15万企业客户。

第二个是内地智谱AI的GLM模型智慧体（GLMs），是内地清华大学体系出身最像OpenAI的公司，刚推出的GLM-4一切向GPT-4看齐，许多评测基准达GPT-4 85%以上。GLMs是GLM-4的副产品，也是GLM-4模型能力的外溢。GLM-4的All Tools支援GLM-4依使用者需求决定是用绘图、搜寻、制表还是程式设计解决问题，本身就具AI Agent属性。与Open AI只追求通用性不同，智谱AI对金融、医疗和教育等都有系列客制服务，积累不少to B客户基础和业界know-how，让客户基于GLM-4部署GLMs智慧体更合理也更容易。

第三个也为内地清华大学背景的“面壁智慧”：有自己的“史丹佛小镇”，基于面壁智慧的ChatDev框架，但此小镇不是虚拟社会，而是AI版软件公司，不同AI智慧体设为工程师、产品经理、测试工程师和设计师等角色，可互相合作，还能站在自己立场互相博弈，就与人类上班会发生的事一样。面壁智慧ChatDev框架支援开发者搭建自己的AI Agent，结合单体和群体智慧，让AI Agent成为每个员工都能用的“逃避”很多狗屎工作的自动化工具。顺提ChatDev框架成形并不比史丹佛小镇论文发表晚，最大启示是原生AI应用开发可能性：AI Agent实现AI应用开发自动化。

第四、五为内地钉钉和飞书“智慧体”。AI Agent本质更接近产品而非技术，如果认为AI Agent是生产力工具，就不能忽略钉钉和飞书的上亿使用者，百万政企组织，大量文件、会议摘要、沟通记录、表格和自建工具，都让钉钉“智慧助理”和飞书“智能伙伴”更容易化身成每个使用者的助理，部分自动完成例行琐事，如工作总结、会议摘要、报帐和出差流程、关注回馈，甚至代理吵架。身为使用者，笔者得说钉钉智慧助理和飞书智能伙伴离好用还差得很远，恐怕是通义大模型和云雀大模型的锅，但场景丰富、数据真实、用户数量大，钉钉“智慧助理”和飞书“智能伙伴”更容易被用。Agent也是在使用过程有更佳理解能力，模型进步后，钉钉和飞书Agent化就会往前大步走。笔者再下暴论：钉钉和飞书会成为内地AI Agent的重要产品。

好用和好玩选一，笔者坚信对AI Agent好用比好玩重要，因首先是生产力工具，AI纸片男女友也有理解能力和情绪价值，但可叫成“智慧体”或“智慧玩偶”，却不是“智慧代理”，因不具代理人类完成某项任务或使命的功能。所以AI Agent翻成“智慧体”不适合，它就是“智慧代理”，“代理”属性是AI Agent的经济学和组织行为学，也是推动脑力劳动自动化的本质。

今年CES史丹佛大学知名AI学者李飞飞提出一个重要观点：应该确定AI Agent取代的是人类“任务”而不是“工作”。达沃斯论坛时，OpenAI CEO Sam Altman面对“AI让人失业”这老生常谈诘问时，只说：AI取代人们工作的方式，而不是工作本身。

笔者同意李飞飞和Sam Altman的观点，脑力劳动者的工作是由每个具体关键任务组成，但不是工作的全部，目标设定、创造性、资源取得和分配、设定更高目标、规划不同任务、判断力、说服力与表现力……我们工作有太多更有意义的元素，将流程、事务性和庶务性任务交给Agent，少写几行常规代码，少发几封吵架信，少做机器操作表格，少调几次PPT格式，少复制黏上，少亲自填写和审查出差和报帐流程，人类工作应该更愉快，也更有创意。

当然AI Agent普及，也许会让某些“白领工人”无所适从甚至失去工作，但也会提高很多职位，甚至基层聪明人的创造性、格局感、整体感和生产力，提高工作效率，创造更高生产力同时，更重要的是减少工时。

八小时工作制成为通用标准已是百年前的事了，人们之所以每天工作八小时，是工人抗争的结果，也是电力工业革命后生产力大爆发的产物。在更高生产效率面前，人们有底气争取更少工时、更高工资和更多学习、休闲、旅游消费时间。但计算机革命后，人类生产效率又前所未有地提高，为什么工时却没有减少，反而某些号称最高智力密集的科技和网络公司甚至更长？这里面一定出了问题。

笔者再来暴论：将来衡量AI Agent智慧化程度如何，可看是否让人类每天只需工作四小时，重复性、流程性、条件反射式性、经验主义可奏效、强化学习可理解，甚至表演性质工作，统统交给AI Agent：可能是钉钉和飞书，可能是面壁智慧的工作坊，也可能是GLM和GPT企业版，反正笔者只要结果，因真的只想每天工作四小时。

不久前和钉钉总裁叶军聊天，笔者问这玩意能让我们每天只上班四小时吗？他说：如果可能每天只需工作一小时。事后笔者觉得叶军夸张了，不过他还说AI Agent能让更多人当自己老板，笔者倒是同意这点。

（本文由品玩授权转载；首图来源：shutterstock）

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

相关文章