“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击
▼
“首个 AI 程式设计师”Devin 发表后,大有取代人类程式设计师的意味。
Devin展示AI自动处理各种程式的案例。Devin产生“康威生命游戏”最让笔者震惊。“生命游戏”是由英国数学家约翰何顿康威(John Horton Conway)1970年创造的抽象模拟程式。游戏本质是展示如何从极简单规则涌现复杂行为模式,是计算理论、复杂系统和人工智慧等经典研究模型。
▲ Devin 介面。
上图右是Devin产生的目录页面,展示图片,甚至还有提示说你必须启动JavaScript才能启动程式。可见Devin不只有程式设计能力,还有绝对符合大厂产品经理的设计美学。Cognition也宣称Devin能制作网页,平均5分钟就能做好。
不了解程式设计的人可能不清楚,能做出生命游戏的人工智慧究竟有多可怕。为了显示Devin多厉害,笔者找出Devin诞生前就很不错的开源AI软件Project Devika,做了类似生命游戏(下图上)。下图下作者是Devin,白色小格子尺寸越小,代表程式等级越高,下图上白色格纹解析度远低于下图下,表示Devin的生命游戏比Project Devika优秀。
▲ Project Devika生成的生命游戏。
▲ Devin生成的生命游戏。
事情还没完。Devin还未公开,但拿到内测机会的程式设计师,已提出各种刁钻任务考验它,但表现令人感到恐怖。有工程师要求Devin安装Github的chatbot-ui,就是“LINE”,不过好友名单是各式各样大语言模型,如ChatGPT、Llama 2。安装人工智慧版LINE后,工程师要求Devin用软件传讯给GPT4。
▲ chatbot-ui。
最后结果是Devin成功了。工程师除了提供Devin帐号,没有教Devin任何事,包括安装环境和软件使用方法等,是Devin接到指令后自己完成。
其实各种案例看来,Devin程式设计能力归功于检索能力。给Devin一段Github位址,它就能自动扒出程式码,然后透过程式码和提示词产生符合需求的程式。人类工程师其实不会知道所有程式码,只知道如何达成这些功能(每段程式码那么多字,谁能背得下来?)只要知道如何写,就能去专门程式码网站“搬运”程式码。
现在,Devin也做到了。
其实工程师理解程式码时,很大一定程度不是看程式码本身,而是看程式码旁边的注释,如注解写这段程式码是为了检索、那段程式码是为了循环。Devin只花更短时间直接跑一遍结果,当然比人类快太多。
跟人一样懒却更强,让人类工程师立刻感受到就业压力,于是第一批“反抗”AI的勇者出现了。Reddit最近出现不少对Devin口诛笔伐、口无遮拦怒骂“Fxxk you Devin”的程式设计师,甚至名字叫Devin的人也受波及,因在他们看来,Devin读懂程式码、写程式,这还可以理解,但Devin没有人教使用方法,就直接使用其他程式,这未免太厉害了,于是开始找Devin各种疑点。
网友minegen88“发现”一个问题:既然Devin懂写,还能自己架网页,为什么Cognition网页设计如此简陋?
(Source:Cognition)
他审视Cognition官网元素,发现需透过Clerk.com及Ashby等第三方服务处理后台任务,换句话说,有前后端开发能力的人,开发不了前后端功能,minegen88质疑为什么Cognition不让Devin做个好一点的网页,一方面能宣传Devin的能力,另一方面还能加强官网功能,何乐而不为?
其他网友也坐不住,纷纷寻找Cognition作假的蛛丝马迹。有人发现,Cognition右上角超连结的部落格,其实只是静态页面,根本不是完整部落格。静态页面是指服务器端固定不变的网页档案,网页建立时就确定,一旦存在服务器,就不会因不同使用者或不同时间要求而变化,每次造访服务器传回使用者的网页内容都相同,但部落格平台因更新内容,不可能是静态页面。
网友又进一步挖掘,发现这页面上传文件时,如果没有登入会出现错误提示,但没有提供有用错误ID、时间点或其他后设资料,且前端介面没有相应错误回馈,只是加载动画一直转转转。简单讲,如果不登入就不能发表内容,然而想登入也无法登入。
Reddit阿宅有个特点,一旦某件事有问题,就会肉搜当事人,Cognition创办人Scott Wu也逃不过。网友很快发现Scott Wu宣称在哈佛大学学习经济学,毕业后于财富管理软件公司Addepar担任软件工程师,之后与他人共同创立并领导人工智慧驱动社群平台Lunchclub,担任CTO五年。虽然Cognition官网表示,团队都是顶级工程师组成,但Reddi网友尤其minegen88认为,这种履历并不能称为顶级。
接下来更有意思,其他网友发现Scott Wu 14年前参加电视节目的影片,Scott Wu不到1秒就能读完并解答很难的数学题,有人说“我甚至还没看完题目,他答案就出来了”。如此经历加上这段影片,网友都认为Scott Wu作假机率很高。
▲ Scott Wu。(Source:Cognition)
这部分是美国国情导致,2000年后美国电视节目造假算常态,如影片电视节目,比赛开始前就以特定题型训练参赛者,正式比赛时当然都是出同类型题目,使特训过选手能很快答题。
有了蛛丝马迹,网友又回到Devin展示影片研究。所有Devin展示影片,聊天框内容都是提前打好的,有种可能是Cognition团队没有输入任何内容,是直接复制程式码放在萤幕右侧,再据右侧程式编出来左侧用户和Devin的对话。
疑问越来越多后,Reddit聚集一群认定Scott Wu就是作假的工程师。
▲ 各职业网友都在质疑Devin。
有人把质疑和各种“柯南”行为视为人类第一次反攻AI工程师,但结果看来有点荒谬,更像Reddit宅男的自嗨闹剧。且人类还在找蛛丝马迹的时候,内测过Devin的工程师下了一个指令,请Devin去Reddit发文问建站需求。
I asked the Devin AI agent to go on reddit and start a thread where it will take website building requests
It did that, solving numerous problems along the way. It apparently decided to charge for its work. Going to take it down before it fools anyone… https://t.co/QcsXu2PRs4 pic.twitter.com/zxigtajJs7
— Ethan Mollick (@emollick) March 19, 2024
Devin不仅做到,且解决了一系列需求后,自己决定开始收费,这工程师不得不在它骗倒所有人前把它弄下线。看来,人类得想想其他“对抗”AI的办法了。
(本文由 品玩 授权转载;首图来源:Pixabay)
延伸阅读:
- AI 化身软件工程师“Devin”,会写程式、Debug、完成复杂开发专案
▼
特别声明 本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。