“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击

“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击

“首个 AI 程式设计师”Devin 发表后,大有取代人类程式设计师的意味。

Devin展示AI自动处理各种程式的案例。Devin产生“康威生命游戏”最让笔者震惊。“生命游戏”是由英国数学家约翰何顿康威(John Horton Conway)1970年创造的抽象模拟程式。游戏本质是展示如何从极简单规则涌现复杂行为模式,是计算理论、复杂系统和人工智慧等经典研究模型。

“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击 AI与大数据 图2张

▲ Devin 介面。

上图右是Devin产生的目录页面,展示图片,甚至还有提示说你必须启动JavaScript才能启动程式。可见Devin不只有程式设计能力,还有绝对符合大厂产品经理的设计美学。Cognition也宣称Devin能制作网页,平均5分钟就能做好。

不了解程式设计的人可能不清楚,能做出生命游戏的人工智慧究竟有多可怕。为了显示Devin多厉害,笔者找出Devin诞生前就很不错的开源AI软件Project Devika,做了类似生命游戏(下图上)。下图下作者是Devin,白色小格子尺寸越小,代表程式等级越高,下图上白色格纹解析度远低于下图下,表示Devin的生命游戏比Project Devika优秀。

“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击 AI与大数据 图3张

▲ Project Devika生成的生命游戏。

“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击 AI与大数据 图4张

▲ Devin生成的生命游戏。

事情还没完。Devin还未公开,但拿到内测机会的程式设计师,已提出各种刁钻任务考验它,但表现令人感到恐怖。有工程师要求Devin安装Github的chatbot-ui,就是“LINE”,不过好友名单是各式各样大语言模型,如ChatGPT、Llama 2。安装人工智慧版LINE后,工程师要求Devin用软件传讯给GPT4。

“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击 AI与大数据 图5张

▲ chatbot-ui。

最后结果是Devin成功了。工程师除了提供Devin帐号,没有教Devin任何事,包括安装环境和软件使用方法等,是Devin接到指令后自己完成。

“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击 AI与大数据 图6张

其实各种案例看来,Devin程式设计能力归功于检索能力。给Devin一段Github位址,它就能自动扒出程式码,然后透过程式码和提示词产生符合需求的程式。人类工程师其实不会知道所有程式码,只知道如何达成这些功能(每段程式码那么多字,谁能背得下来?)只要知道如何写,就能去专门程式码网站“搬运”程式码。

现在,Devin也做到了。

其实工程师理解程式码时,很大一定程度不是看程式码本身,而是看程式码旁边的注释,如注解写这段程式码是为了检索、那段程式码是为了循环。Devin只花更短时间直接跑一遍结果,当然比人类快太多。

跟人一样懒却更强,让人类工程师立刻感受到就业压力,于是第一批“反抗”AI的勇者出现了。Reddit最近出现不少对Devin口诛笔伐、口无遮拦怒骂“Fxxk you Devin”的程式设计师,甚至名字叫Devin的人也受波及,因在他们看来,Devin读懂程式码、写程式,这还可以理解,但Devin没有人教使用方法,就直接使用其他程式,这未免太厉害了,于是开始找Devin各种疑点。

网友minegen88“发现”一个问题:既然Devin懂写,还能自己架网页,为什么Cognition网页设计如此简陋?

“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击 AI与大数据 图7张

(Source:Cognition)

他审视Cognition官网元素,发现需透过Clerk.com及Ashby等第三方服务处理后台任务,换句话说,有前后端开发能力的人,开发不了前后端功能,minegen88质疑为什么Cognition不让Devin做个好一点的网页,一方面能宣传Devin的能力,另一方面还能加强官网功能,何乐而不为?

其他网友也坐不住,纷纷寻找Cognition作假的蛛丝马迹。有人发现,Cognition右上角超连结的部落格,其实只是静态页面,根本不是完整部落格。静态页面是指服务器端固定不变的网页档案,网页建立时就确定,一旦存在服务器,就不会因不同使用者或不同时间要求而变化,每次造访服务器传回使用者的网页内容都相同,但部落格平台因更新内容,不可能是静态页面。

网友又进一步挖掘,发现这页面上传文件时,如果没有登入会出现错误提示,但没有提供有用错误ID、时间点或其他后设资料,且前端介面没有相应错误回馈,只是加载动画一直转转转。简单讲,如果不登入就不能发表内容,然而想登入也无法登入。

Reddit阿宅有个特点,一旦某件事有问题,就会肉搜当事人,Cognition创办人Scott Wu也逃不过。网友很快发现Scott Wu宣称在哈佛大学学习经济学,毕业后于财富管理软件公司Addepar担任软件工程师,之后与他人共同创立并领导人工智慧驱动社群平台Lunchclub,担任CTO五年。虽然Cognition官网表示,团队都是顶级工程师组成,但Reddi网友尤其minegen88认为,这种履历并不能称为顶级。

接下来更有意思,其他网友发现Scott Wu 14年前参加电视节目的影片,Scott Wu不到1秒就能读完并解答很难的数学题,有人说“我甚至还没看完题目,他答案就出来了”。如此经历加上这段影片,网友都认为Scott Wu作假机率很高。

“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击 AI与大数据 图8张

▲ Scott Wu。(Source:Cognition)

这部分是美国国情导致,2000年后美国电视节目造假算常态,如影片电视节目,比赛开始前就以特定题型训练参赛者,正式比赛时当然都是出同类型题目,使特训过选手能很快答题。

有了蛛丝马迹,网友又回到Devin展示影片研究。所有Devin展示影片,聊天框内容都是提前打好的,有种可能是Cognition团队没有输入任何内容,是直接复制程式码放在萤幕右侧,再据右侧程式编出来左侧用户和Devin的对话。

疑问越来越多后,Reddit聚集一群认定Scott Wu就是作假的工程师。

“AI 程式设计师”Devin 大杀四方后,人类程式设计师开始反击 AI与大数据 图9张

▲ 各职业网友都在质疑Devin。

有人把质疑和各种“柯南”行为视为人类第一次反攻AI工程师,但结果看来有点荒谬,更像Reddit宅男的自嗨闹剧。且人类还在找蛛丝马迹的时候,内测过Devin的工程师下了一个指令,请Devin去Reddit发文问建站需求。

Devin不仅做到,且解决了一系列需求后,自己决定开始收费,这工程师不得不在它骗倒所有人前把它弄下线。看来,人类得想想其他“对抗”AI的办法了。

(本文由 品玩 授权转载;首图来源:Pixabay)

延伸阅读:

  • AI 化身软件工程师“Devin”,会写程式、Debug、完成复杂开发专案

   特别声明    本页内容仅供参考,版权终归原著者所有,若有侵权,请联系我们删除。